cs.CV」カテゴリーアーカイブ

Towards Semantic 3D Hand-Object Interaction Generation via Functional Text Guidance

要約 ハンドオブジェクト相互作用(HOI)は、人間と環境の基本的なリンクですが、 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks

要約 高品質のベンチマークは、具体化されたAI研究の基盤であり、長老航海、操作、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

S-Graphs 2.0 — A Hierarchical-Semantic Optimization and Loop Closure for SLAM

要約 3Dシーングラフの階層構造は、人工環境からの一般的なパターンに適合するため … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SE | コメントする

ChartMimic: Evaluating LMM’s Cross-Modal Reasoning Capability via Chart-to-Code Generation

要約 大規模なマルチモーダルモデル(LMM)の視覚的に接地されたコード生成機能を … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SE | コメントする

Fast 3D point clouds retrieval for Large-scale 3D Place Recognition

要約 3Dポイントクラウドでの検索は、3Dポイントの参照内で最も類似したポイント … 続きを読む

カテゴリー: 68T10, 68T45, cs.CV, cs.IR, I.2.10 | コメントする

Spatial Reasoning with Denoising Models

要約 生成モデルの除去を介して一連の連続変数を介して推論を実行するフレームワーク … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Enhancing deep neural networks through complex-valued representations and Kuramoto synchronization dynamics

要約 神経同期は、脳が視覚シーンを構造化された表現に整理する方法に重要な役割を果 … 続きを読む

カテゴリー: cs.AI, cs.CV, nlin.AO, q-bio.NC | コメントする

Training-free and Adaptive Sparse Attention for Efficient Long Video Generation

要約 拡散変圧器(DIT)を使用して高忠実度の長いビデオを生成することは、主に注 … 続きを読む

カテゴリー: cs.CV | コメントする

BST: Badminton Stroke-type Transformer for Skeleton-based Action Recognition in Racket Sports

要約 すべてのスポーツの中で最も速いボールスピードを持っていることで知られるバド … 続きを読む

カテゴリー: cs.CV | コメントする

Representation Learning of Point Cloud Upsampling in Global and Local Inputs

要約 近年、Point Cloud Upsamplingは、3D再構成などのフィ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする