I.2.10」カテゴリーアーカイブ

OWMM-Agent: Open World Mobile Manipulation With Multi-modal Agentic Data Synthesis

要約 ナビゲーション、操作、およびビジョンモデルの急速な進歩により、多くの特殊な … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.10 | コメントする

ReasonPlan: Unified Scene Prediction and Decision Reasoning for Closed-loop Autonomous Driving

要約 強力なビジョン言語の推論と一般化能力により、マルチモーダルの大手言語モデル … 続きを読む

カテゴリー: 68T40(Primary), 68T45, 68T50(Secondary), cs.AI, cs.CV, cs.RO, I.2.10 | コメントする

NFIG: Autoregressive Image Generation with Next-Frequency Prediction

要約 自己回帰モデルは、自然言語処理において有望な結果を達成しています。 ただし … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, I.2.10 | コメントする

Distance Estimation in Outdoor Driving Environments Using Phase-only Correlation Method with Event Cameras

要約 自律運転の採用が拡大するにつれて、センサー技術の進歩は、安全性と信頼できる … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV, I.2.10 | コメントする

Is Single-View Mesh Reconstruction Ready for Robotics?

要約 このペーパーでは、ロボット操作でデジタルツイン環境を作成するためのシングル … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | コメントする

PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting

要約 近年、AIを使用して合成3Dオブジェクトを生成する能力が大幅に改善されてい … 続きを読む

カテゴリー: cs.CV, cs.GR, I.2.10 | PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting はコメントを受け付けていません

Instance Segmentation for Point Sets

要約 PointNet [QSMG16]やPointNet ++ [Qysg17 … 続きを読む

カテゴリー: 68T45, cs.CV, cs.LG, I.2.10 | Instance Segmentation for Point Sets はコメントを受け付けていません

3D Reconstruction from Sketches

要約 複数のスケッチから3Dシーンを再構築する問題を検討します。 (1)通信ポイ … 続きを読む

カテゴリー: 68T45, cs.CV, cs.LG, I.2.10 | 3D Reconstruction from Sketches はコメントを受け付けていません

eStonefish-scenes: A synthetically generated dataset for underwater event-based optical flow prediction tasks

要約 イベントベースのビジョンとスパイクニューラルネットワーク(SNNS)の使用 … 続きを読む

カテゴリー: cs.CV, I.2.10 | eStonefish-scenes: A synthetically generated dataset for underwater event-based optical flow prediction tasks はコメントを受け付けていません

Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features

要約 エンドツーエンドの学習は、感覚入力をアクションに直接マッピングし、複雑なロ … 続きを読む

カテゴリー: 68T05, 68T40, 68T50, cs.AI, cs.RO, I.2.10 | Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features はコメントを受け付けていません