cs.CV」カテゴリーアーカイブ

Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments

要約 ゼロショット設定の下で、連続環境(VLN-CE)におけるビジョン言語ナビゲ … 続きを読む

カテゴリー: cs.CV, cs.RO | Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments はコメントを受け付けていません

PACER: Preference-conditioned All-terrain Costmap Generation

要約 自律的なロボットナビゲーションでは、地形が事前に訓練されたセマンティック分 … 続きを読む

カテゴリー: cs.CV, cs.RO | PACER: Preference-conditioned All-terrain Costmap Generation はコメントを受け付けていません

E-3DGS: Gaussian Splatting with Exposure and Motion Events

要約 最適な条件下でキャプチャされた画像からの3D再構成を達成することは、ビジョ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | E-3DGS: Gaussian Splatting with Exposure and Motion Events はコメントを受け付けていません

Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments

要約 ゼロショット設定の下で、連続環境(VLN-CE)におけるビジョン言語ナビゲ … 続きを読む

カテゴリー: cs.CV, cs.RO | Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments はコメントを受け付けていません

PNE-SGAN: Probabilistic NDT-Enhanced Semantic Graph Attention Network for LiDAR Loop Closure Detection

要約 LIDARループ閉鎖検出(LCD)は、一貫した同時ローカリゼーションとマッ … 続きを読む

カテゴリー: cs.CV, cs.RO | PNE-SGAN: Probabilistic NDT-Enhanced Semantic Graph Attention Network for LiDAR Loop Closure Detection はコメントを受け付けていません

DSM: Building A Diverse Semantic Map for 3D Visual Grounding

要約 近年、ロボット工学におけるマルチモーダル大手言語モデル(VLMS)の研究と … 続きを読む

カテゴリー: cs.CV, cs.RO | DSM: Building A Diverse Semantic Map for 3D Visual Grounding はコメントを受け付けていません

SN-LiDAR: Semantic Neural Fields for Novel Space-time View LiDAR Synthesis

要約 最近の研究では、リダーポイントクラウドの新しいビュー合成(NVS)の調査を … 続きを読む

カテゴリー: cs.CV, cs.RO | SN-LiDAR: Semantic Neural Fields for Novel Space-time View LiDAR Synthesis はコメントを受け付けていません

The Composite Visual-Laser Navigation Method Applied in Indoor Poultry Farming Environments

要約 屋内の家禽農場では、環境制御を正確に維持するために検査ロボットが必要です。 … 続きを読む

カテゴリー: cs.CV, cs.RO | The Composite Visual-Laser Navigation Method Applied in Indoor Poultry Farming Environments はコメントを受け付けていません

EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents

要約 マルチモーダル大手言語モデル(MLLM)は大きな進歩を示しており、具体化さ … 続きを読む

カテゴリー: cs.CL, cs.CV | EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents はコメントを受け付けていません

VLMT: Vision-Language Multimodal Transformer for Multimodal Multi-hop Question Answering

要約 テキスト、テーブル、画像間のマルチモーダルデータの可用性の向上は、複雑なク … 続きを読む

カテゴリー: cs.CL, cs.CV | VLMT: Vision-Language Multimodal Transformer for Multimodal Multi-hop Question Answering はコメントを受け付けていません