cs.CV」カテゴリーアーカイブ

Reliable-loc: Robust sequential LiDAR global localization in large-scale street scenes based on verifiable cues

要約 ウェアラブルレーザースキャン(WLS)システムには、柔軟性と移植性の利点が … 続きを読む

カテゴリー: cs.CV, cs.RO | Reliable-loc: Robust sequential LiDAR global localization in large-scale street scenes based on verifiable cues はコメントを受け付けていません

Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection

要約 3Dセマンティック占有率予測は、オンボードサラウンドビューカメラを使用した … 続きを読む

カテゴリー: cs.CV, cs.RO | Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection はコメントを受け付けていません

Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions

要約 接地3Dオブジェクトアフォーダンスは、操作できる3Dスペースにオブジェクト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions はコメントを受け付けていません

Continuous Locomotive Crowd Behavior Generation

要約 群衆の行動のモデリングと再現は、心理学、ロボット工学、輸送工学、仮想環境な … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Continuous Locomotive Crowd Behavior Generation はコメントを受け付けていません

Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM

要約 同時ローカリゼーションとマッピング(SLAM)テクノロジーには、3Dガウス … 続きを読む

カテゴリー: cs.CV, cs.RO | Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM はコメントを受け付けていません

Open-Vocabulary Action Localization with Iterative Visual Prompting

要約 ビデオアクションローカリゼーションは、長いビデオから特定のアクションのタイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Open-Vocabulary Action Localization with Iterative Visual Prompting はコメントを受け付けていません

A Taxonomy of Self-Handover

要約 自分の手の間にオブジェクトを転送する自己携帯は、一般的ではあるが理解されて … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A Taxonomy of Self-Handover はコメントを受け付けていません

CloSE: A Compact Shape- and Orientation-Agnostic Cloth State Representation

要約 布の操作は、主に布の非剛性の性質のために困難な問題であり、これが変形の良い … 続きを読む

カテゴリー: cs.CV, cs.RO | CloSE: A Compact Shape- and Orientation-Agnostic Cloth State Representation はコメントを受け付けていません

Towards Visual Text Grounding of Multimodal Large Language Model

要約 マルチモーダル大手言語モデル(MLLMS)の既存の進化にもかかわらず、特に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Towards Visual Text Grounding of Multimodal Large Language Model はコメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

要約 熱赤外ビデオで複数の無人航空機(UAV)を検出および追跡することは、コント … 続きを読む

カテゴリー: cs.AI, cs.CV | Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID はコメントを受け付けていません