「cs.CV」カテゴリーアーカイブ

Reliable-loc: Robust sequential LiDAR global localization in large-scale street scenes based on verifiable cues

投稿日: 2025年4月8日作成者: jarxiv

要約ウェアラブルレーザースキャン（WLS）システムには、柔軟性と移植性の利点が … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection

投稿日: 2025年4月8日作成者: jarxiv

要約 3Dセマンティック占有率予測は、オンボードサラウンドビューカメラを使用した … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions

投稿日: 2025年4月8日作成者: jarxiv

要約接地3Dオブジェクトアフォーダンスは、操作できる3Dスペースにオブジェクト … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Continuous Locomotive Crowd Behavior Generation

投稿日: 2025年4月8日作成者: jarxiv

要約群衆の行動のモデリングと再現は、心理学、ロボット工学、輸送工学、仮想環境な … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM

投稿日: 2025年4月8日作成者: jarxiv

要約同時ローカリゼーションとマッピング（SLAM）テクノロジーには、3Dガウス … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Open-Vocabulary Action Localization with Iterative Visual Prompting

投稿日: 2025年4月8日作成者: jarxiv

要約ビデオアクションローカリゼーションは、長いビデオから特定のアクションのタイ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

A Taxonomy of Self-Handover

投稿日: 2025年4月8日作成者: jarxiv

要約自分の手の間にオブジェクトを転送する自己携帯は、一般的ではあるが理解されて … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

CloSE: A Compact Shape- and Orientation-Agnostic Cloth State Representation

投稿日: 2025年4月8日作成者: jarxiv

要約布の操作は、主に布の非剛性の性質のために困難な問題であり、これが変形の良い … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Towards Visual Text Grounding of Multimodal Large Language Model

投稿日: 2025年4月8日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）の既存の進化にもかかわらず、特に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

投稿日: 2025年4月8日作成者: jarxiv

要約熱赤外ビデオで複数の無人航空機（UAV）を検出および追跡することは、コント … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Reliable-loc: Robust sequential LiDAR global localization in large-scale street scenes based on verifiable cues

Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection

Grounding 3D Object Affordance with Language Instructions, Visual Observations and Interactions

Continuous Locomotive Crowd Behavior Generation

Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM

Open-Vocabulary Action Localization with Iterative Visual Prompting

A Taxonomy of Self-Handover

CloSE: A Compact Shape- and Orientation-Agnostic Cloth State Representation

Towards Visual Text Grounding of Multimodal Large Language Model

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

最近の投稿

最近のコメント

アーカイブ

カテゴリー