cs.CV」カテゴリーアーカイブ

Toward Unified Practices in Trajectory Prediction Research on Bird’s-Eye-View Datasets

要約 高品質のデータセットの可用性は、自律車両の動作予測アルゴリズムの開発に不可 … 続きを読む

カテゴリー: cs.CV, cs.RO | Toward Unified Practices in Trajectory Prediction Research on Bird’s-Eye-View Datasets はコメントを受け付けていません

Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation

要約 Vision-and-Language Navigation(VLN)では … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation はコメントを受け付けていません

Object-Centric Action-Enhanced Representations for Robot Visuo-Motor Policy Learning

要約 ロボットvisuo-motorポリシー生成に利益をもたらすためにアクション … 続きを読む

カテゴリー: cs.CV, cs.RO | Object-Centric Action-Enhanced Representations for Robot Visuo-Motor Policy Learning はコメントを受け付けていません

RefAV: Towards Planning-Centric Scenario Mining

要約 自動運転車(AVS)は、通常の艦隊テスト中にHDマップにローカライズされた … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | RefAV: Towards Planning-Centric Scenario Mining はコメントを受け付けていません

Efficient Robotic Policy Learning via Latent Space Backward Planning

要約 現在のロボット計画方法は、多くの場合、完全なピクセルの詳細でマルチフレーム … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Efficient Robotic Policy Learning via Latent Space Backward Planning はコメントを受け付けていません

Visuospatial Cognitive Assistant

要約 ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Visuospatial Cognitive Assistant はコメントを受け付けていません

Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts

要約 マルチモーダルの大手言語モデル(MLLM)は一般的なビジョン言語タスクに優 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts はコメントを受け付けていません

Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

要約 安全で実行可能な軌道計画は、現実世界の自律運転システムに不可欠です。 ただ … 続きを読む

カテゴリー: cs.CV, cs.RO | Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling はコメントを受け付けていません

Spectral Compression Transformer with Line Pose Graph for Monocular 3D Human Pose Estimation

要約 変圧器ベースの3Dヒトポーズ推定方法は、シーケンス長に関する二次複雑さのた … 続きを読む

カテゴリー: cs.CV | Spectral Compression Transformer with Line Pose Graph for Monocular 3D Human Pose Estimation はコメントを受け付けていません

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

要約 検出、予測、または分類タスクのコンピュータービジョン(CV)モデルは、リア … 続きを読む

カテゴリー: cs.CV | SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios はコメントを受け付けていません