「cs.CV」カテゴリーアーカイブ

Toward Unified Practices in Trajectory Prediction Research on Bird’s-Eye-View Datasets

投稿日: 2025年5月28日作成者: jarxiv

要約高品質のデータセットの可用性は、自律車両の動作予測アルゴリズムの開発に不可 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation

投稿日: 2025年5月28日作成者: jarxiv

要約 Vision-and-Language Navigation（VLN）では … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Object-Centric Action-Enhanced Representations for Robot Visuo-Motor Policy Learning

投稿日: 2025年5月28日作成者: jarxiv

要約ロボットvisuo-motorポリシー生成に利益をもたらすためにアクション … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RefAV: Towards Planning-Centric Scenario Mining

投稿日: 2025年5月28日作成者: jarxiv

要約自動運転車（AVS）は、通常の艦隊テスト中にHDマップにローカライズされた … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Efficient Robotic Policy Learning via Latent Space Backward Planning

投稿日: 2025年5月28日作成者: jarxiv

要約現在のロボット計画方法は、多くの場合、完全なピクセルの詳細でマルチフレーム … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Visuospatial Cognitive Assistant

投稿日: 2025年5月28日作成者: jarxiv

要約ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts

投稿日: 2025年5月28日作成者: jarxiv

要約マルチモーダルの大手言語モデル（MLLM）は一般的なビジョン言語タスクに優 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

投稿日: 2025年5月28日作成者: jarxiv

要約安全で実行可能な軌道計画は、現実世界の自律運転システムに不可欠です。ただ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Spectral Compression Transformer with Line Pose Graph for Monocular 3D Human Pose Estimation

投稿日: 2025年5月28日作成者: jarxiv

要約変圧器ベースの3Dヒトポーズ推定方法は、シーケンス長に関する二次複雑さのた … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

投稿日: 2025年5月28日作成者: jarxiv

要約検出、予測、または分類タスクのコンピュータービジョン（CV）モデルは、リア … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Toward Unified Practices in Trajectory Prediction Research on Bird’s-Eye-View Datasets

Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation

Object-Centric Action-Enhanced Representations for Robot Visuo-Motor Policy Learning

RefAV: Towards Planning-Centric Scenario Mining

Efficient Robotic Policy Learning via Latent Space Backward Planning

Visuospatial Cognitive Assistant

Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts

Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

Spectral Compression Transformer with Line Pose Graph for Monocular 3D Human Pose Estimation

SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios

最近の投稿

最近のコメント

アーカイブ

カテゴリー