cs.CV」カテゴリーアーカイブ

DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving

要約 最近、拡散モデルは、マルチモードアクション分布をモデル化できるロボットポリ … 続きを読む

カテゴリー: cs.CV, cs.RO | DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving はコメントを受け付けていません

Humanoid Policy ~ Human Policy

要約 さまざまなデータを使用したヒューマノイドロボットのトレーニング操作ポリシー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Humanoid Policy ~ Human Policy はコメントを受け付けていません

CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving

要約 軌道計画は、自律的な運転に不可欠であり、複雑な環境での安全で効率的なナビゲ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving はコメントを受け付けていません

ETAP: Event-based Tracking of Any Point

要約 任意のポイント(TAP)を追跡すると、最近、モーション推定パラダイムが個々 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | ETAP: Event-based Tracking of Any Point はコメントを受け付けていません

Kalib: Easy Hand-Eye Calibration with Reference Point Tracking

要約 ハンドアイキャリブレーションは、カメラとロボット間の変換を推定することを目 … 続きを読む

カテゴリー: cs.CV, cs.RO | Kalib: Easy Hand-Eye Calibration with Reference Point Tracking はコメントを受け付けていません

Robust Tube-based Control Strategy for Vision-guided Autonomous Vehicles

要約 自律車両の堅牢な制御戦略は、システムの安定性を改善し、ライディングの快適さ … 続きを読む

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | Robust Tube-based Control Strategy for Vision-guided Autonomous Vehicles はコメントを受け付けていません

DUNE: Distilling a Universal Encoder from Heterogeneous 2D and 3D Teachers

要約 最近のマルチティーチャー蒸留方法により、複数の基礎モデルのエンコーダーが単 … 続きを読む

カテゴリー: cs.CV, cs.LG | DUNE: Distilling a Universal Encoder from Heterogeneous 2D and 3D Teachers はコメントを受け付けていません

Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩により、ビデオ理解のた … 続きを読む

カテゴリー: cs.CV, cs.LG | Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding はコメントを受け付けていません

Global-Local Tree Search for Language Guided 3D Scene Generation

要約 GPT-4などの大きなビジョン言語モデル(VLM)は、さまざまな分野で顕著 … 続きを読む

カテゴリー: cs.CL, cs.CV | Global-Local Tree Search for Language Guided 3D Scene Generation はコメントを受け付けていません

LLM Post-Training: A Deep Dive into Reasoning Large Language Models

要約 大規模な言語モデル(LLM)は、自然言語処理環境を変え、多様なアプリケーシ … 続きを読む

カテゴリー: cs.CL, cs.CV | LLM Post-Training: A Deep Dive into Reasoning Large Language Models はコメントを受け付けていません