cs.CV」カテゴリーアーカイブ

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む

カテゴリー: cs.AI, cs.CV | ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet はコメントを受け付けていません

[MASK] is All You Need

要約 生成モデルでは、次のセット予測ベースのマスク生成モデルと次のノイズ予測ベー … 続きを読む

カテゴリー: cs.AI, cs.CV | [MASK] is All You Need はコメントを受け付けていません

Robust Bayesian Scene Reconstruction by Leveraging Retrieval-Augmented Priors

要約 オブジェクト ジオメトリの 3D 表現の構築は、多くの下流のロボット工学タ … 続きを読む

カテゴリー: cs.CV, cs.RO | Robust Bayesian Scene Reconstruction by Leveraging Retrieval-Augmented Priors はコメントを受け付けていません

Benchmarking Vision, Language, & Action Models on Robotic Learning Tasks

要約 視覚言語動作 (VLA) モデルは、汎用ロボット システム開発の有望な方向 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Benchmarking Vision, Language, & Action Models on Robotic Learning Tasks はコメントを受け付けていません

GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion

要約 メトリック単眼深度推定の一般化は、その不適切な姿勢の性質により大きな課題を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion はコメントを受け付けていません

Self-supervised cost of transport estimation for multimodal path planning

要約 実際の環境で動作する自律ロボットは、周囲をどのように移動するのが最善である … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Self-supervised cost of transport estimation for multimodal path planning はコメントを受け付けていません

One-Shot Real-to-Sim via End-to-End Differentiable Simulation and Rendering

要約 まばらなオンライン観察から新しい環境におけるロボットの予測世界モデルを特定 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.RO | One-Shot Real-to-Sim via End-to-End Differentiable Simulation and Rendering はコメントを受け付けていません

AgentAlign: Misalignment-Adapted Multi-Agent Perception for Resilient Inter-Agent Sensor Correlations

要約 協調知覚は、コネクテッド自動運転車 (CAV) やスマート インフラストラ … 続きを読む

カテゴリー: cs.CV, cs.RO | AgentAlign: Misalignment-Adapted Multi-Agent Perception for Resilient Inter-Agent Sensor Correlations はコメントを受け付けていません

Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks

要約 実用的なナビゲーション エージェントは、指示に従う、オブジェクトを検索する … 続きを読む

カテゴリー: cs.CV, cs.RO | Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks はコメントを受け付けていません

Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information

要約 複雑で未知の環境における効率的な自律ナビゲーションと障害物回避のための U … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information はコメントを受け付けていません