cs.CV」カテゴリーアーカイブ

Towards Autonomous Micromobility through Scalable Urban Simulation

要約 配送ロボットやモビリティスクーターなどの都市の公共スペースに移動する軽量の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Towards Autonomous Micromobility through Scalable Urban Simulation はコメントを受け付けていません

Robotic Visual Instruction

要約 最近、自然言語は、人間とロボットの相互作用の主要な媒体でした。 ただし、ロ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Robotic Visual Instruction はコメントを受け付けていません

RayZer: A Self-supervised Large View Synthesis Model

要約 3Dの監督なしで訓練された自己監視マルチビュー3Dビジョンモデル、つまりカ … 続きを読む

カテゴリー: cs.CV | RayZer: A Self-supervised Large View Synthesis Model はコメントを受け付けていません

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

要約 大規模な言語モデルの最近の進歩により、チェーンオブシュー(COT)と補強学 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT はコメントを受け付けていません

Controllable Weather Synthesis and Removal with Video Diffusion Models

要約 ビデオで現実的で制御可能な気象効果を生成することは、多くのアプリケーション … 続きを読む

カテゴリー: cs.CV, cs.GR | Controllable Weather Synthesis and Removal with Video Diffusion Models はコメントを受け付けていません

VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions

要約 フォント設計は、デジタルコンテンツデザインと最新の印刷業界で非常に重要です … 続きを読む

カテゴリー: cs.CV | VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions はコメントを受け付けていません

CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching

要約 最近、学習ベースのステレオマッチング方法により、パブリックベンチマークが大 … 続きを読む

カテゴリー: cs.CV, cs.RO | CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching はコメントを受け付けていません

UAV-VLN: End-to-End Vision Language guided Navigation for UAVs

要約 AIガイド付きの自律性の中心的な課題は、エージェントが自然言語コマンドに基 … 続きを読む

カテゴリー: cs.CV, cs.RO | UAV-VLN: End-to-End Vision Language guided Navigation for UAVs はコメントを受け付けていません

OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion

要約 Lidar Placeの認識は、大規模な屋外環境における自律的なナビゲーシ … 続きを読む

カテゴリー: cs.CV, cs.RO | OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion はコメントを受け付けていません

RoboGround: Robotic Manipulation with Grounded Vision-Language Priors

要約 ロボット操作の最近の進歩は、政策一般化を改善するための中間表現の可能性を強 … 続きを読む

カテゴリー: cs.CV, cs.RO | RoboGround: Robotic Manipulation with Grounded Vision-Language Priors はコメントを受け付けていません