「cs.CV」カテゴリーアーカイブ

Towards Autonomous Micromobility through Scalable Urban Simulation

投稿日: 2025年5月2日作成者: jarxiv

要約配送ロボットやモビリティスクーターなどの都市の公共スペースに移動する軽量の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Robotic Visual Instruction

投稿日: 2025年5月2日作成者: jarxiv

要約最近、自然言語は、人間とロボットの相互作用の主要な媒体でした。ただし、ロ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

RayZer: A Self-supervised Large View Synthesis Model

投稿日: 2025年5月2日作成者: jarxiv

要約 3Dの監督なしで訓練された自己監視マルチビュー3Dビジョンモデル、つまりカ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

投稿日: 2025年5月2日作成者: jarxiv

要約大規模な言語モデルの最近の進歩により、チェーンオブシュー（COT）と補強学 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Controllable Weather Synthesis and Removal with Video Diffusion Models

投稿日: 2025年5月2日作成者: jarxiv

要約ビデオで現実的で制御可能な気象効果を生成することは、多くのアプリケーション … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions

投稿日: 2025年5月2日作成者: jarxiv

要約フォント設計は、デジタルコンテンツデザインと最新の印刷業界で非常に重要です … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching

投稿日: 2025年5月1日作成者: jarxiv

要約最近、学習ベースのステレオマッチング方法により、パブリックベンチマークが大 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

UAV-VLN: End-to-End Vision Language guided Navigation for UAVs

投稿日: 2025年5月1日作成者: jarxiv

要約 AIガイド付きの自律性の中心的な課題は、エージェントが自然言語コマンドに基 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion

投稿日: 2025年5月1日作成者: jarxiv

要約 Lidar Placeの認識は、大規模な屋外環境における自律的なナビゲーシ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RoboGround: Robotic Manipulation with Grounded Vision-Language Priors

投稿日: 2025年5月1日作成者: jarxiv

要約ロボット操作の最近の進歩は、政策一般化を改善するための中間表現の可能性を強 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Towards Autonomous Micromobility through Scalable Urban Simulation

Robotic Visual Instruction

RayZer: A Self-supervised Large View Synthesis Model

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Controllable Weather Synthesis and Removal with Video Diffusion Models

VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions

CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching

UAV-VLN: End-to-End Vision Language guided Navigation for UAVs

OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion

RoboGround: Robotic Manipulation with Grounded Vision-Language Priors

最近の投稿

最近のコメント

アーカイブ

カテゴリー