「cs.CV」カテゴリーアーカイブ

The Fourth Monocular Depth Estimation Challenge

投稿日: 2025年4月25日作成者: jarxiv

要約このホワイトペーパーでは、第4版のMonocular Depth推定チャレ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

投稿日: 2025年4月25日作成者: jarxiv

要約言語生成において長く支配的な自己回帰（AR）モデルは、画像合成にますます適 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dynamic Camera Poses and Where to Find Them

投稿日: 2025年4月25日作成者: jarxiv

要約カメラの注釈をアノテートすると、ダイナミックなインターネット動画でのポーズ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LiDPM: Rethinking Point Diffusion for Lidar Scene Completion

投稿日: 2025年4月25日作成者: jarxiv

要約屋外シーンのスケールでライダーポイントで直接動作するトレーニング拡散モデル … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations

投稿日: 2025年4月25日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）は、さまざまなビジョン言語タスクに … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Semantic Segmentation and Scene Reconstruction of RGB-D Image Frames: An End-to-End Modular Pipeline for Robotic Applications

投稿日: 2025年4月24日作成者: jarxiv

要約構造化されていない環境で動作するロボットには、周囲の包括的な理解が必要であ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems

投稿日: 2025年4月24日作成者: jarxiv

要約 GPSに依存しないナビゲーション用の視覚的スラム、動的安定性のための高度な … 続きを読む →

カテゴリー: 68T40, 68U10, 70Q05, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | コメントを受け付けていません

GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024

投稿日: 2025年4月24日作成者: jarxiv

要約 GFREEDETは、モデルのない設定でガウスのスプラッティングとビジョンフ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants

投稿日: 2025年4月24日作成者: jarxiv

要約混合モーダル生成の最近の進歩により、生物医学画像を分析し、それらに関する複 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Dual-Camera All-in-Focus Neural Radiance Fields

投稿日: 2025年4月24日作成者: jarxiv

要約手動の再焦点を合わせることなく、入力からオールインフォーカスニューラル放射 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

The Fourth Monocular Depth Estimation Challenge

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

Dynamic Camera Poses and Where to Find Them

LiDPM: Rethinking Point Diffusion for Lidar Scene Completion

V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations

Semantic Segmentation and Scene Reconstruction of RGB-D Image Frames: An End-to-End Modular Pipeline for Robotic Applications

SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems

GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024

MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants

Dual-Camera All-in-Focus Neural Radiance Fields

最近の投稿

最近のコメント

アーカイブ

カテゴリー