cs.CV」カテゴリーアーカイブ

The Fourth Monocular Depth Estimation Challenge

要約 このホワイトペーパーでは、第4版のMonocular Depth推定チャレ … 続きを読む

カテゴリー: cs.CV | The Fourth Monocular Depth Estimation Challenge はコメントを受け付けていません

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

要約 言語生成において長く支配的な自己回帰(AR)モデルは、画像合成にますます適 … 続きを読む

カテゴリー: cs.CV | Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models はコメントを受け付けていません

Dynamic Camera Poses and Where to Find Them

要約 カメラの注釈をアノテートすると、ダイナミックなインターネット動画でのポーズ … 続きを読む

カテゴリー: cs.CV | Dynamic Camera Poses and Where to Find Them はコメントを受け付けていません

LiDPM: Rethinking Point Diffusion for Lidar Scene Completion

要約 屋外シーンのスケールでライダーポイントで直接動作するトレーニング拡散モデル … 続きを読む

カテゴリー: cs.CV, cs.RO | LiDPM: Rethinking Point Diffusion for Lidar Scene Completion はコメントを受け付けていません

V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations

要約 大規模なビジョン言語モデル(LVLMS)は、さまざまなビジョン言語タスクに … 続きを読む

カテゴリー: cs.AI, cs.CV | V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations はコメントを受け付けていません

Semantic Segmentation and Scene Reconstruction of RGB-D Image Frames: An End-to-End Modular Pipeline for Robotic Applications

要約 構造化されていない環境で動作するロボットには、周囲の包括的な理解が必要であ … 続きを読む

カテゴリー: cs.CV, cs.RO | Semantic Segmentation and Scene Reconstruction of RGB-D Image Frames: An End-to-End Modular Pipeline for Robotic Applications はコメントを受け付けていません

SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems

要約 GPSに依存しないナビゲーション用の視覚的スラム、動的安定性のための高度な … 続きを読む

カテゴリー: 68T40, 68U10, 70Q05, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems はコメントを受け付けていません

GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024

要約 GFREEDETは、モデルのない設定でガウスのスプラッティングとビジョンフ … 続きを読む

カテゴリー: cs.CV, cs.RO | GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024 はコメントを受け付けていません

MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants

要約 混合モーダル生成の最近の進歩により、生物医学画像を分析し、それらに関する複 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants はコメントを受け付けていません

Dual-Camera All-in-Focus Neural Radiance Fields

要約 手動の再焦点を合わせることなく、入力からオールインフォーカスニューラル放射 … 続きを読む

カテゴリー: cs.CV | Dual-Camera All-in-Focus Neural Radiance Fields はコメントを受け付けていません