cs.CV」カテゴリーアーカイブ

SITReg: Multi-resolution architecture for symmetric, inverse consistent, and topology preserving image registration

要約 ディープ ラーニングは、2 つの画像の座標系間のマッピングを見つけることが … 続きを読む

カテゴリー: cs.CV | SITReg: Multi-resolution architecture for symmetric, inverse consistent, and topology preserving image registration はコメントを受け付けていません

Demystify Mamba in Vision: A Linear Attention Perspective

要約 Mamba は、線形計算の複雑さを備えた効果的な状態空間モデルです。 最近 … 続きを読む

カテゴリー: cs.CV | Demystify Mamba in Vision: A Linear Attention Perspective はコメントを受け付けていません

PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models

要約 マルチモーダル大規模言語モデル (MLLM) は、ビジュアル タスク全体で … 続きを読む

カテゴリー: cs.AI, cs.CV | PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models はコメントを受け付けていません

FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models

要約 視覚言語モデル (VLM) は、さまざまな応用において目覚ましい進歩を遂げ … 続きを読む

カテゴリー: cs.CV | FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models はコメントを受け付けていません

ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models

要約 幻覚は、マルチモーダル大規模言語モデル (MLLM) に永続的な課題をもた … 続きを読む

カテゴリー: cs.CL, cs.CV | ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models はコメントを受け付けていません

Scaling nnU-Net for CBCT Segmentation

要約 この論文では、特に ToothFairy2 チャレンジの範囲において、コー … 続きを読む

カテゴリー: cs.CV | Scaling nnU-Net for CBCT Segmentation はコメントを受け付けていません

MVBoost: Boost 3D Reconstruction with Multi-View Refinement

要約 3D オブジェクトの再構築における最近の進歩は目覚ましいものですが、現在の … 続きを読む

カテゴリー: cs.AI, cs.CV | MVBoost: Boost 3D Reconstruction with Multi-View Refinement はコメントを受け付けていません

Enhancing the automatic segmentation and analysis of 3D liver vasculature models

要約 肝臓がん患者の外科的評価には、医療画像から血管樹を識別する必要があります。 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Enhancing the automatic segmentation and analysis of 3D liver vasculature models はコメントを受け付けていません

Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds

要約 テキストから画像への拡散モデルは、任意のテキスト プロンプトからリアルな画 … 続きを読む

カテゴリー: cs.CV, cs.LG | Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds はコメントを受け付けていません

Video-Driven Graph Network-Based Simulators

要約 デザイン、映画撮影、ゲームにおける本物のようなビジュアライゼーションは、正 … 続きを読む

カテゴリー: cs.CV, cs.LG | Video-Driven Graph Network-Based Simulators はコメントを受け付けていません