月別アーカイブ: 2025年1月

SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation

要約 器具の正確な姿勢推定はロボット手術の将来に向けた重要なステップであり、自律 … 続きを読む

カテゴリー: cs.CV, cs.RO | SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation はコメントを受け付けていません

GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT

要約 コーンビームコンピュータ断層撮影 (CBCT) から合成コンピュータ断層撮 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT はコメントを受け付けていません

PiLaMIM: Toward Richer Visual Representations by Integrating Pixel and Latent Masked Image Modeling

要約 マスク イメージ モデリング (MIM) には、ピクセル MIM と潜在 … 続きを読む

カテゴリー: cs.CV | PiLaMIM: Toward Richer Visual Representations by Integrating Pixel and Latent Masked Image Modeling はコメントを受け付けていません

TransPixar: Advancing Text-to-Video Generation with Transparency

要約 テキストからビデオへの生成モデルは大幅な進歩を遂げ、エンターテイメント、広 … 続きを読む

カテゴリー: cs.CV | TransPixar: Advancing Text-to-Video Generation with Transparency はコメントを受け付けていません

3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration

要約 マルチインスタンス点群登録は、シーン全体のモデル点群のすべてのインスタンス … 続きを読む

カテゴリー: cs.CV | 3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration はコメントを受け付けていません

Analyzing Fine-tuning Representation Shift for Multimodal LLMs Steering alignment

要約 マルチモーダル LLM は、マルチモーダル入力の理解において驚くべきレベル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Analyzing Fine-tuning Representation Shift for Multimodal LLMs Steering alignment はコメントを受け付けていません

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

要約 急速に開発されているラージ ビジョン言語モデル (LVLM) は、さまざま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback はコメントを受け付けていません

A Trust-Guided Approach to MR Image Reconstruction with Side Information

要約 MRI スキャン時間を短縮すると、患者ケアが改善され、医療費が削減されます … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A Trust-Guided Approach to MR Image Reconstruction with Side Information はコメントを受け付けていません

DDRM-PR: Fourier Phase Retrieval using Denoising Diffusion Restoration Models

要約 拡散モデルは、さまざまな逆問題を解決するための学習された事前分布としての有 … 続きを読む

カテゴリー: cs.CV, eess.IV | DDRM-PR: Fourier Phase Retrieval using Denoising Diffusion Restoration Models はコメントを受け付けていません

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

要約 ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む

カテゴリー: cs.CV | VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control はコメントを受け付けていません