月別アーカイブ: 2025年1月

SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation

投稿日: 2025年1月7日作成者: jarxiv

要約器具の正確な姿勢推定はロボット手術の将来に向けた重要なステップであり、自律 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT

投稿日: 2025年1月7日作成者: jarxiv

要約コーンビームコンピュータ断層撮影 (CBCT) から合成コンピュータ断層撮 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

PiLaMIM: Toward Richer Visual Representations by Integrating Pixel and Latent Masked Image Modeling

投稿日: 2025年1月7日作成者: jarxiv

要約マスクイメージモデリング (MIM) には、ピクセル MIM と潜在 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TransPixar: Advancing Text-to-Video Generation with Transparency

投稿日: 2025年1月7日作成者: jarxiv

要約テキストからビデオへの生成モデルは大幅な進歩を遂げ、エンターテイメント、広 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration

投稿日: 2025年1月7日作成者: jarxiv

要約マルチインスタンス点群登録は、シーン全体のモデル点群のすべてのインスタンス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Analyzing Fine-tuning Representation Shift for Multimodal LLMs Steering alignment

投稿日: 2025年1月7日作成者: jarxiv

要約マルチモーダル LLM は、マルチモーダル入力の理解において驚くべきレベル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

投稿日: 2025年1月7日作成者: jarxiv

要約急速に開発されているラージビジョン言語モデル (LVLM) は、さまざま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

A Trust-Guided Approach to MR Image Reconstruction with Side Information

投稿日: 2025年1月7日作成者: jarxiv

要約 MRI スキャン時間を短縮すると、患者ケアが改善され、医療費が削減されます … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

DDRM-PR: Fourier Phase Retrieval using Denoising Diffusion Restoration Models

投稿日: 2025年1月7日作成者: jarxiv

要約拡散モデルは、さまざまな逆問題を解決するための学習された事前分布としての有 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

投稿日: 2025年1月7日作成者: jarxiv

要約ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年1月

SurgRIPE challenge: Benchmark of Surgical Robot Instrument Pose Estimation

GLFC: Unified Global-Local Feature and Contrast Learning with Mamba-Enhanced UNet for Synthetic CT Generation from CBCT

PiLaMIM: Toward Richer Visual Representations by Integrating Pixel and Latent Masked Image Modeling

TransPixar: Advancing Text-to-Video Generation with Transparency

3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration

Analyzing Fine-tuning Representation Shift for Multimodal LLMs Steering alignment

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

A Trust-Guided Approach to MR Image Reconstruction with Side Information

DDRM-PR: Fourier Phase Retrieval using Denoising Diffusion Restoration Models

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

最近の投稿

最近のコメント

アーカイブ

カテゴリー