「cs.CV」カテゴリーアーカイブ

It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data

投稿日: 2025年4月1日作成者: jarxiv

要約プラトニック表現仮説は、モデルとデータセットのサイズが増加するにつれて、ビ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization

投稿日: 2025年4月1日作成者: jarxiv

要約弱く監視されたオブジェクトローカリゼーション（WSOL）メソッドにより、ト … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models

投稿日: 2025年4月1日作成者: jarxiv

要約大腸内視鏡検査では、ディープラーニングモデルの助けを借りて、見逃されたポリ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

A Comparative Study of Scanpath Models in Graph-Based Visualization

投稿日: 2025年4月1日作成者: jarxiv

要約情報視覚化（Infovis）システムは、視覚表現を利用してデータ解釈を強化 … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Foundation Models For Seismic Data Processing: An Extensive Review

投稿日: 2025年4月1日作成者: jarxiv

要約地震加工は、生データをさまざまな地球科学アプリケーションに極めて高品質の地 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Navi-plus: Managing Ambiguous GUI Navigation Tasks with Follow-up

投稿日: 2025年4月1日作成者: jarxiv

要約グラフィカルユーザーインターフェイス（GUI）自動化エージェントは、強力な … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization

投稿日: 2025年4月1日作成者: jarxiv

要約対照的な言語イメージの事前削除（CLIP）は、視覚的表現とテキスト表現を効 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models

投稿日: 2025年4月1日作成者: jarxiv

要約離散拡散モデルは、画像生成やマスクされた言語モデリングなどのタスクで成功を … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting

投稿日: 2025年4月1日作成者: jarxiv

要約ぼやけたマルチビュー画像からのシャープな3D表現の再構築は、コンピューター … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Finer-CAM: Spotting the Difference Reveals Finer Details for Visual Explanation

投稿日: 2025年4月1日作成者: jarxiv

要約クラスのアクティベーションマップ（CAM）は、クラスの予測に寄与する画像領 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data

PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization

AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models

A Comparative Study of Scanpath Models in Graph-Based Visualization

Foundation Models For Seismic Data Processing: An Extensive Review

Navi-plus: Managing Ambiguous GUI Navigation Tasks with Follow-up

CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization

DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models

DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting

Finer-CAM: Spotting the Difference Reveals Finer Details for Visual Explanation

最近の投稿

最近のコメント

アーカイブ

カテゴリー