cs.CV」カテゴリーアーカイブ

It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data

要約 プラトニック表現仮説は、モデルとデータセットのサイズが増加するにつれて、ビ … 続きを読む

カテゴリー: cs.CV, cs.LG | It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data はコメントを受け付けていません

PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization

要約 弱く監視されたオブジェクトローカリゼーション(WSOL)メソッドにより、ト … 続きを読む

カテゴリー: cs.CV | PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization はコメントを受け付けていません

AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models

要約 大腸内視鏡検査では、ディープラーニングモデルの助けを借りて、見逃されたポリ … 続きを読む

カテゴリー: cs.CV, eess.IV | AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models はコメントを受け付けていません

A Comparative Study of Scanpath Models in Graph-Based Visualization

要約 情報視覚化(Infovis)システムは、視覚表現を利用してデータ解釈を強化 … 続きを読む

カテゴリー: cs.CV, cs.HC | A Comparative Study of Scanpath Models in Graph-Based Visualization はコメントを受け付けていません

Foundation Models For Seismic Data Processing: An Extensive Review

要約 地震加工は、生データをさまざまな地球科学アプリケーションに極めて高品質の地 … 続きを読む

カテゴリー: cs.CV | Foundation Models For Seismic Data Processing: An Extensive Review はコメントを受け付けていません

Navi-plus: Managing Ambiguous GUI Navigation Tasks with Follow-up

要約 グラフィカルユーザーインターフェイス(GUI)自動化エージェントは、強力な … 続きを読む

カテゴリー: cs.CV, cs.HC | Navi-plus: Managing Ambiguous GUI Navigation Tasks with Follow-up はコメントを受け付けていません

CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization

要約 対照的な言語イメージの事前削除(CLIP)は、視覚的表現とテキスト表現を効 … 続きを読む

カテゴリー: cs.CV | CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization はコメントを受け付けていません

DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models

要約 離散拡散モデルは、画像生成やマスクされた言語モデリングなどのタスクで成功を … 続きを読む

カテゴリー: cs.CV, cs.LG | DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models はコメントを受け付けていません

DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting

要約 ぼやけたマルチビュー画像からのシャープな3D表現の再構築は、コンピューター … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting はコメントを受け付けていません

Finer-CAM: Spotting the Difference Reveals Finer Details for Visual Explanation

要約 クラスのアクティベーションマップ(CAM)は、クラスの予測に寄与する画像領 … 続きを読む

カテゴリー: cs.AI, cs.CV | Finer-CAM: Spotting the Difference Reveals Finer Details for Visual Explanation はコメントを受け付けていません