月別アーカイブ: 2024年1月

FactCHD: Benchmarking Fact-Conflicting Hallucination Detection

要約 LLM はその優れた生成能力にもかかわらず、現実世界のアプリケーションでは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | FactCHD: Benchmarking Fact-Conflicting Hallucination Detection はコメントを受け付けていません

VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition

要約 シーン テキスト認識 (STR) は、自然のシーンの画像内のテキストを認識 … 続きを読む

カテゴリー: cs.CV | VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition はコメントを受け付けていません

Exposing Lip-syncing Deepfakes from Mouth Inconsistencies

要約 口パクディープフェイクはデジタル処理されたビデオで、AI モデルを使用して … 続きを読む

カテゴリー: cs.CV | Exposing Lip-syncing Deepfakes from Mouth Inconsistencies はコメントを受け付けていません

UMG-CLIP: A Unified Multi-Granularity Vision Generalist for Open-World Understanding

要約 Contrastive language-image pre-traini … 続きを読む

カテゴリー: cs.CV | UMG-CLIP: A Unified Multi-Granularity Vision Generalist for Open-World Understanding はコメントを受け付けていません

Sub2Full: split spectrum to boost OCT despeckling without clean data

要約 光干渉断層撮影 (OCT) はスペックル ノイズの影響を受け、特に可視光 … 続きを読む

カテゴリー: cs.CV, eess.IV | Sub2Full: split spectrum to boost OCT despeckling without clean data はコメントを受け付けていません

Few-shot learning for COVID-19 Chest X-Ray Classification with Imbalanced Data: An Inter vs. Intra Domain Study

要約 医療画像データセットは、コンピューター支援診断、治療計画、医学研究で使用さ … 続きを読む

カテゴリー: cs.CV, eess.IV | Few-shot learning for COVID-19 Chest X-Ray Classification with Imbalanced Data: An Inter vs. Intra Domain Study はコメントを受け付けていません

Model Compression Techniques in Biometrics Applications: A Survey

要約 深層学習アルゴリズムの開発により、人類のタスク自動化能力が広範囲に強化され … 続きを読む

カテゴリー: cs.AI, cs.CV | Model Compression Techniques in Biometrics Applications: A Survey はコメントを受け付けていません

Hyperbolic Image-Text Representations

要約 視覚的および言語的概念は自然に階層構造に編成され、テキスト概念「犬」には犬 … 続きを読む

カテゴリー: cs.CV, cs.LG | Hyperbolic Image-Text Representations はコメントを受け付けていません

Explicitly Disentangled Representations in Object-Centric Learning

要約 生の視覚データから構造化表現を抽出することは、機械学習における重要かつ長年 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Explicitly Disentangled Representations in Object-Centric Learning はコメントを受け付けていません

Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation

要約 最近の大規模な事前トレーニング済み拡散モデルは、詳細なテキストの説明から高 … 続きを読む

カテゴリー: cs.CV | Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation はコメントを受け付けていません