cs.AI」カテゴリーアーカイブ

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

要約 視覚的な質問応答(VQA)は、コンピュータービジョンと自然言語処理の交差点 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison はコメントを受け付けていません

A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness

要約 画質は、深いニューラルネットワーク(DNNS)のパフォーマンスにおいて重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness はコメントを受け付けていません

AI-based association analysis for medical imaging using latent-space geometric confounder correction

要約 この研究では、人工知能ベースの医療画像分析における交絡効果と解釈可能性の課 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | AI-based association analysis for medical imaging using latent-space geometric confounder correction はコメントを受け付けていません

Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging

要約 腫瘍学では、CTからの解剖学的詳細とPETからの分子マーカー発現情報との解 … 続きを読む

カテゴリー: cs.AI, cs.CV | Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging はコメントを受け付けていません

Multimodal Deep Learning for Subtype Classification in Breast Cancer Using Histopathological Images and Gene Expression Data

要約 乳がんの分子サブタイピングは、個別化された治療と予後に不可欠です。 従来の … 続きを読む

カテゴリー: cs.AI, cs.CV | Multimodal Deep Learning for Subtype Classification in Breast Cancer Using Histopathological Images and Gene Expression Data はコメントを受け付けていません

Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024

要約 ますます現実的に生成されるAIの時代には、詐欺と偽情報を緩和するためには、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY | Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024 はコメントを受け付けていません

VOILA: Evaluation of MLLMs For Perceptual Understanding and Analogical Reasoning

要約 マルチモーダル大手言語モデル(MLLM)は、視覚情報とテキスト情報を統合す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VOILA: Evaluation of MLLMs For Perceptual Understanding and Analogical Reasoning はコメントを受け付けていません

Variational Best-of-N Alignment

要約 Best-of-n(bon)は、言語モデルを人間の好みに合わせるための一般 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Variational Best-of-N Alignment はコメントを受け付けていません

Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff

要約 投機的デコード(SD)は、ターゲットモデルとの厳密な分布の等価性を施行し、 … 続きを読む

カテゴリー: cs.AI | Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff はコメントを受け付けていません

The Labyrinth of Links: Navigating the Associative Maze of Multi-modal LLMs

要約 マルチモーダル大規模言語モデル(MLLM)は素晴らしい能力を発揮してきた。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | The Labyrinth of Links: Navigating the Associative Maze of Multi-modal LLMs はコメントを受け付けていません