cs.AI」カテゴリーアーカイブ

ChartInsights: Evaluating Multimodal Large Language Models for Low-Level Chart Question Answering

要約 チャートの質問応答 (ChartQA) タスクは、視覚化チャートを解釈して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ChartInsights: Evaluating Multimodal Large Language Models for Low-Level Chart Question Answering はコメントを受け付けていません

Applying Guidance in a Limited Interval Improves Sample and Distribution Quality in Diffusion Models

要約 ガイダンスは、画像生成拡散モデルから最高のパフォーマンスを引き出すための重 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, stat.ML | Applying Guidance in a Limited Interval Improves Sample and Distribution Quality in Diffusion Models はコメントを受け付けていません

Energy Score-based Pseudo-Label Filtering and Adaptive Loss for Imbalanced Semi-supervised SAR target recognition

要約 自動目標認識 (ATR) は、合成開口レーダー (SAR) 画像解釈の重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | Energy Score-based Pseudo-Label Filtering and Adaptive Loss for Imbalanced Semi-supervised SAR target recognition はコメントを受け付けていません

Aligning Characteristic Descriptors with Images for Human-Expert-like Explainability

要約 法執行機関や医療診断などのミッションクリティカルな領域では、ユーザーの信頼 … 続きを読む

カテゴリー: cs.AI, cs.CV | Aligning Characteristic Descriptors with Images for Human-Expert-like Explainability はコメントを受け付けていません

CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale

要約 生物多様性の測定は、生態系の健全性を理解するために非常に重要です。 これま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale はコメントを受け付けていません

RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models

要約 微調整された視覚言語モデル (VLM) は、画像の特徴とテキスト属性の間の … 続きを読む

カテゴリー: cs.AI, cs.CV | RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models はコメントを受け付けていません

Fed-EC: Bandwidth-Efficient Clustering-Based Federated Learning For Autonomous Visual Robot Navigation

要約 集中学習ではデータを中央サーバーに集約する必要があるため、データのプライバ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.RO | Fed-EC: Bandwidth-Efficient Clustering-Based Federated Learning For Autonomous Visual Robot Navigation はコメントを受け付けていません

Navigating Extremes: Dynamic Sparsity in Large Output Space

要約 近年、効率的なモデルを生成するためのトレーニング後の枝刈りの代替手段として … 続きを読む

カテゴリー: cs.AI, cs.LG | Navigating Extremes: Dynamic Sparsity in Large Output Space はコメントを受け付けていません

Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy For Visuomotor Imitation Learning

要約 視覚運動ポリシー学習における配布外 (OOD) シナリオの課題に対処するた … 続きを読む

カテゴリー: cs.AI, cs.RO | Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy For Visuomotor Imitation Learning はコメントを受け付けていません

PersianRAG: A Retrieval-Augmented Generation System for Persian Language

要約 大規模な事前トレーニング済み生成モデルと外部検索メカニズムを統合する検索拡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | PersianRAG: A Retrieval-Augmented Generation System for Persian Language はコメントを受け付けていません