cs.LG」カテゴリーアーカイブ

Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models

要約 視覚言語推論における優れたパフォーマンスにもかかわらず、大規模視覚言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models はコメントを受け付けていません

Why Fine-grained Labels in Pretraining Benefit Generalization?

要約 最近の研究では、きめの細かいラベル付けされたデータを使用してディープ ニュ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Why Fine-grained Labels in Pretraining Benefit Generalization? はコメントを受け付けていません

Revisiting MAE pre-training for 3D medical image segmentation

要約 自己教師あり学習 (SSL) は、ラベル付きデータの不足に悩まされているさ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Revisiting MAE pre-training for 3D medical image segmentation はコメントを受け付けていません

FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training

要約 ディープ ニューラル ネットワークは、敵対的な攻撃や一般的な破損の影響を受 … 続きを読む

カテゴリー: cs.CV, cs.LG | FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training はコメントを受け付けていません

Unbounded: A Generative Infinite Game of Character Life Simulation

要約 生成無限ゲームの概念を紹介します。これは、生成モデルを使用することで、ハー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.GR, cs.LG | Unbounded: A Generative Infinite Game of Character Life Simulation はコメントを受け付けていません

VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning

要約 広範なインテリジェントエージェントは、生の感覚運動空間の複雑さを抽象化しな … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning はコメントを受け付けていません

Fourier Amplitude and Correlation Loss: Beyond Using L2 Loss for Skillful Precipitation Nowcasting

要約 近年、深層学習アプローチが降水ナウキャスティングに広く採用されています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Fourier Amplitude and Correlation Loss: Beyond Using L2 Loss for Skillful Precipitation Nowcasting はコメントを受け付けていません

Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers

要約 フューショット知識蒸留は、限られたデータと計算リソースを使用して、大規模な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers はコメントを受け付けていません

CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models

要約 人工知能は、特に Medical Large Vision Languag … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.CY, cs.LG | CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models はコメントを受け付けていません

Aligning Audio-Visual Joint Representations with an Agentic Workflow

要約 ビジュアル コンテンツと付随するオーディオ信号は、オーディオビジュアル ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Aligning Audio-Visual Joint Representations with an Agentic Workflow はコメントを受け付けていません