cs.AI」カテゴリーアーカイブ

Fourier Amplitude and Correlation Loss: Beyond Using L2 Loss for Skillful Precipitation Nowcasting

要約 近年、深層学習アプローチが降水ナウキャスティングに広く採用されています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Fourier Amplitude and Correlation Loss: Beyond Using L2 Loss for Skillful Precipitation Nowcasting はコメントを受け付けていません

Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers

要約 フューショット知識蒸留は、限られたデータと計算リソースを使用して、大規模な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Weight Copy and Low-Rank Adaptation for Few-Shot Distillation of Vision Transformers はコメントを受け付けていません

DiaMond: Dementia Diagnosis with Multi-Modal Vision Transformers Using MRI and PET

要約 認知症、特にアルツハイマー病 (AD) と前頭側頭型認知症 (FTD) の … 続きを読む

カテゴリー: cs.AI, cs.CV | DiaMond: Dementia Diagnosis with Multi-Modal Vision Transformers Using MRI and PET はコメントを受け付けていません

Aligning Audio-Visual Joint Representations with an Agentic Workflow

要約 ビジュアル コンテンツと付随するオーディオ信号は、オーディオビジュアル ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Aligning Audio-Visual Joint Representations with an Agentic Workflow はコメントを受け付けていません

Keypoint Abstraction using Large Models for Object-Relative Imitation Learning

要約 多様なタスクや環境にわたる新しいオブジェクト構成やインスタンスへの一般化は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Keypoint Abstraction using Large Models for Object-Relative Imitation Learning はコメントを受け付けていません

EMMA: End-to-End Multimodal Model for Autonomous Driving

要約 自動運転のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | EMMA: End-to-End Multimodal Model for Autonomous Driving はコメントを受け付けていません

TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models

要約 既存のベンチマークでは、ビデオ理解のための時間的コンテキストを活用する際に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models はコメントを受け付けていません

Multi-student Diffusion Distillation for Better One-step Generators

要約 拡散モデルは、長時間にわたる複数ステップの推論手順を犠牲にして、高品質のサ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Multi-student Diffusion Distillation for Better One-step Generators はコメントを受け付けていません

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

要約 人間には、一般的な世界の動きの遅い学習と、新しい経験からのエピソード記憶の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation はコメントを受け付けていません

Integration of Large Language Models and Federated Learning

要約 大規模言語モデル (LLM) のパラメータ サイズが拡大し続ける中、高品質 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Integration of Large Language Models and Federated Learning はコメントを受け付けていません