cs.LG」カテゴリーアーカイブ

Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge

要約 建物の建設年を推定することは、持続可能性にとって非常に重要です。 持続可能 … 続きを読む

カテゴリー: cs.CV, cs.LG | Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge はコメントを受け付けていません

PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation

要約 拡散モデルは、近年大きな進歩を遂げています。 ただし、不均衡なデータセット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation はコメントを受け付けていません

Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data

要約 MRI再構築における最近の進歩は、深い学習ベースのモデルを通じて顕著な成功 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.med-ph | Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data はコメントを受け付けていません

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS, F.2.2 | Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention はコメントを受け付けていません

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

要約 拡散トランスは、テキスト間合成に広く採用されています。 これらのモデルを数 … 続きを読む

カテゴリー: cs.CV, cs.LG | EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing はコメントを受け付けていません

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

要約 最近の研究では、大きなビジョン言語モデル(VLM)が画像コンテンツを無視し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images はコメントを受け付けていません

Continually Learning Structured Visual Representations via Network Refinement with Rerelation

要約 現在の機械学習のパラダイムは、問題の構造を直接学習するのではなく、アウトカ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Continually Learning Structured Visual Representations via Network Refinement with Rerelation はコメントを受け付けていません

Explaining the Impact of Training on Vision Models via Activation Clustering

要約 Visionモデル向けの説明可能な人工知能(XAI)の分野での最近の開発は … 続きを読む

カテゴリー: cs.CV, cs.LG | Explaining the Impact of Training on Vision Models via Activation Clustering はコメントを受け付けていません

Image compositing is all you need for data augmentation

要約 このペーパーでは、オブジェクト検出モデルのパフォーマンスに対するさまざまな … 続きを読む

カテゴリー: cs.CV, cs.LG | Image compositing is all you need for data augmentation はコメントを受け付けていません

Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness

要約 この作業では、イメージ分類のための新しい敵対的な防御メカニズム &#821 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness はコメントを受け付けていません