cs.LG」カテゴリーアーカイブ

PoLAR: Polar-Decomposed Low-Rank Adapter Representation

要約 大規模モデルの低ランク適応は、部分空間の線形代数ランクを大きく下回る低い安 … 続きを読む

カテゴリー: cs.AI, cs.LG, eess.SP, math.OC | PoLAR: Polar-Decomposed Low-Rank Adapter Representation はコメントを受け付けていません

Causal Estimation of Tokenisation Bias

要約 現代の言語モデルは通常、サブワード列に対して学習されるが、最終的には文字列 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Causal Estimation of Tokenisation Bias はコメントを受け付けていません

FORLA:Federated Object-centric Representation Learning with Slot Attention

要約 異種のラベルなしデータセット間で効率的な視覚表現を学習することは、連携学習 … 続きを読む

カテゴリー: cs.CV, cs.LG | FORLA:Federated Object-centric Representation Learning with Slot Attention はコメントを受け付けていません

Open-world Machine Learning: A Systematic Review and Future Directions

要約 機械学習は、多くのアプリケーションで目覚ましい成功を収めている。しかし、既 … 続きを読む

カテゴリー: cs.CV, cs.LG | Open-world Machine Learning: A Systematic Review and Future Directions はコメントを受け付けていません

Learning on Model Weights using Tree Experts

要約 公開されているモデルの数は急速に増えているが、そのほとんどは文書化されてい … 続きを読む

カテゴリー: cs.CV, cs.LG | Learning on Model Weights using Tree Experts はコメントを受け付けていません

We Should Chart an Atlas of All the World’s Models

要約 公開モデルリポジトリには、現在数百万ものモデルが含まれていますが、ほとんど … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | We Should Chart an Atlas of All the World’s Models はコメントを受け付けていません

Adversarial Robustness of AI-Generated Image Detectors in the Real World

要約 ジェネレーティブ・アーティフィシャル・インテリジェンス(GenAI)機能の … 続きを読む

カテゴリー: cs.CV, cs.LG | Adversarial Robustness of AI-Generated Image Detectors in the Real World はコメントを受け付けていません

Sparse-vDiT: Unleashing the Power of Sparse Attention to Accelerate Video Diffusion Transformers

要約 拡散変換(DiT)はビデオ生成において画期的な進歩を遂げたが、この長いシー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Sparse-vDiT: Unleashing the Power of Sparse Attention to Accelerate Video Diffusion Transformers はコメントを受け付けていません

Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification

要約 近年、畳み込みニューラルネットワーク(CNN)の性能が大幅に向上している。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification はコメントを受け付けていません

FuseLIP: Multimodal Embeddings via Early Fusion of Discrete Tokens

要約 対照的言語-画像事前学習は、各モダリティ用の異なるエンコーダを介して、テキ … 続きを読む

カテゴリー: cs.CV, cs.LG | FuseLIP: Multimodal Embeddings via Early Fusion of Discrete Tokens はコメントを受け付けていません