cs.LG」カテゴリーアーカイブ

Transformers without Normalization

要約 正規化層は、現代のニューラルネットワークで遍在しており、長い間不可欠である … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Transformers without Normalization はコメントを受け付けていません

NIL: No-data Imitation Learning by Leveraging Pre-trained Video Diffusion Models

要約 ヒューマノイドロボット、4倍、動物など、多様で型破りな形態学を介して身体的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | NIL: No-data Imitation Learning by Leveraging Pre-trained Video Diffusion Models はコメントを受け付けていません

Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers?

要約 Kolmogorov-Arnold Networks(KANS)は、データ … 続きを読む

カテゴリー: 68T07, cs.CV, cs.LG, I.2.6 | Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers? はコメントを受け付けていません

Charting and Navigating Hugging Face’s Model Atlas

要約 現在、何百万もの公開されているニューラルネットワークがあるため、大規模なモ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Charting and Navigating Hugging Face’s Model Atlas はコメントを受け付けていません

A Frustratingly Simple Yet Highly Effective Attack Baseline: Over 90% Success Rate Against the Strong Black-box Models of GPT-4.5/4o/o1

要約 オープンソースの大型ビジョン言語モデル(LVLMS)での有望なパフォーマン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Frustratingly Simple Yet Highly Effective Attack Baseline: Over 90% Success Rate Against the Strong Black-box Models of GPT-4.5/4o/o1 はコメントを受け付けていません

The Curse of Conditions: Analyzing and Improving Optimal Transport for Conditional Flow-Based Generation

要約 ミニバッチ最適な輸送カップリングは、無条件のフローマッチングでパスをまっす … 続きを読む

カテゴリー: cs.CV, cs.LG | The Curse of Conditions: Analyzing and Improving Optimal Transport for Conditional Flow-Based Generation はコメントを受け付けていません

Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective

要約 分類器のないガイダンスは、拡散モデルを除去する条件付き発電の定番となってい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective はコメントを受け付けていません

Representation Retrieval Learning for Heterogeneous Data Integration

要約 ビッグデータの時代では、大規模でマルチモーダルデータセットがますます遍在し … 続きを読む

カテゴリー: cs.LG, stat.ME | Representation Retrieval Learning for Heterogeneous Data Integration はコメントを受け付けていません

2HandedAfforder: Learning Precise Actionable Bimanual Affordances from Human Videos

要約 オブジェクトと相互作用する場合、人間は、意図したアクション、つまりオブジェ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | 2HandedAfforder: Learning Precise Actionable Bimanual Affordances from Human Videos はコメントを受け付けていません

Large Language Models for Multi-Facility Location Mechanism Design

要約 エージェントの好みに基づいてソーシャルコストを最適化する多目的位置のための … 続きを読む

カテゴリー: cs.LG | Large Language Models for Multi-Facility Location Mechanism Design はコメントを受け付けていません