cs.LG」カテゴリーアーカイブ

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

要約 検証可能な報酬に対して強化学習(RL)で大規模な言語モデルをトレーニングす … 続きを読む

カテゴリー: cs.LG | SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning はコメントを受け付けていません

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing

要約 MLモデルは重要なアプリケーションでますます展開されているため、敵対的な摂 … 続きを読む

カテゴリー: cs.CR, cs.LG | Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing はコメントを受け付けていません

Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery

要約 Multi-Indexモデルは、低次元構造を持つ機能の学習性を調査するため … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT, math.PR, math.ST, stat.ML, stat.TH | Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery はコメントを受け付けていません

Optimal Spectral Transitions in High-Dimensional Multi-Index Models

要約 関連するインデックスサブスペースを弱く再構築するために、ガウスマルチインデ … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG | Optimal Spectral Transitions in High-Dimensional Multi-Index Models はコメントを受け付けていません

The Decoupled Risk Landscape in Performative Prediction

要約 パフォーマンス予測は、モデルを展開すると、個人の機能を変更したり、拒否後に … 続きを読む

カテゴリー: cs.LG | The Decoupled Risk Landscape in Performative Prediction はコメントを受け付けていません

Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations

要約 タスクベクトルは、タスク固有の情報を単一の再利用可能な表現に蒸留することに … 続きを読む

カテゴリー: cs.LG | Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations はコメントを受け付けていません

TextAtari: 100K Frames Game Playing with Language Agents

要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TextAtari: 100K Frames Game Playing with Language Agents はコメントを受け付けていません

Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch

要約 コンテンツモデレートの需要を満たすために、オンラインプラットフォームは自動 … 続きを読む

カテゴリー: cs.CL, cs.HC, cs.LG | Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch はコメントを受け付けていません

Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval

要約 変圧器ベースの事前訓練を受けた言語モデルを使用したニューラル検索方法には、 … 続きを読む

カテゴリー: (Primary), 68T05, cs.AI, cs.CL, cs.IR, cs.LG, H.3.3 | Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval はコメントを受け付けていません

In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs

要約 体系的な経験的調査を通じて、私たちは大規模な言語モデルの根本的かつ懸念され … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, q-bio.NC | In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs はコメントを受け付けていません