「cs.LG」カテゴリーアーカイブ

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

投稿日: 2025年6月11日作成者: jarxiv

要約検証可能な報酬に対して強化学習（RL）で大規模な言語モデルをトレーニングす … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing

投稿日: 2025年6月11日作成者: jarxiv

要約 MLモデルは重要なアプリケーションでますます展開されているため、敵対的な摂 … 続きを読む →

カテゴリー: cs.CR, cs.LG | コメントを受け付けていません

Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery

投稿日: 2025年6月11日作成者: jarxiv

要約 Multi-Indexモデルは、低次元構造を持つ機能の学習性を調査するため … 続きを読む →

カテゴリー: cs.IT, cs.LG, math.IT, math.PR, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Optimal Spectral Transitions in High-Dimensional Multi-Index Models

投稿日: 2025年6月11日作成者: jarxiv

要約関連するインデックスサブスペースを弱く再構築するために、ガウスマルチインデ … 続きを読む →

カテゴリー: cond-mat.dis-nn, cs.LG | コメントを受け付けていません

The Decoupled Risk Landscape in Performative Prediction

投稿日: 2025年6月11日作成者: jarxiv

要約パフォーマンス予測は、モデルを展開すると、個人の機能を変更したり、拒否後に … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations

投稿日: 2025年6月11日作成者: jarxiv

要約タスクベクトルは、タスク固有の情報を単一の再利用可能な表現に蒸留することに … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

TextAtari: 100K Frames Game Playing with Language Agents

投稿日: 2025年6月11日作成者: jarxiv

要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch

投稿日: 2025年6月11日作成者: jarxiv

要約コンテンツモデレートの需要を満たすために、オンラインプラットフォームは自動 … 続きを読む →

カテゴリー: cs.CL, cs.HC, cs.LG | コメントを受け付けていません

Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval

投稿日: 2025年6月11日作成者: jarxiv

要約変圧器ベースの事前訓練を受けた言語モデルを使用したニューラル検索方法には、 … 続きを読む →

カテゴリー: (Primary), 68T05, cs.AI, cs.CL, cs.IR, cs.LG, H.3.3 | コメントを受け付けていません

In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs

投稿日: 2025年6月11日作成者: jarxiv

要約体系的な経験的調査を通じて、私たちは大規模な言語モデルの根本的かつ懸念され … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, q-bio.NC | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing

Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery

Optimal Spectral Transitions in High-Dimensional Multi-Index Models

The Decoupled Risk Landscape in Performative Prediction

Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations

TextAtari: 100K Frames Game Playing with Language Agents

Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch

Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval

In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs

最近の投稿

最近のコメント

アーカイブ

カテゴリー