「cs.LG」カテゴリーアーカイブ

Don’t lie to your friends: Learning what you know from collaborative self-play

投稿日: 2025年4月2日作成者: jarxiv

要約役立つアシスタントになるには、AIエージェントは自分の能力と制限に注意する … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder

投稿日: 2025年4月2日作成者: jarxiv

要約命令チューニングデータは、データ収集と高速モデルの反復により、多くの場合数 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems

投稿日: 2025年4月2日作成者: jarxiv

要約この論文は、詳細な人類学的枠組みと併せてハイブリッドCNNトランスフォーカ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Non-Determinism of ‘Deterministic’ LLM Settings

投稿日: 2025年4月2日作成者: jarxiv

要約 LLM（大規模な言語モデル）開業医は、一般に、出力が決定論的と予想される設 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントを受け付けていません

Lean Formalization of Generalization Error Bound by Rademacher Complexity

投稿日: 2025年4月2日作成者: jarxiv

要約 Lean 4定理を使用して、Rademacherの複雑さを使用して、一般化 … 続きを読む →

カテゴリー: cs.CL, cs.LG, math.ST, stat.TH | コメントを受け付けていません

Self-Vocabularizing Training for Neural Machine Translation

投稿日: 2025年4月2日作成者: jarxiv

要約過去の語彙学習手法は、トレーニング前に関連する語彙を特定し、モデルトレーニ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

CodingTeachLLM: Empowering LLM’s Coding Ability via AST Prior Knowledge

投稿日: 2025年4月2日作成者: jarxiv

要約この論文では、コーディング教育用に設計された大規模な言語モデル（LLM）で … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs

投稿日: 2025年4月2日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、大規模なテキストコーパスを事前に移動する … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond

投稿日: 2025年4月2日作成者: jarxiv

要約このペーパーでは、再現可能で費用対効果の高い方法論を使用して長い推論モデル … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization

投稿日: 2025年4月2日作成者: jarxiv

要約確率的モデルチェックの進歩にもかかわらず、検証方法のスケーラビリティは限ら … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.LO, cs.SY, eess.SY | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Don’t lie to your friends: Learning what you know from collaborative self-play

Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder

Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems

Non-Determinism of ‘Deterministic’ LLM Settings

Lean Formalization of Generalization Error Bound by Rademacher Complexity

Self-Vocabularizing Training for Neural Machine Translation

CodingTeachLLM: Empowering LLM’s Coding Ability via AST Prior Knowledge

Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs

Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond

1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization

最近の投稿

最近のコメント

アーカイブ

カテゴリー