cs.LG」カテゴリーアーカイブ

CoRet: Improved Retriever for Code Editing

要約 この論文では、コードセマンティクス、リポジトリ構造、コールグラフ依存関係を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CoRet: Improved Retriever for Code Editing はコメントを受け付けていません

Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models

要約 大規模な言語モデル(LLM)は、コヒーレントテキストを生成し、コンテキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models はコメントを受け付けていません

HELM: Hyperbolic Large Language Models via Mixture-of-Curvature Experts

要約 大規模な言語モデル(LLM)は、ドメイン全体のテキストモデリングタスクで大 … 続きを読む

カテゴリー: cs.AI, cs.LG | HELM: Hyperbolic Large Language Models via Mixture-of-Curvature Experts はコメントを受け付けていません

Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients

要約 データ駆動型の数学的表現の発見の堅牢性と解釈可能性を高めるために、新しい深 … 続きを読む

カテゴリー: cs.AI, cs.LG | Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients はコメントを受け付けていません

Unsupervised Evolutionary Cell Type Matching via Entropy-Minimized Optimal Transport

要約 種全体の細胞タイプ間の進化的対応を特定することは、比較ゲノミクスと進化生物 … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.QM | Unsupervised Evolutionary Cell Type Matching via Entropy-Minimized Optimal Transport はコメントを受け付けていません

REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards

要約 検証可能な報酬を伴う強化学習のための推論環境のライブラリであるReashi … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards はコメントを受け付けていません

Defining Foundation Models for Computational Science: A Call for Clarity and Rigor

要約 自然言語処理とコンピュータービジョンにおける基礎モデルの広範な成功により、 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NA, math.NA | Defining Foundation Models for Computational Science: A Call for Clarity and Rigor はコメントを受け付けていません

HelpSteer3: Human-Annotated Feedback and Edit Data to Empower Inference-Time Scaling in Open-Ended General-Domain Tasks

要約 推論時間スケーリングは、OpenAI O1やDeepSeek R1などの最 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | HelpSteer3: Human-Annotated Feedback and Edit Data to Empower Inference-Time Scaling in Open-Ended General-Domain Tasks はコメントを受け付けていません

LoBAM: LoRA-Based Backdoor Attack on Model Merging

要約 モデルのマージは、異なるタスクで微調整された複数のモデルを統合して、複数の … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | LoBAM: LoRA-Based Backdoor Attack on Model Merging はコメントを受け付けていません

AXIOM: Learning to Play Games in Minutes with Expanding Object-Centric Models

要約 現在の深い強化学習(DRL)アプローチは、さまざまなドメインで最先端のパフ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | AXIOM: Learning to Play Games in Minutes with Expanding Object-Centric Models はコメントを受け付けていません