投稿者「jarxiv」のアーカイブ

Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation

投稿日: 2025年6月3日作成者: jarxiv

要約重尾の確率的最適化アルゴリズムの一般化特性を理解することで、過去数年間で注 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Statistical Taylor Expansion

投稿日: 2025年6月3日作成者: jarxiv

要約統計的テイラー拡張は、従来のテイラー拡張の入力正確な変数を、それぞれ既知の … 続きを読む →

カテゴリー: 65G99, cs.LG, G.3.2, stat.CO | コメントを受け付けていません

Humans Coexist, So Must Embodied Artificial Agents

投稿日: 2025年6月3日作成者: jarxiv

要約このペーパーでは、具体化された人工剤の共存の概念を紹介し、それが人間との長 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization

投稿日: 2025年6月3日作成者: jarxiv

要約神経組み合わせ最適化（NCO）は、NPハードの問題に対する有望なアプローチ … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Dynamic Consistent $k$-Center Clustering with Optimal Recourse

投稿日: 2025年6月3日作成者: jarxiv

要約敵から送信された任意のメトリック空間と一連のポイントアップデートからのポイ … 続きを読む →

カテゴリー: cs.DS, cs.LG | コメントを受け付けていません

The Energy Loss Phenomenon in RLHF: A New Perspective on Mitigating Reward Hacking

投稿日: 2025年6月3日作成者: jarxiv

要約この作業は、人間のフィードバック（RLHF）からの補強学習におけるエネルギ … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

LexGen: Domain-aware Multilingual Lexicon Generation

投稿日: 2025年6月3日作成者: jarxiv

要約レキシコンまたはドメイン全体の辞書の生成は、言語のアイデンティティを保存し … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

GrammaMT: Improving Machine Translation with Grammar-Informed In-Context Learning

投稿日: 2025年6月3日作成者: jarxiv

要約 GrammAmtを紹介します。これは、ソース文の形態学的および語彙注釈を提 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS

投稿日: 2025年6月3日作成者: jarxiv

要約コンテキスト学習（ICL）により、高度なプロンプトと高品質のデモンストレー … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Pitfalls of Scale: Investigating the Inverse Task of Redefinition in Large Language Models

投稿日: 2025年6月3日作成者: jarxiv

要約逆タスクは、大規模な言語モデル（LLM）のスケールアップとして、潜在的な推 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation

Statistical Taylor Expansion

Humans Coexist, So Must Embodied Artificial Agents

BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization

Dynamic Consistent $k$-Center Clustering with Optimal Recourse

The Energy Loss Phenomenon in RLHF: A New Perspective on Mitigating Reward Hacking

LexGen: Domain-aware Multilingual Lexicon Generation

GrammaMT: Improving Machine Translation with Grammar-Informed In-Context Learning

Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS

Pitfalls of Scale: Investigating the Inverse Task of Redefinition in Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー