「cs.AI」カテゴリーアーカイブ

Average Reward Reinforcement Learning for Omega-Regular and Mean-Payoff Objectives

投稿日: 2025年5月22日作成者: jarxiv

要約補強学習（RL）の最近の進歩により、エージェントの動作を形成する報酬機能の … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

A Unified Theoretical Analysis of Private and Robust Offline Alignment: from RLHF to DPO

投稿日: 2025年5月22日作成者: jarxiv

要約この論文では、プライバシーと敵対的な腐敗に対する堅牢性との相互作用に焦点を … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Fine-tuning Large Language Models for Entity Matching

投稿日: 2025年5月22日作成者: jarxiv

要約生成大規模な言語モデル（LLMS）は、ゼロショットのパフォーマンスが高く、 … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2.7 | コメントを受け付けていません

Causal Predictive Optimization and Generation for Business AI

投稿日: 2025年5月22日作成者: jarxiv

要約販売プロセスには、販売機能がリードまたは機会を顧客に変換し、より多くの製品 … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG, stat.ML | コメントを受け付けていません

Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities

投稿日: 2025年5月22日作成者: jarxiv

要約多言語の大規模な言語モデル（MLLM）での暗記に関する最初の包括的な研究を … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Probing Semantic Routing in Large Mixture-of-Expert Models

投稿日: 2025年5月22日作成者: jarxiv

要約過去1年間で、大規模な（> 100Bパラメーター）混合物（MOE）モデルが … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning

投稿日: 2025年5月22日作成者: jarxiv

要約大規模な言語モデル（LLM）は、大規模なデータセットに関する広範なトレーニ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses

投稿日: 2025年5月22日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、チャットボットからエージェントシステムに … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | コメントを受け付けていません

HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement

投稿日: 2025年5月22日作成者: jarxiv

要約正式な方法は、厳格な数学的証拠を通じて重要なシステムの信頼性を検証するため … 続きを読む →

カテゴリー: cs.AI, cs.FL, cs.SE | コメントを受け付けていません

LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec

投稿日: 2025年5月22日作成者: jarxiv

要約個別の音声トークンは、言語モデルベースの音声生成に強い可能性を示しています … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Average Reward Reinforcement Learning for Omega-Regular and Mean-Payoff Objectives

A Unified Theoretical Analysis of Private and Robust Offline Alignment: from RLHF to DPO

Fine-tuning Large Language Models for Entity Matching

Causal Predictive Optimization and Generation for Business AI

Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities

Probing Semantic Routing in Large Mixture-of-Expert Models

DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning

Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses

HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement

LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec

最近の投稿

最近のコメント

アーカイブ

カテゴリー