投稿者「jarxiv」のアーカイブ

JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System

要約 このペーパーでは、中国の法制度における判断文書生成のパフォーマンスを評価す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | コメントする

Learning Heterogeneous Performance-Fairness Trade-offs in Federated Learning

要約 最近の方法は、ハイパーネットを活用して、連邦学習におけるパフォーマンスフェ … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

WebThinker: Empowering Large Reasoning Models with Deep Research Capability

要約 Openai-O1やDeepSeek-R1などの大きな推論モデル(LRMS … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | コメントする

Variational Offline Multi-agent Skill Discovery

要約 スキルは、順次意思決定のために確立された効果的な時間的抽象化であり、長期式 … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Uncertainty Quantification for Language Models: A Suite of Black-Box, White-Box, LLM Judge, and Ensemble Scorers

要約 幻覚は、大規模な言語モデル(LLMS)の持続的な問題です。 これらのモデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

SWE-smith: Scaling Data for Software Engineering Agents

要約 ソフトウェアエンジニアリングの言語モデル(LMS)の最近の進歩にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SE | コメントする

How Real Are Synthetic Therapy Conversations? Evaluating Fidelity in Prolonged Exposure Dialogues

要約 ヘルスケアにおける合成データの採用の増大は、プライバシーの懸念、現実世界の … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.CY, cs.HC, I.2.7 | コメントする

DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition

要約 Lean 4で証明する正式な定理用に設計されたオープンソースの大型言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Masked Generative Priors Improve World Models Sequence Modelling Capabilities

要約 Deep Rehnection Learning(RL)は、複雑な環境で人 … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

A Library for Learning Neural Operators

要約 オペレーター学習用のオープンソースPythonライブラリであるNeural … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする