月別アーカイブ: 2025年2月

Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning

要約 この研究では、計算冗長性と長いCOTでの報酬の割り当ての遅延によって引き起 … 続きを読む

カテゴリー: cs.AI, cs.LG | Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning はコメントを受け付けていません

How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities

要約 検索は、さまざまなドメインにわたる問題解決において根本的な役割を果たし、ほ … 続きを読む

カテゴリー: cs.AI | How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities はコメントを受け付けていません

The Gradient of Algebraic Model Counting

要約 代数モデルカウントは、セミリングを悪用することにより、論理式に関する多くの … 続きを読む

カテゴリー: cs.AI, cs.LG | The Gradient of Algebraic Model Counting はコメントを受け付けていません

AgentRM: Enhancing Agent Generalization with Reward Modeling

要約 既存のLLMベースのエージェントは、開催されたタスクで強力なパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AgentRM: Enhancing Agent Generalization with Reward Modeling はコメントを受け付けていません

TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting

要約 時系列の予測は、経済学、エネルギー、ヘルスケア、交通管理など、多様な分野で … 続きを読む

カテゴリー: cs.AI, cs.LG | TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting はコメントを受け付けていません

Utility-inspired Reward Transformations Improve Reinforcement Learning Training of Language Models

要約 強化学習フィードバックを使用して大規模な言語モデル(LLM)をトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, econ.GN, q-fin.EC | Utility-inspired Reward Transformations Improve Reinforcement Learning Training of Language Models はコメントを受け付けていません

Comparative Analysis of MDL-VAE vs. Standard VAE on 202 Years of Gynecological Data

要約 この研究では、高次元の婦人科データを再構築するための標準自動エンコーダーに … 続きを読む

カテゴリー: cs.AI, cs.LG | Comparative Analysis of MDL-VAE vs. Standard VAE on 202 Years of Gynecological Data はコメントを受け付けていません

From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks

要約 安全で整列したエージェントAIシステムを開発するには、包括的な経験的テスト … 続きを読む

カテゴリー: cs.AI, cs.MA | From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks はコメントを受け付けていません

PyEvalAI: AI-assisted evaluation of Jupyter Notebooks for immediate personalized feedback

要約 STEMコースでの学生の割り当てのグレーディングは、家庭教師にとって面倒で … 続きを読む

カテゴリー: cs.AI | PyEvalAI: AI-assisted evaluation of Jupyter Notebooks for immediate personalized feedback はコメントを受け付けていません

TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning

要約 推論は、大規模な言語モデル(LLM)の基本的な能力であり、複雑な問題を理解 … 続きを読む

カテゴリー: cs.AI, cs.CL | TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning はコメントを受け付けていません