月別アーカイブ: 2025年2月

Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning

投稿日: 2025年2月26日作成者: jarxiv

要約この研究では、計算冗長性と長いCOTでの報酬の割り当ての遅延によって引き起 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities

投稿日: 2025年2月26日作成者: jarxiv

要約検索は、さまざまなドメインにわたる問題解決において根本的な役割を果たし、ほ … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

The Gradient of Algebraic Model Counting

投稿日: 2025年2月26日作成者: jarxiv

要約代数モデルカウントは、セミリングを悪用することにより、論理式に関する多くの … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

AgentRM: Enhancing Agent Generalization with Reward Modeling

投稿日: 2025年2月26日作成者: jarxiv

要約既存のLLMベースのエージェントは、開催されたタスクで強力なパフォーマンス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting

投稿日: 2025年2月26日作成者: jarxiv

要約時系列の予測は、経済学、エネルギー、ヘルスケア、交通管理など、多様な分野で … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Utility-inspired Reward Transformations Improve Reinforcement Learning Training of Language Models

投稿日: 2025年2月26日作成者: jarxiv

要約強化学習フィードバックを使用して大規模な言語モデル（LLM）をトレーニング … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, econ.GN, q-fin.EC | コメントを受け付けていません

Comparative Analysis of MDL-VAE vs. Standard VAE on 202 Years of Gynecological Data

投稿日: 2025年2月26日作成者: jarxiv

要約この研究では、高次元の婦人科データを再構築するための標準自動エンコーダーに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks

投稿日: 2025年2月26日作成者: jarxiv

要約安全で整列したエージェントAIシステムを開発するには、包括的な経験的テスト … 続きを読む →

カテゴリー: cs.AI, cs.MA | コメントを受け付けていません

PyEvalAI: AI-assisted evaluation of Jupyter Notebooks for immediate personalized feedback

投稿日: 2025年2月26日作成者: jarxiv

要約 STEMコースでの学生の割り当てのグレーディングは、家庭教師にとって面倒で … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning

投稿日: 2025年2月26日作成者: jarxiv

要約推論は、大規模な言語モデル（LLM）の基本的な能力であり、複雑な問題を理解 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

月別アーカイブ: 2025年2月

Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning

How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities

The Gradient of Algebraic Model Counting

AgentRM: Enhancing Agent Generalization with Reward Modeling

TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting

Utility-inspired Reward Transformations Improve Reinforcement Learning Training of Language Models

Comparative Analysis of MDL-VAE vs. Standard VAE on 202 Years of Gynecological Data

From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks

PyEvalAI: AI-assisted evaluation of Jupyter Notebooks for immediate personalized feedback

TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー