cs.AI」カテゴリーアーカイブ

Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming

要約 大規模な言語モデル駆動型(LLM駆動型)人工知能(AI)ボットが人気を博し … 続きを読む

カテゴリー: cs.AI | Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming はコメントを受け付けていません

MIB: A Mechanistic Interpretability Benchmark

要約 新しい機械的解釈可能性の方法が実際の改善を達成するかどうかをどのように知る … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MIB: A Mechanistic Interpretability Benchmark はコメントを受け付けていません

HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization

要約 大規模な言語モデル(LLM)は推論とエージェントベースの問題解決において大 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | HeuriGym: An Agentic Benchmark for LLM-Crafted Heuristics in Combinatorial Optimization はコメントを受け付けていません

Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures

要約 インテリジェントな輸送システム(ITS)の複雑さの増加により、エッジサーバ … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.MA | Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures はコメントを受け付けていません

Automated Capability Discovery via Foundation Model Self-Exploration

要約 基礎モデルは汎用アシスタントになり、Webスケールデータのトレーニングを通 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Automated Capability Discovery via Foundation Model Self-Exploration はコメントを受け付けていません

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

要約 テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む

カテゴリー: cs.AI, cs.LG | Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction はコメントを受け付けていません

Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation

要約 Bipartiteランキングは、単一のバイナリターゲットラベルに対してRO … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG, stat.ML | Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation はコメントを受け付けていません

$τ^2$-Bench: Evaluating Conversational Agents in a Dual-Control Environment

要約 会話型AIエージェントの既存のベンチマークは、AIエージェントのみがツール … 続きを読む

カテゴリー: cs.AI, cs.CL | $τ^2$-Bench: Evaluating Conversational Agents in a Dual-Control Environment はコメントを受け付けていません

When Two LLMs Debate, Both Think They’ll Win

要約 LLMSは反対に直面したときに自信を正確に調整できますか? 静的な事実ベー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | When Two LLMs Debate, Both Think They’ll Win はコメントを受け付けていません

PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation

要約 大規模な言語モデル(LLM)の推論と検索機能を評価するためには、高品質のベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation はコメントを受け付けていません