cs.LG」カテゴリーアーカイブ

TensorLLM: Tensorising Multi-Head Attention for Enhanced Reasoning and Compression in LLMs

要約 大規模な言語モデル(LLM)の推論能力は、重量を構造的に除去することで改善 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning

要約 AIの進行は評価の質によってボトルネックされており、強力なLLM As-A … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Simple and Provable Scaling Laws for the Test-Time Compute of Large Language Models

要約 大規模な言語モデル(LLM)のテスト時間計算のために証明可能なスケーリング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation

要約 反事実的な例は、モデルを改善するための貴重なデータとして、およびモデルの行 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

要約 大規模な言語モデル(LLM)が広くアクセスできるようになると、現実世界の使 … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG | コメントする

Parallel Scaling Law for Language Models

要約 パラメーター(パラメータースケーリング)または出力トークン(推論時間スケー … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

SceneGenAgent: Precise Industrial Scene Generation with Coding Agent

要約 産業シーンのモデリングは、産業製造のシミュレーションに不可欠です。 大規模 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | コメントする

RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs

要約 このペーパーでは、実際のユーザーインタラクションデータが利用できない場合、 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Optimizing Power Grid Topologies with Reinforcement Learning: A Survey of Methods and Challenges

要約 再生可能エネルギー源の統合の増加と、より適応的な制御戦略の必要性により、電 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SY, eess.SY, stat.ML | コメントする

Towards Graph Foundation Models: Training on Knowledge Graphs Enables Transferability to General Graphs

要約 大規模な言語モデルの成功に触発されて、さまざまなドメインで多様なダウンスト … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする