cs.AI」カテゴリーアーカイブ

Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Language Models

要約 このペーパーでは、入力長の拡張が大規模言語モデル (LLM) の機能に与え … 続きを読む

カテゴリー: cs.AI, cs.CL | Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Language Models はコメントを受け付けていません

Uncovering Layer-Dependent Activation Sparsity Patterns in ReLU Transformers

要約 これまでの研究では、ReLU Transformers 内の MLP が高 … 続きを読む

カテゴリー: cs.AI, cs.LG | Uncovering Layer-Dependent Activation Sparsity Patterns in ReLU Transformers はコメントを受け付けていません

Agent Lumos: Unified and Modular Training for Open-Source Language Agents

要約 クローズドソースエージェントは、特に複雑な対話型タスクにおいて、手頃な価格 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Agent Lumos: Unified and Modular Training for Open-Source Language Agents はコメントを受け付けていません

Trial and Error: Exploration-Based Trajectory Optimization for LLM Agents

要約 大規模言語モデル (LLM) は、さまざまな自律エージェント システムに不 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Trial and Error: Exploration-Based Trajectory Optimization for LLM Agents はコメントを受け付けていません

Toto: Time Series Optimized Transformer for Observability

要約 この技術レポートでは、Datadog によって開発された時系列予測のための … 続きを読む

カテゴリー: cs.AI, cs.LG | Toto: Time Series Optimized Transformer for Observability はコメントを受け付けていません

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization

要約 この研究は、大規模言語モデル (LLM) を人間の好みに合わせて調整する方 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization はコメントを受け付けていません

Vegetable Peeling: A Case Study in Constrained Dexterous Manipulation

要約 最近の研究では、特に手の中の物体の向きを変えるなど、器用な操作の問題への対 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Vegetable Peeling: A Case Study in Constrained Dexterous Manipulation はコメントを受け付けていません

Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization

要約 大規模言語モデル (LLM) の急速な進歩は、言語理解と情報処理の向上に合 … 続きを読む

カテゴリー: cs.AI, cs.CL | Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization はコメントを受け付けていません

Training on the Test Task Confounds Evaluation and Emergence

要約 私たちは、テスト タスクでのトレーニングと呼ばれる、大規模な言語モデルの評 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Training on the Test Task Confounds Evaluation and Emergence はコメントを受け付けていません

A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry

要約 超球プロトタイプ学習 (HPL) は、単位超球上でクラス プロトタイプを設 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP, stat.ML | A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry はコメントを受け付けていません