-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
投稿者「jarxiv」のアーカイブ
U-shaped and Inverted-U Scaling behind Emergent Abilities of Large Language Models
要約 大規模言語モデル (LLM) は、一部の下流タスクで新たな能力を発揮するこ … 続きを読む
From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows
要約 この論文は、香港の大学が ChatGPT を禁止していた時代と、ChatG … 続きを読む
CreDes: Causal Reasoning Enhancement and Dual-End Searching for Solving Long-Range Reasoning Problems using LLMs
要約 大規模言語モデル (LLM) では、因果的幻覚と巨大な検索空間が部分的に原 … 続きを読む
Performant, Memory Efficient and Scalable Multi-Agent Reinforcement Learning
要約 マルチエージェント強化学習 (MARL) の分野がより大規模で複雑な環境に … 続きを読む
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models
要約 ChatGPT や GPT-4 などの大規模言語モデル (LLM) の論理 … 続きを読む
Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective
要約 高品質で特定のデータが不足しているため、合成データは大規模言語モデル (L … 続きを読む
Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting
要約 バッチ プロンプトは、計算効率の向上を目的として、複数の入力を同時に処理す … 続きを読む
Evaluating Robustness of Reward Models for Mathematical Reasoning
要約 報酬モデルは、ヒューマン フィードバック (RLHF) システムからの強化 … 続きを読む
Test Time Learning for Time Series Forecasting
要約 時系列予測は、マルチヘッド アテンションなどのトークン予測メカニズムの導入 … 続きを読む