-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
投稿者「jarxiv」のアーカイブ
Learning Dynamics of LLM Finetuning
要約 特定のトレーニング サンプルの学習が他のサンプルのモデルの予測にどのような … 続きを読む
Mimicking Human Intuition: Cognitive Belief-Driven Q-Learning
要約 強化学習は、堅牢性と説明可能性に関連するさまざまな環境で課題に直面します。 … 続きを読む
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP
要約 医療の進歩により、患者中心のアプローチ、特にセルフケアと患者教育に焦点が移 … 続きを読む
Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment
要約 人工知能における整合性は、モデルの応答と人間の好みおよび価値観の間の一貫性 … 続きを読む
Towards Privacy-Preserving Relational Data Synthesis via Probabilistic Relational Models
要約 確率的リレーショナル モデルは、一次論理と確率的モデルを組み合わせる十分に … 続きを読む
Scaling Optimal LR Across Token Horizons
要約 最先端の LLM は、モデル サイズ、データセット サイズ、クラスター サ … 続きを読む
WatChat: Explaining perplexing programs by debugging mental models
要約 多くの場合、プログラムの予期しない動作の適切な説明は、プログラマのコードの … 続きを読む
DeFine: Enhancing LLM Decision-Making with Factor Profiles and Analogical Reasoning
要約 LLM は、長い文脈を推論し、重要な要素を特定する能力があるため、意思決定 … 続きを読む
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets
要約 我々は、アーベル群の推論タスク(例:モジュラー加算)で訓練された、二次活性 … 続きを読む