-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective
要約 高品質で特定のデータが不足しているため、合成データは大規模言語モデル (L … 続きを読む
Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting
要約 バッチ プロンプトは、計算効率の向上を目的として、複数の入力を同時に処理す … 続きを読む
Evaluating Robustness of Reward Models for Mathematical Reasoning
要約 報酬モデルは、ヒューマン フィードバック (RLHF) システムからの強化 … 続きを読む
Learning Dynamics of LLM Finetuning
要約 特定のトレーニング サンプルの学習が他のサンプルのモデルの予測にどのような … 続きを読む
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP
要約 医療の進歩により、患者中心のアプローチ、特にセルフケアと患者教育に焦点が移 … 続きを読む
Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment
要約 人工知能における整合性は、モデルの応答と人間の好みおよび価値観の間の一貫性 … 続きを読む
Scaling Optimal LR Across Token Horizons
要約 最先端の LLM は、モデル サイズ、データセット サイズ、クラスター サ … 続きを読む
DeFine: Enhancing LLM Decision-Making with Factor Profiles and Analogical Reasoning
要約 LLM は、長い文脈を推論し、重要な要素を特定する能力があるため、意思決定 … 続きを読む
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets
要約 我々は、アーベル群の推論タスク(例:モジュラー加算)で訓練された、二次活性 … 続きを読む