-
最近の投稿
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
- Chronoamperometry with Room-Temperature Ionic Liquids: Sub-Second Inference Techniques
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44171) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5743)
月別アーカイブ: 2024年5月
Group Robust Preference Optimization in Reward-free RLHF
要約 大規模言語モデル (LLM) を特定のタスクに適応させるには、通常、嗜好デ … 続きを読む
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs
要約 投機的デコード (SD) は、LLM 推論の大幅な高速化を実現できるため、 … 続きを読む
カテゴリー: cs.CL
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs はコメントを受け付けていません
Recurrent Drafter for Fast Speculative Decoding in Large Language Models
要約 この論文では、大規模な言語モデルを提供する効率を高めることを目的とした、投 … 続きを読む
Xwin-LM: Strong and Scalable Alignment Practice for LLMs
要約 この研究では、大規模言語モデル (LLM) 向けの調整方法の包括的なスイー … 続きを読む
カテゴリー: cs.CL
Xwin-LM: Strong and Scalable Alignment Practice for LLMs はコメントを受け付けていません
From Zero to Hero: Cold-Start Anomaly Detection
要約 チャットボットで範囲外のクエリを検出するなど、初めて異常検出システムを導入 … 続きを読む
Code Repair with LLMs gives an Exploration-Exploitation Tradeoff
要約 大規模言語モデル (LLM) を使用してソース コードを繰り返し改善および … 続きを読む
Reasoning about concepts with LLMs: Inconsistencies abound
要約 知識を要約して抽象的な概念に整理する能力は、学習と推論の鍵となります。 多 … 続きを読む
Aligning Crowd Feedback via Distributional Preference Reward Modeling
要約 深層強化学習は、大規模言語モデル (LLM) を人間の好みに合わせるために … 続きを読む
カテゴリー: cs.AI
Aligning Crowd Feedback via Distributional Preference Reward Modeling はコメントを受け付けていません
Iterative Feature Boosting for Explainable Speech Emotion Recognition
要約 音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴 … 続きを読む
Cheap Talking Algorithms
要約 戦略的情報伝達の Crawford and Sobel (1982) ゲー … 続きを読む