-
最近の投稿
- Exploring Modular Mobility: Industry Advancements, Research Trends, and Future Directions on Modular Autonomous Vehicles
- Causal Composition Diffusion Model for Closed-loop Traffic Generation
- DRAL: Deep Reinforcement Adaptive Learning for Multi-UAVs Navigation in Unknown Indoor Environment
- Asynchronous Training of Mixed-Role Human Actors in a Partially-Observable Environment
- LMV-RPA: Large Model Voting-based Robotic Process Automation
-
最近のコメント
表示できるコメントはありません。 cs.AI (31450) cs.CL (23788) cs.CR (2442) cs.CV (37795) cs.LG (36318) cs.RO (18381) cs.SY (2817) eess.IV (4541) eess.SY (2811) stat.ML (4821)
月別アーカイブ: 2024年5月
Group Robust Preference Optimization in Reward-free RLHF
要約 大規模言語モデル (LLM) を特定のタスクに適応させるには、通常、嗜好デ … 続きを読む
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs
要約 投機的デコード (SD) は、LLM 推論の大幅な高速化を実現できるため、 … 続きを読む
カテゴリー: cs.CL
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs はコメントを受け付けていません
Recurrent Drafter for Fast Speculative Decoding in Large Language Models
要約 この論文では、大規模な言語モデルを提供する効率を高めることを目的とした、投 … 続きを読む
Xwin-LM: Strong and Scalable Alignment Practice for LLMs
要約 この研究では、大規模言語モデル (LLM) 向けの調整方法の包括的なスイー … 続きを読む
カテゴリー: cs.CL
Xwin-LM: Strong and Scalable Alignment Practice for LLMs はコメントを受け付けていません
From Zero to Hero: Cold-Start Anomaly Detection
要約 チャットボットで範囲外のクエリを検出するなど、初めて異常検出システムを導入 … 続きを読む
Code Repair with LLMs gives an Exploration-Exploitation Tradeoff
要約 大規模言語モデル (LLM) を使用してソース コードを繰り返し改善および … 続きを読む
Reasoning about concepts with LLMs: Inconsistencies abound
要約 知識を要約して抽象的な概念に整理する能力は、学習と推論の鍵となります。 多 … 続きを読む
Aligning Crowd Feedback via Distributional Preference Reward Modeling
要約 深層強化学習は、大規模言語モデル (LLM) を人間の好みに合わせるために … 続きを読む
カテゴリー: cs.AI
Aligning Crowd Feedback via Distributional Preference Reward Modeling はコメントを受け付けていません
Iterative Feature Boosting for Explainable Speech Emotion Recognition
要約 音声感情認識 (SER) では、実際の重要性を考慮せずに事前定義された特徴 … 続きを読む
Cheap Talking Algorithms
要約 戦略的情報伝達の Crawford and Sobel (1982) ゲー … 続きを読む