-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Average Reward Reinforcement Learning for Omega-Regular and Mean-Payoff Objectives
要約 補強学習(RL)の最近の進歩により、エージェントの動作を形成する報酬機能の … 続きを読む
カテゴリー: cs.AI
Average Reward Reinforcement Learning for Omega-Regular and Mean-Payoff Objectives はコメントを受け付けていません
A Unified Theoretical Analysis of Private and Robust Offline Alignment: from RLHF to DPO
要約 この論文では、プライバシーと敵対的な腐敗に対する堅牢性との相互作用に焦点を … 続きを読む
Fine-tuning Large Language Models for Entity Matching
要約 生成大規模な言語モデル(LLMS)は、ゼロショットのパフォーマンスが高く、 … 続きを読む
Causal Predictive Optimization and Generation for Business AI
要約 販売プロセスには、販売機能がリードまたは機会を顧客に変換し、より多くの製品 … 続きを読む
Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities
要約 多言語の大規模な言語モデル(MLLM)での暗記に関する最初の包括的な研究を … 続きを読む
Probing Semantic Routing in Large Mixture-of-Expert Models
要約 過去1年間で、大規模な(> 100Bパラメーター)混合物(MOE)モデルが … 続きを読む
DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning
要約 大規模な言語モデル(LLM)は、大規模なデータセットに関する広範なトレーニ … 続きを読む
Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses
要約 大規模な言語モデル(LLMS)は、チャットボットからエージェントシステムに … 続きを読む
HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement
要約 正式な方法は、厳格な数学的証拠を通じて重要なシステムの信頼性を検証するため … 続きを読む
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec
要約 個別の音声トークンは、言語モデルベースの音声生成に強い可能性を示しています … 続きを読む