-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Policy Space Response Oracles: A Survey
要約 ゲーム理論は、複数の意思決定者間の相互作用を研究する数学的方法を提供します … 続きを読む
Exploring and steering the moral compass of Large Language Models
要約 大規模言語モデル (LLM) は、さまざまな分野にわたって自動化と意思決定 … 続きを読む
Prompt Optimization with Human Feedback
要約 大規模言語モデル (LLM) は、さまざまなタスクで顕著なパフォーマンスを … 続きを読む
Why Transformers Need Adam: A Hessian Perspective
要約 『トランスフォーマー』ではSGDのパフォーマンスがアダムより大幅に劣ってい … 続きを読む
Rethinking Transformers in Solving POMDPs
要約 現実世界のシナリオにおける強化学習 (RL) などの逐次意思決定アルゴリズ … 続きを読む
Generating Likely Counterfactuals Using Sum-Product Networks
要約 AI システムによる意思決定の説明可能性は、最近の規制とユーザーの需要の両 … 続きを読む
A Theoretical Framework for Partially Observed Reward-States in RLHF
要約 ヒューマン フィードバックからの強化学習 (RLHF) の展開の拡大には、 … 続きを読む
BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction
要約 自動運転システムの安全性を効率的に検証するには、交通エージェント間の現実的 … 続きを読む
MindMerger: Efficient Boosting LLM Reasoning in non-English Languages
要約 推論機能は大規模言語モデル (LLM) にとって重要ですが、英語と英語以外 … 続きを読む
Transformers Can Do Arithmetic with the Right Embeddings
要約 算術タスクにおけるトランスフォーマーのパフォーマンスの低下は、大きな桁範囲 … 続きを読む