-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年8月
Prompt2Model: Generating Deployable Models from Natural Language Instructions
要約 大規模言語モデル (LLM) を使用すると、今日のシステム ビルダーは、タ … 続きを読む
カテゴリー: cs.CL
Prompt2Model: Generating Deployable Models from Natural Language Instructions はコメントを受け付けていません
Aligning Language Models with Offline Reinforcement Learning from Human Feedback
要約 人間の好みから学習することは、言語モデル (LM) が人間のニーズと社会的 … 続きを読む
Layer-wise Feedback Propagation
要約 この論文では、説明可能性、特にレイヤーワイズ関連性伝播 (LRP) を利用 … 続きを読む
FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering
要約 ナレッジ ベースの質問応答 (KBQA) は、ナレッジ ベース内のエンティ … 続きを読む
MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library
要約 マルチエージェント強化学習 (MARL) の分野で研究者が直面している重要 … 続きを読む
Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers
要約 分類を実行する機械学習 (ML) アルゴリズムは、誤ったクラスを予測し、誤 … 続きを読む
Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference
要約 トランスフォーマーに基づく大規模言語モデル (LLM) は近年大幅な進歩を … 続きを読む
Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning
要約 自動運転車 (AV) の運転スタイルとは、自動運転車 (AV) がどのよう … 続きを読む
Stabilizing RNN Gradients through Pre-training
要約 学習の多くの理論は、深さまたは時間に伴う指数関数的な増加による勾配の変動を … 続きを読む
Learning to Search in Task and Motion Planning with Streams
要約 ロボット工学におけるタスクおよび動作計画の問題は、離散タスク変数に対する記 … 続きを読む