-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
月別アーカイブ: 2023年8月
Prompt2Model: Generating Deployable Models from Natural Language Instructions
要約 大規模言語モデル (LLM) を使用すると、今日のシステム ビルダーは、タ … 続きを読む
カテゴリー: cs.CL
Prompt2Model: Generating Deployable Models from Natural Language Instructions はコメントを受け付けていません
Aligning Language Models with Offline Reinforcement Learning from Human Feedback
要約 人間の好みから学習することは、言語モデル (LM) が人間のニーズと社会的 … 続きを読む
Layer-wise Feedback Propagation
要約 この論文では、説明可能性、特にレイヤーワイズ関連性伝播 (LRP) を利用 … 続きを読む
FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering
要約 ナレッジ ベースの質問応答 (KBQA) は、ナレッジ ベース内のエンティ … 続きを読む
MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library
要約 マルチエージェント強化学習 (MARL) の分野で研究者が直面している重要 … 続きを読む
Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers
要約 分類を実行する機械学習 (ML) アルゴリズムは、誤ったクラスを予測し、誤 … 続きを読む
Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference
要約 トランスフォーマーに基づく大規模言語モデル (LLM) は近年大幅な進歩を … 続きを読む
Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning
要約 自動運転車 (AV) の運転スタイルとは、自動運転車 (AV) がどのよう … 続きを読む
Stabilizing RNN Gradients through Pre-training
要約 学習の多くの理論は、深さまたは時間に伴う指数関数的な増加による勾配の変動を … 続きを読む
Learning to Search in Task and Motion Planning with Streams
要約 ロボット工学におけるタスクおよび動作計画の問題は、離散タスク変数に対する記 … 続きを読む