-
最近の投稿
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
- OrbitGrasp: $SE(3)$-Equivariant Grasp Learning
- M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
- Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment
- Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing
-
最近のコメント
表示できるコメントはありません。 cs.AI (28126) cs.CL (21249) cs.CR (2197) cs.CV (34799) cs.LG (32858) cs.RO (16174) cs.SY (2496) eess.IV (4244) eess.SY (2490) stat.ML (4401)
月別アーカイブ: 2023年8月
Prompt2Model: Generating Deployable Models from Natural Language Instructions
要約 大規模言語モデル (LLM) を使用すると、今日のシステム ビルダーは、タ … 続きを読む
カテゴリー: cs.CL
Prompt2Model: Generating Deployable Models from Natural Language Instructions はコメントを受け付けていません
Aligning Language Models with Offline Reinforcement Learning from Human Feedback
要約 人間の好みから学習することは、言語モデル (LM) が人間のニーズと社会的 … 続きを読む
Layer-wise Feedback Propagation
要約 この論文では、説明可能性、特にレイヤーワイズ関連性伝播 (LRP) を利用 … 続きを読む
FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering
要約 ナレッジ ベースの質問応答 (KBQA) は、ナレッジ ベース内のエンティ … 続きを読む
MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library
要約 マルチエージェント強化学習 (MARL) の分野で研究者が直面している重要 … 続きを読む
Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers
要約 分類を実行する機械学習 (ML) アルゴリズムは、誤ったクラスを予測し、誤 … 続きを読む
Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference
要約 トランスフォーマーに基づく大規模言語モデル (LLM) は近年大幅な進歩を … 続きを読む
Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning
要約 自動運転車 (AV) の運転スタイルとは、自動運転車 (AV) がどのよう … 続きを読む
Stabilizing RNN Gradients through Pre-training
要約 学習の多くの理論は、深さまたは時間に伴う指数関数的な増加による勾配の変動を … 続きを読む
Learning to Search in Task and Motion Planning with Streams
要約 ロボット工学におけるタスクおよび動作計画の問題は、離散タスク変数に対する記 … 続きを読む