月別アーカイブ: 2023年8月

Prompt2Model: Generating Deployable Models from Natural Language Instructions

要約 大規模言語モデル (LLM) を使用すると、今日のシステム ビルダーは、タ … 続きを読む

カテゴリー: cs.CL | Prompt2Model: Generating Deployable Models from Natural Language Instructions はコメントを受け付けていません

Aligning Language Models with Offline Reinforcement Learning from Human Feedback

要約 人間の好みから学習することは、言語モデル (LM) が人間のニーズと社会的 … 続きを読む

カテゴリー: cs.AI, cs.CL | Aligning Language Models with Offline Reinforcement Learning from Human Feedback はコメントを受け付けていません

Layer-wise Feedback Propagation

要約 この論文では、説明可能性、特にレイヤーワイズ関連性伝播 (LRP) を利用 … 続きを読む

カテゴリー: 68T05, cs.AI, cs.LG, cs.NE | Layer-wise Feedback Propagation はコメントを受け付けていません

FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering

要約 ナレッジ ベースの質問応答 (KBQA) は、ナレッジ ベース内のエンティ … 続きを読む

カテゴリー: cs.AI, cs.CL | FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering はコメントを受け付けていません

MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library

要約 マルチエージェント強化学習 (MARL) の分野で研究者が直面している重要 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library はコメントを受け付けていません

Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers

要約 分類を実行する機械学習 (ML) アルゴリズムは、誤ったクラスを予測し、誤 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SE, I.2 | Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers はコメントを受け付けていません

Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference

要約 トランスフォーマーに基づく大規模言語モデル (LLM) は近年大幅な進歩を … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG | Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference はコメントを受け付けていません

Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning

要約 自動運転車 (AV) の運転スタイルとは、自動運転車 (AV) がどのよう … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning はコメントを受け付けていません

Stabilizing RNN Gradients through Pre-training

要約 学習の多くの理論は、深さまたは時間に伴う指数関数的な増加による勾配の変動を … 続きを読む

カテゴリー: cs.AI, cs.LG | Stabilizing RNN Gradients through Pre-training はコメントを受け付けていません

Learning to Search in Task and Motion Planning with Streams

要約 ロボット工学におけるタスクおよび動作計画の問題は、離散タスク変数に対する記 … 続きを読む

カテゴリー: cs.AI, cs.RO | Learning to Search in Task and Motion Planning with Streams はコメントを受け付けていません