月別アーカイブ: 2023年8月

Prompt2Model: Generating Deployable Models from Natural Language Instructions

投稿日: 2023年8月24日作成者: jarxiv

要約大規模言語モデル (LLM) を使用すると、今日のシステムビルダーは、タ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Aligning Language Models with Offline Reinforcement Learning from Human Feedback

投稿日: 2023年8月24日作成者: jarxiv

要約人間の好みから学習することは、言語モデル (LM) が人間のニーズと社会的 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Layer-wise Feedback Propagation

投稿日: 2023年8月24日作成者: jarxiv

要約この論文では、説明可能性、特にレイヤーワイズ関連性伝播 (LRP) を利用 … 続きを読む →

カテゴリー: 68T05, cs.AI, cs.LG, cs.NE | コメントを受け付けていません

FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering

投稿日: 2023年8月24日作成者: jarxiv

要約ナレッジベースの質問応答 (KBQA) は、ナレッジベース内のエンティ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library

投稿日: 2023年8月24日作成者: jarxiv

要約マルチエージェント強化学習 (MARL) の分野で研究者が直面している重要 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.MA | コメントを受け付けていません

Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers

投稿日: 2023年8月24日作成者: jarxiv

要約分類を実行する機械学習 (ML) アルゴリズムは、誤ったクラスを予測し、誤 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SE, I.2 | コメントを受け付けていません

Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference

投稿日: 2023年8月24日作成者: jarxiv

要約トランスフォーマーに基づく大規模言語モデル (LLM) は近年大幅な進歩を … 続きを読む →

カテゴリー: cs.AI, cs.AR, cs.LG | コメントを受け付けていません

Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning

投稿日: 2023年8月24日作成者: jarxiv

要約自動運転車 (AV) の運転スタイルとは、自動運転車 (AV) がどのよう … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Stabilizing RNN Gradients through Pre-training

投稿日: 2023年8月24日作成者: jarxiv

要約学習の多くの理論は、深さまたは時間に伴う指数関数的な増加による勾配の変動を … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Learning to Search in Task and Motion Planning with Streams

投稿日: 2023年8月24日作成者: jarxiv

要約ロボット工学におけるタスクおよび動作計画の問題は、離散タスク変数に対する記 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

月別アーカイブ: 2023年8月

Prompt2Model: Generating Deployable Models from Natural Language Instructions

Aligning Language Models with Offline Reinforcement Learning from Human Feedback

Layer-wise Feedback Propagation

FlexKBQA: A Flexible LLM-Powered Framework for Few-Shot Knowledge Base Question Answering

MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library

Ensembling Uncertainty Measures to Improve Safety of Black-Box Classifiers

Pre-gated MoE: An Algorithm-System Co-Design for Fast and Scalable Mixture-of-Expert Inference

Identifying Reaction-Aware Driving Styles of Stochastic Model Predictive Controlled Vehicles by Inverse Reinforcement Learning

Stabilizing RNN Gradients through Pre-training

Learning to Search in Task and Motion Planning with Streams

最近の投稿

最近のコメント

アーカイブ

カテゴリー