月別アーカイブ: 2023年2月

Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data

投稿日: 2023年2月27日作成者: jarxiv

要約思考連鎖プロンプティング (CoT) は、大規模言語モデル (LLM) の … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Improving Massively Multilingual ASR With Auxiliary CTC Objectives

投稿日: 2023年2月27日作成者: jarxiv

要約多言語自動音声認識 (ASR) モデルにより、音声テクノロジの使いやすさが … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

AC2C: Adaptively Controlled Two-Hop Communication for Multi-Agent Reinforcement Learning

投稿日: 2023年2月27日作成者: jarxiv

要約協調型マルチエージェント強化学習 (MARL) におけるコミュニケーション … 続きを読む →

カテゴリー: cs.AI, cs.MA | コメントを受け付けていません

schlably: A Python Framework for Deep Reinforcement Learning Based Scheduling Experiments

投稿日: 2023年2月27日作成者: jarxiv

要約深層強化学習 (DRL) ベースの生産スケジューリング (PS) に関する … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Model-Based Uncertainty in Value Functions

投稿日: 2023年2月27日作成者: jarxiv

要約モデルベースの強化学習で期待される累積報酬に対する不確実性を定量化する問題 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Trust Your $\nabla$: Gradient-based Intervention Targeting for Causal Discovery

投稿日: 2023年2月27日作成者: jarxiv

要約データから因果構造を推測することは、科学において根本的に重要な挑戦的なタス … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ME, stat.ML | コメントを受け付けていません

HUST bearing: a practical dataset for ball bearing fault diagnosis

投稿日: 2023年2月27日作成者: jarxiv

要約この作業では、HUST ベアリングという名前の実用的なデータセットを紹介し … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.SP | コメントを受け付けていません

Why Target Networks Stabilise Temporal Difference Methods

投稿日: 2023年2月27日作成者: jarxiv

要約深層強化学習の最近の成功に不可欠なのは、マルコフ決定プロセスでのポリシー評 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

SantaCoder: don’t reach for the stars!

投稿日: 2023年2月27日作成者: jarxiv

要約 BigCode プロジェクトは、コードの大規模な言語モデルの責任ある開発に … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SE | コメントを受け付けていません

PIFON-EPT: MR-Based Electrical Property Tomography Using Physics-Informed Fourier Networks

投稿日: 2023年2月27日作成者: jarxiv

要約 \textit{目的:} この論文では、電気的特性 (EP) トモグラフィ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

月別アーカイブ: 2023年2月

Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data

Improving Massively Multilingual ASR With Auxiliary CTC Objectives

AC2C: Adaptively Controlled Two-Hop Communication for Multi-Agent Reinforcement Learning

schlably: A Python Framework for Deep Reinforcement Learning Based Scheduling Experiments

Model-Based Uncertainty in Value Functions

Trust Your $\nabla$: Gradient-based Intervention Targeting for Causal Discovery

HUST bearing: a practical dataset for ball bearing fault diagnosis

Why Target Networks Stabilise Temporal Difference Methods

SantaCoder: don’t reach for the stars!

PIFON-EPT: MR-Based Electrical Property Tomography Using Physics-Informed Fourier Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー