cs.LG」カテゴリーアーカイブ

On the Role of Speech Data in Reducing Toxicity Detection Bias

要約 テキスト毒性検出システムは、人口統計グループに言及しているサンプルに不均衡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | On the Role of Speech Data in Reducing Toxicity Detection Bias はコメントを受け付けていません

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient

要約 モデルベースの強化学習(RL)は、ほとんどのモデルのないRLアルゴリズムを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient はコメントを受け付けていません

Prototype Augmented Hypernetworks for Continual Learning

要約 継続的な学習(CL)は、事前の知識を忘れることなく一連のタスクを学ぶことを … 続きを読む

カテゴリー: cs.AI, cs.LG | Prototype Augmented Hypernetworks for Continual Learning はコメントを受け付けていません

TANTE: Time-Adaptive Operator Learning via Neural Taylor Expansion

要約 時間依存の部分微分方程式(PDE)の演算子学習は、近年急速な進歩を遂げてお … 続きを読む

カテゴリー: cs.AI, cs.LG | TANTE: Time-Adaptive Operator Learning via Neural Taylor Expansion はコメントを受け付けていません

MID-L: Matrix-Interpolated Dropout Layer with Layer-wise Neuron Selection

要約 最新のニューラルネットワークは、多くの場合、すべての入力に対してすべてのニ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | MID-L: Matrix-Interpolated Dropout Layer with Layer-wise Neuron Selection はコメントを受け付けていません

EdgeWisePersona: A Dataset for On-Device User Profiling from Natural Language Interactions

要約 このペーパーでは、スマートホーム環境でのマルチセッションの自然言語の相互作 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.LG | EdgeWisePersona: A Dataset for On-Device User Profiling from Natural Language Interactions はコメントを受け付けていません

Mergenetic: a Simple Evolutionary Model Merging Library

要約 モデルのマージにより、既存のモデルの機能を新しいモデルに組み合わせることが … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | Mergenetic: a Simple Evolutionary Model Merging Library はコメントを受け付けていません

Exploratory Diffusion Model for Unsupervised Reinforcement Learning

要約 監視されていない強化学習(URL)は、報酬のない環境で多様な状態またはスキ … 続きを読む

カテゴリー: cs.AI, cs.LG | Exploratory Diffusion Model for Unsupervised Reinforcement Learning はコメントを受け付けていません

HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages

要約 優先データセットは、人間のフィードバック(RLHF)からの強化学習を備えた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages はコメントを受け付けていません

Automatic Reward Shaping from Confounded Offline Data

要約 人工知能の重要なタスクは、不明な環境でエージェントを制御するための効果的な … 続きを読む

カテゴリー: cs.AI, cs.LG | Automatic Reward Shaping from Confounded Offline Data はコメントを受け付けていません