cs.LG」カテゴリーアーカイブ

DEPT: Decoupled Embeddings for Pre-training Language Models

要約 言語モデルのプリトレーニングでは、幅広いデータ混合物を使用して、ドメインと … 続きを読む

カテゴリー: cs.CL, cs.LG | DEPT: Decoupled Embeddings for Pre-training Language Models はコメントを受け付けていません

Can RLHF be More Efficient with Imperfect Reward Models? A Policy Coverage Perspective

要約 サンプルの効率は、人間のフィードバック(RLHF)からのオンライン強化学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Can RLHF be More Efficient with Imperfect Reward Models? A Policy Coverage Perspective はコメントを受け付けていません

SpeakEasy: Enhancing Text-to-Speech Interactions for Expressive Content Creation

要約 初心者のコンテンツクリエイターは、多くの場合、ソーシャルメディアビデオの表 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.LG | SpeakEasy: Enhancing Text-to-Speech Interactions for Expressive Content Creation はコメントを受け付けていません

Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning

要約 複雑な問題を解決するための効率的なアルゴリズムを発見することは、数学とコン … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning はコメントを受け付けていません

The Right Time Matters: Data Arrangement Affects Zero-Shot Generalization in Instruction Tuning

要約 アライメントテクニックの理解は、指導の調整によってもたらされるゼロショット … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Right Time Matters: Data Arrangement Affects Zero-Shot Generalization in Instruction Tuning はコメントを受け付けていません

Interpretable Style Takagi-Sugeno-Kang Fuzzy Clustering

要約 クラスタリングは、データの潜在的な知識を調査するための効率的で不可欠な手法 … 続きを読む

カテゴリー: cs.AI, cs.LG | Interpretable Style Takagi-Sugeno-Kang Fuzzy Clustering はコメントを受け付けていません

A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks

要約 この論文では、主要な深部補強学習方法の新しいバリエーションである近位政策最 … 続きを読む

カテゴリー: cs.AI, cs.LG, G.1.6 | A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks はコメントを受け付けていません

Addressing Label Leakage in Knowledge Tracing Models

要約 知識トレース(KT)は、インテリジェントな個別指導システムの学習項目に関す … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG | Addressing Label Leakage in Knowledge Tracing Models はコメントを受け付けていません

RLBayes: a Bayesian Network Structure Learning Algorithm via Reinforcement Learning-Based Search Strategy

要約 ベイジアンネットワーク(BN)のスコアベースの構造学習は、BNモデルを学習 … 続きを読む

カテゴリー: cs.AI, cs.LG | RLBayes: a Bayesian Network Structure Learning Algorithm via Reinforcement Learning-Based Search Strategy はコメントを受け付けていません

Attention-Based Multi-Scale Temporal Fusion Network for Uncertain-Mode Fault Diagnosis in Multimode Processes

要約 マルチモードプロセスにおける障害診断は、複数のモードで産業システムの安全な … 続きを読む

カテゴリー: cs.AI, cs.LG | Attention-Based Multi-Scale Temporal Fusion Network for Uncertain-Mode Fault Diagnosis in Multimode Processes はコメントを受け付けていません