cs.LG」カテゴリーアーカイブ

West-of-N: Synthetic Preferences for Self-Improving Reward Models

要約 言語モデルの調整におけるヒューマン フィードバックからの強化学習 (RLH … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | West-of-N: Synthetic Preferences for Self-Improving Reward Models はコメントを受け付けていません

Detection of Human and Machine-Authored Fake News in Urdu

要約 ソーシャルメディアの台頭によりフェイクニュースの拡散が増幅され、現在ではC … 続きを読む

カテゴリー: cs.CL, cs.LG | Detection of Human and Machine-Authored Fake News in Urdu はコメントを受け付けていません

A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health

要約 Restless Multi-armed Bandits (RMAB) は … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health はコメントを受け付けていません

DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents

要約 オンデバイス制御エージェント (特にモバイル デバイス上) は、モバイル … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.SY, eess.SY | DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents はコメントを受け付けていません

Human-like Episodic Memory for Infinite Context LLMs

要約 大規模言語モデル (LLM) は顕著な機能を示していますが、依然として広範 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, q-bio.NC | Human-like Episodic Memory for Infinite Context LLMs はコメントを受け付けていません

$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation

要約 大規模言語モデルを使用して高品質のチャートを生成するには、データが限られて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | $C^2$: Scalable Auto-Feedback for LLM-based Chart Generation はコメントを受け付けていません

EVOTER: Evolution of Transparent Explainable Rule-sets

要約 ほとんどの AI システムは、与えられた入力に対して適切な出力を生成するブ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | EVOTER: Evolution of Transparent Explainable Rule-sets はコメントを受け付けていません

Impact of Leakage on Data Harmonization in Machine Learning Pipelines in Class Imbalance Across Sites

要約 機械学習 (ML) モデルは大規模なデータセットから恩恵を受けます。 生物 … 続きを読む

カテゴリー: cs.AI, cs.LG | Impact of Leakage on Data Harmonization in Machine Learning Pipelines in Class Imbalance Across Sites はコメントを受け付けていません

Deep learning-based identification of patients at increased risk of cancer using routine laboratory markers

要約 がんの早期スクリーニングにより生存率が向上し、診断が遅れて患者が集中的で費 … 続きを読む

カテゴリー: cs.AI, cs.LG | Deep learning-based identification of patients at increased risk of cancer using routine laboratory markers はコメントを受け付けていません

Graph Diffusion Policy Optimization

要約 最近の研究では、下流の目的に合わせた拡散モデルの最適化において大きな進歩が … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG | Graph Diffusion Policy Optimization はコメントを受け付けていません