cs.LG」カテゴリーアーカイブ

HR-Bandit: Human-AI Collaborated Linear Recourse Bandit

要約 人間の医師は、患者がより効果的な治療を受けるために症状を修正できるようにす … 続きを読む

カテゴリー: cs.LG | HR-Bandit: Human-AI Collaborated Linear Recourse Bandit はコメントを受け付けていません

EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search

要約 大規模言語モデル (LLM) の計算コストが高いため、量子化、スパース化、 … 続きを読む

カテゴリー: cs.LG | EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search はコメントを受け付けていません

Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens

要約 言語モデルは多くの場合、トレーニング データセット内の過去のトークンが与え … 続きを読む

カテゴリー: cs.LG | Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens はコメントを受け付けていません

Harnessing Causality in Reinforcement Learning With Bagged Decision Times

要約 袋詰めされた決定時間を持つ問題のクラスに対する強化学習 (RL) を検討し … 続きを読む

カテゴリー: cs.LG, stat.ML | Harnessing Causality in Reinforcement Learning With Bagged Decision Times はコメントを受け付けていません

A Large Language Model-Driven Reward Design Framework via Dynamic Feedback for Reinforcement Learning

要約 大規模言語モデル (LLM) は、強化学習 (RL) タスクの報酬関数の設 … 続きを読む

カテゴリー: cs.LG | A Large Language Model-Driven Reward Design Framework via Dynamic Feedback for Reinforcement Learning はコメントを受け付けていません

Stochastic Gradient Descent Jittering for Inverse Problems: Alleviating the Accuracy-Robustness Tradeoff

要約 逆問題は、破損または摂動された測定値から目に見えないデータを再構築すること … 続きを読む

カテゴリー: cs.LG, eess.SP | Stochastic Gradient Descent Jittering for Inverse Problems: Alleviating the Accuracy-Robustness Tradeoff はコメントを受け付けていません

Decomposing The Dark Matter of Sparse Autoencoders

要約 スパース オートエンコーダ (SAE) は、言語モデルのアクティベーション … 続きを読む

カテゴリー: cs.LG | Decomposing The Dark Matter of Sparse Autoencoders はコメントを受け付けていません

Self-supervised contrastive learning performs non-linear system identification

要約 自己教師あり学習 (SSL) アプローチは、多くのタスクや領域で大きな成功 … 続きを読む

カテゴリー: cs.LG, stat.ML | Self-supervised contrastive learning performs non-linear system identification はコメントを受け付けていません

A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus

要約 自然言語推論 (NLI) は、文のペアの含意関係を認識するタスクであり、自 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus はコメントを受け付けていません

Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation

要約 モデル回答の検証可能性を確保することは、質問応答 (QA) ドメインにおけ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation はコメントを受け付けていません