cs.LG」カテゴリーアーカイブ

A Critical Look At Tokenwise Reward-Guided Text Generation

要約 大規模な言語モデル(LLMS)は、人間のフィードバック(RLHF)からのい … 続きを読む

カテゴリー: cs.CL, cs.LG | A Critical Look At Tokenwise Reward-Guided Text Generation はコメントを受け付けていません

DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders

要約 線形再発性ニューラルネットワーク(線形RNN)は、シーケンスモデリングのた … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders はコメントを受け付けていません

Enhancing Multilingual LLM Pretraining with Model-Based Data Selection

要約 データセットのキュレーションは、強力な大規模な言語モデル(LLM)パフォー … 続きを読む

カテゴリー: cs.CL, cs.LG | Enhancing Multilingual LLM Pretraining with Model-Based Data Selection はコメントを受け付けていません

From Markov to Laplace: How Mamba In-Context Learns Markov Chains

要約 トランスベースの言語モデルはこれまでAI革命を推進してきましたが、その計算 … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, math.IT | From Markov to Laplace: How Mamba In-Context Learns Markov Chains はコメントを受け付けていません

Is Deep Learning finally better than Decision Trees on Tabular Data?

要約 表形式データは、多くの実際のアプリケーションでの汎用性と使いやすさのために … 続きを読む

カテゴリー: cs.AI, cs.LG | Is Deep Learning finally better than Decision Trees on Tabular Data? はコメントを受け付けていません

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

要約 数学的問題のための自動化された正式な証明生成で最先端の(SOTA)パフォー … 続きを読む

カテゴリー: cs.AI, cs.LG | Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving はコメントを受け付けていません

Dynamic Reinforcement Learning for Actors

要約 この論文で提案されている動的強化学習(動的RL)は、各瞬間にアクター(アク … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE | Dynamic Reinforcement Learning for Actors はコメントを受け付けていません

Do Large Language Models Reason Causally Like Us? Even Better?

要約 因果推論は、知性のコアコンポーネントです。 大規模な言語モデル(LLM)は … 続きを読む

カテゴリー: cs.AI, cs.LG | Do Large Language Models Reason Causally Like Us? Even Better? はコメントを受け付けていません

Forget the Data and Fine-Tuning! Just Fold the Network to Compress

要約 モデル折りたたみを導入します。これは、層全体で構造的に類似したニューロンを … 続きを読む

カテゴリー: cs.AI, cs.LG | Forget the Data and Fine-Tuning! Just Fold the Network to Compress はコメントを受け付けていません

Shield Synthesis for LTL Modulo Theories

要約 近年、機械学習(ML)モデルは、さまざまなドメインで顕著な成功を収めていま … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.LO, cs.RO | Shield Synthesis for LTL Modulo Theories はコメントを受け付けていません