cs.LG」カテゴリーアーカイブ

A Lightweight Method to Disrupt Memorized Sequences in LLM

要約 言語モデルが拡大するにつれて、パフォーマンスは幅広いタスク全体で劇的に向上 … 続きを読む

カテゴリー: cs.CL, cs.LG | A Lightweight Method to Disrupt Memorized Sequences in LLM はコメントを受け付けていません

ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition

要約 地域の方言の名前付きエンティティ認識(NER)は、特にバングラのような低リ … 続きを読む

カテゴリー: cs.CL, cs.LG | ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition はコメントを受け付けていません

Hardware-Efficient Attention for Fast Decoding

要約 LLMデコードは、大きなバッチと長いコンテキストのためにボトルネックされて … 続きを読む

カテゴリー: cs.CL, cs.LG | Hardware-Efficient Attention for Fast Decoding はコメントを受け付けていません

Reinforcing General Reasoning without Verifiers

要約 最近のパラダイムは、検証可能な報酬に関するDeepSeek-R1-Zero … 続きを読む

カテゴリー: cs.CL, cs.LG | Reinforcing General Reasoning without Verifiers はコメントを受け付けていません

Subgroups Matter for Robust Bias Mitigation

要約 機械学習のための新しいバイアス緩和方法の絶え間ない開発にもかかわらず、一貫 … 続きを読む

カテゴリー: cs.AI, cs.LG | Subgroups Matter for Robust Bias Mitigation はコメントを受け付けていません

Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders

要約 多層パーセプロン(MLP)は大規模な言語モデルの不可欠な部分ですが、それら … 続きを読む

カテゴリー: cs.AI, cs.LG | Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders はコメントを受け付けていません

Improving LLM-based Global Optimization with Search Space Partitioning

要約 大規模な言語モデル(LLM)は最近、高価なブラックボックス関数のグローバル … 続きを読む

カテゴリー: cs.AI, cs.LG | Improving LLM-based Global Optimization with Search Space Partitioning はコメントを受け付けていません

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

要約 $ Q $ -Learningは、最も基本的な強化学習アルゴリズムの1つで … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set はコメントを受け付けていません

DeSocial: Blockchain-based Decentralized Social Networks

要約 Web 2.0ソーシャルプラットフォームは本質的に集中化されており、ユーザ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SI | DeSocial: Blockchain-based Decentralized Social Networks はコメントを受け付けていません

Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features

要約 線形TD($ \ lambda $)は、ポリシー評価のための最も基本的な強 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features はコメントを受け付けていません