「cs.LG」カテゴリーアーカイブ

A Lightweight Method to Disrupt Memorized Sequences in LLM

投稿日: 2025年5月28日作成者: jarxiv

要約言語モデルが拡大するにつれて、パフォーマンスは幅広いタスク全体で劇的に向上 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition

投稿日: 2025年5月28日作成者: jarxiv

要約地域の方言の名前付きエンティティ認識（NER）は、特にバングラのような低リ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Hardware-Efficient Attention for Fast Decoding

投稿日: 2025年5月28日作成者: jarxiv

要約 LLMデコードは、大きなバッチと長いコンテキストのためにボトルネックされて … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Reinforcing General Reasoning without Verifiers

投稿日: 2025年5月28日作成者: jarxiv

要約最近のパラダイムは、検証可能な報酬に関するDeepSeek-R1-Zero … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Subgroups Matter for Robust Bias Mitigation

投稿日: 2025年5月28日作成者: jarxiv

要約機械学習のための新しいバイアス緩和方法の絶え間ない開発にもかかわらず、一貫 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders

投稿日: 2025年5月28日作成者: jarxiv

要約多層パーセプロン（MLP）は大規模な言語モデルの不可欠な部分ですが、それら … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Improving LLM-based Global Optimization with Search Space Partitioning

投稿日: 2025年5月28日作成者: jarxiv

要約大規模な言語モデル（LLM）は最近、高価なブラックボックス関数のグローバル … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

投稿日: 2025年5月28日作成者: jarxiv

要約 $ Q $ -Learningは、最も基本的な強化学習アルゴリズムの1つで … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

DeSocial: Blockchain-based Decentralized Social Networks

投稿日: 2025年5月28日作成者: jarxiv

要約 Web 2.0ソーシャルプラットフォームは本質的に集中化されており、ユーザ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SI | コメントを受け付けていません

Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features

投稿日: 2025年5月28日作成者: jarxiv

要約線形TD（$ \ lambda $）は、ポリシー評価のための最も基本的な強 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

A Lightweight Method to Disrupt Memorized Sequences in LLM

ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition

Hardware-Efficient Attention for Fast Decoding

Reinforcing General Reasoning without Verifiers

Subgroups Matter for Robust Bias Mitigation

Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders

Improving LLM-based Global Optimization with Search Space Partitioning

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

DeSocial: Blockchain-based Decentralized Social Networks

Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features

最近の投稿

最近のコメント

アーカイブ

カテゴリー