「cs.LG」カテゴリーアーカイブ

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

投稿日: 2025年3月10日作成者: jarxiv

要約 LLMがプライバシーの漏れの測定から著作権違反の検出まで、トレーニングデー … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders

投稿日: 2025年3月10日作成者: jarxiv

要約線形再発性ニューラルネットワーク（線形RNN）は、シーケンスモデリングのた … 続きを読む →

カテゴリー: cs.CL, cs.FL, cs.LG | コメントを受け付けていません

Understanding the Limits of Lifelong Knowledge Editing in LLMs

投稿日: 2025年3月10日作成者: jarxiv

要約大規模な言語モデルを事実上最新の状態に保つことは展開に不可欠ですが、費用の … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Simple linear attention language models balance the recall-throughput tradeoff

投稿日: 2025年3月10日作成者: jarxiv

要約最近の研究では、注意に基づいた言語モデルがリコール時に優れていることが示さ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts

投稿日: 2025年3月10日作成者: jarxiv

要約線形注意、状態空間モデル、線形RNN、および混合物（MOE）などの線形シー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | コメントを受け付けていません

AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems

投稿日: 2025年3月10日作成者: jarxiv

要約毎日、機械学習モデルに頼って、ハイステークタスクと決定を自動化およびサポー … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.LG | コメントを受け付けていません

Soft Policy Optimization: Online Off-Policy RL for Sequence Models

投稿日: 2025年3月10日作成者: jarxiv

要約言語モデルのRLベースのトレーニングは、PPOなどのポリシー上のメソッドを … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Personalized Federated Learning via Learning Dynamic Graphs

投稿日: 2025年3月10日作成者: jarxiv

要約パーソナライズされたフェデレートラーニング（PFL）は、ローカルデータ分布 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

MeanCache: User-Centric Semantic Caching for LLM Web Services

投稿日: 2025年3月10日作成者: jarxiv

要約 ChatGptやLlamaなどの大規模な言語モデル（LLM）は、自然言語処 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.DC, cs.LG, I.2.7 | コメントを受け付けていません

I/O in Machine Learning Applications on HPC Systems: A 360-degree Survey

投稿日: 2025年3月10日作成者: jarxiv

要約人工知能（AI）への関心の高まりにより、機械学習のより速い方法（ML）モデ … 続きを読む →

カテゴリー: cs.AI, cs.DC, cs.LG, I.2.11 | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders

Understanding the Limits of Lifelong Knowledge Editing in LLMs

Simple linear attention language models balance the recall-throughput tradeoff

Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts

AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems

Soft Policy Optimization: Online Off-Policy RL for Sequence Models

Personalized Federated Learning via Learning Dynamic Graphs

MeanCache: User-Centric Semantic Caching for LLM Web Services

I/O in Machine Learning Applications on HPC Systems: A 360-degree Survey

最近の投稿

最近のコメント

アーカイブ

カテゴリー