cs.LG」カテゴリーアーカイブ

SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It)

要約 LLMがプライバシーの漏れの測定から著作権違反の検出まで、トレーニングデー … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It) はコメントを受け付けていません

DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders

要約 線形再発性ニューラルネットワーク(線形RNN)は、シーケンスモデリングのた … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders はコメントを受け付けていません

Understanding the Limits of Lifelong Knowledge Editing in LLMs

要約 大規模な言語モデルを事実上最新の状態に保つことは展開に不可欠ですが、費用の … 続きを読む

カテゴリー: cs.CL, cs.LG | Understanding the Limits of Lifelong Knowledge Editing in LLMs はコメントを受け付けていません

Simple linear attention language models balance the recall-throughput tradeoff

要約 最近の研究では、注意に基づいた言語モデルがリコール時に優れていることが示さ … 続きを読む

カテゴリー: cs.CL, cs.LG | Simple linear attention language models balance the recall-throughput tradeoff はコメントを受け付けていません

Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts

要約 線形注意、状態空間モデル、線形RNN、および混合物(MOE)などの線形シー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts はコメントを受け付けていません

AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems

要約 毎日、機械学習モデルに頼って、ハイステークタスクと決定を自動化およびサポー … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.LG | AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems はコメントを受け付けていません

Soft Policy Optimization: Online Off-Policy RL for Sequence Models

要約 言語モデルのRLベースのトレーニングは、PPOなどのポリシー上のメソッドを … 続きを読む

カテゴリー: cs.AI, cs.LG | Soft Policy Optimization: Online Off-Policy RL for Sequence Models はコメントを受け付けていません

Personalized Federated Learning via Learning Dynamic Graphs

要約 パーソナライズされたフェデレートラーニング(PFL)は、ローカルデータ分布 … 続きを読む

カテゴリー: cs.AI, cs.LG | Personalized Federated Learning via Learning Dynamic Graphs はコメントを受け付けていません

MeanCache: User-Centric Semantic Caching for LLM Web Services

要約 ChatGptやLlamaなどの大規模な言語モデル(LLM)は、自然言語処 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.DC, cs.LG, I.2.7 | MeanCache: User-Centric Semantic Caching for LLM Web Services はコメントを受け付けていません

I/O in Machine Learning Applications on HPC Systems: A 360-degree Survey

要約 人工知能(AI)への関心の高まりにより、機械学習のより速い方法(ML)モデ … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, I.2.11 | I/O in Machine Learning Applications on HPC Systems: A 360-degree Survey はコメントを受け付けていません