投稿者「jarxiv」のアーカイブ

Finite sample learning of moving targets

投稿日: 2025年5月21日作成者: jarxiv

要約私たちは、サンプルから学ぼうとする動くターゲットを検討します。私たちの結 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Towards Model-Agnostic Federated Learning over Networks

投稿日: 2025年5月21日作成者: jarxiv

要約不均一なデータとモデルのネットワークのためのモデルに依存しないフェデレーシ … 続きを読む →

カテゴリー: C.2.4, cs.LG | コメントを受け付けていません

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）の急速な進歩は、計算需要の前例のない増加と並 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Quantum Optimization via Gradient-Based Hamiltonian Descent

投稿日: 2025年5月21日作成者: jarxiv

要約機械学習の急速な進歩により、計算効率と低メモリ要件により、最新の最適化技術 … 続きを読む →

カテゴリー: cs.LG, math.OC, quant-ph | コメントを受け付けていません

ModRWKV: Transformer Multimodality in Linear Time

投稿日: 2025年5月21日作成者: jarxiv

要約現在、ほとんどのマルチモーダル研究は、二次複数の変圧器アーキテクチャを備え … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Teaching Audio-Aware Large Language Models What Does Not Hear: Mitigating Hallucinations through Synthesized Negative Samples

投稿日: 2025年5月21日作成者: jarxiv

要約オーディオ認識の大規模な言語モデル（ALLMS）の最近の進歩により、オーデ … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Exploring Graph Representations of Logical Forms for Language Modeling

投稿日: 2025年5月21日作成者: jarxiv

要約このようなモデルは、テキストの対応物よりもデータ効率が高いと主張して、論理 … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

MMUnlearner: Reformulating Multimodal Machine Unlearning in the Era of Multimodal Large Language Models

投稿日: 2025年5月21日作成者: jarxiv

要約 Machine Inlerning（MU）の最近の進捗状況は、深いニューラ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）が$ \ textIT {内部チェーンオブオ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Breaking Bad Tokens: Detoxification of LLMs Using Sparse Autoencoders

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLM）は、ユーザー向けアプリケーションで遍在していま … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Finite sample learning of moving targets

Towards Model-Agnostic Federated Learning over Networks

Quartet: Native FP4 Training Can Be Optimal for Large Language Models

Quantum Optimization via Gradient-Based Hamiltonian Descent

ModRWKV: Transformer Multimodality in Linear Time

Teaching Audio-Aware Large Language Models What Does Not Hear: Mitigating Hallucinations through Synthesized Negative Samples

Exploring Graph Representations of Logical Forms for Language Modeling

MMUnlearner: Reformulating Multimodal Machine Unlearning in the Era of Multimodal Large Language Models

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

Breaking Bad Tokens: Detoxification of LLMs Using Sparse Autoencoders

最近の投稿

最近のコメント

アーカイブ

カテゴリー