「cs.LG」カテゴリーアーカイブ

SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification

投稿日: 2025年5月21日作成者: jarxiv

要約自己学習学習（SSL）は、スピーカー検証（SV）のかなりの進歩をもたらしま … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Bellman operator convergence enhancements in reinforcement learning algorithms

投稿日: 2025年5月21日作成者: jarxiv

要約このペーパーでは、国家、行動、および政策スペースの構造に焦点を当てることに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

KIPPO: Koopman-Inspired Proximal Policy Optimization

投稿日: 2025年5月21日作成者: jarxiv

要約強化学習（RL）はさまざまなドメインで大きな進歩を遂げており、近位政策最適 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation

投稿日: 2025年5月21日作成者: jarxiv

要約フルサイズのMLPと注目の投影層は、大規模な言語モデル（LLM）の途方もな … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Agent Context Protocols Enhance Collective Inference

投稿日: 2025年5月21日作成者: jarxiv

要約 AIエージェントは、コーディング、推論、マルチモーダルの理解などの複雑なタ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Online Scheduling for LLM Inference with KV Cache Constraints

投稿日: 2025年5月21日作成者: jarxiv

要約トレーニングされたモデルがユーザープロンプトに応じて一度に1つの単語を生成 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Towards a Foundation Model for Communication Systems

投稿日: 2025年5月21日作成者: jarxiv

要約人工知能（AI）は、さまざまなドメインで前例のないパフォーマンスを実証して … 続きを読む →

カテゴリー: cs.AI, cs.LG, eess.SP | コメントを受け付けていません

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

投稿日: 2025年5月21日作成者: jarxiv

要約マシンテキスト検出器の開発においてかなりの進歩にもかかわらず、問題は本質的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

投稿日: 2025年5月21日作成者: jarxiv

要約 Satbenchを紹介します。これは、ブールの満足度（SAT）の問題から派 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.LO | コメントを受け付けていません

TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning

投稿日: 2025年5月21日作成者: jarxiv

要約 Rehnection Learning（RL）は、報酬信号でポリシーを最適 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification

Bellman operator convergence enhancements in reinforcement learning algorithms

KIPPO: Koopman-Inspired Proximal Policy Optimization

CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation

Agent Context Protocols Enhance Collective Inference

Online Scheduling for LLM Inference with KV Cache Constraints

Towards a Foundation Model for Communication Systems

Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)

SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas

TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー