月別アーカイブ: 2025年5月

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

投稿日: 2025年5月26日作成者: jarxiv

要約大規模な言語モデル（LLM）は通常、データの混合物でトレーニングされていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL

投稿日: 2025年5月26日作成者: jarxiv

要約大規模な言語モデル（LLM）は、質問の回答や対話などのタスクで優れています … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

投稿日: 2025年5月26日作成者: jarxiv

要約インターネット上の大規模な言語モデル（LLM）ベンチマークを公開することは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ME | コメントを受け付けていません

Activated LoRA: Fine-tuned LLMs for Intrinsics

投稿日: 2025年5月26日作成者: jarxiv

要約低ランク適応（LORA）は、大規模な基礎モデルの重みを微調整するための非常 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Bidirectional Knowledge Distillation for Enhancing Sequential Recommendation with Large Language Models

投稿日: 2025年5月26日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、セマンティックパターンの理解と生成におい … 続きを読む →

カテゴリー: cs.AI, cs.IR | コメントを受け付けていません

Parameter Symmetry Potentially Unifies Deep Learning Theory

投稿日: 2025年5月26日作成者: jarxiv

要約現代の大規模なAIシステムにおける学習のダイナミクスは階層的であり、多くの … 続きを読む →

カテゴリー: cond-mat.dis-nn, cs.AI, cs.LG, stat.ML | コメントを受け付けていません

ProgRM: Build Better GUI Agents with Progress Rewards

投稿日: 2025年5月26日作成者: jarxiv

要約 LLMベースの（大手言語モデル）GUI（グラフィカルユーザーインターフェイ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Reward Model Overoptimisation in Iterated RLHF

投稿日: 2025年5月26日作成者: jarxiv

要約人間のフィードバック（RLHF）からの強化学習は、大規模な言語モデルを人間 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Is Your Paper Being Reviewed by an LLM? Benchmarking AI Text Detection in Peer Review

投稿日: 2025年5月26日作成者: jarxiv

要約ピアレビューは、公開された科学研究の完全性を確保するための重要なプロセスで … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Leveraging KANs for Expedient Training of Multichannel MLPs via Preconditioning and Geometric Refinement

投稿日: 2025年5月26日作成者: jarxiv

要約多層パーセプロン（MLP）は、さまざまな現代の深い学習フレームワークで使用 … 続きを読む →

カテゴリー: 68T99, cs.AI, cs.LG, I.2.6 | コメントを受け付けていません

月別アーカイブ: 2025年5月

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

Activated LoRA: Fine-tuned LLMs for Intrinsics

Bidirectional Knowledge Distillation for Enhancing Sequential Recommendation with Large Language Models

Parameter Symmetry Potentially Unifies Deep Learning Theory

ProgRM: Build Better GUI Agents with Progress Rewards

Reward Model Overoptimisation in Iterated RLHF

Is Your Paper Being Reviewed by an LLM? Benchmarking AI Text Detection in Peer Review

Leveraging KANs for Expedient Training of Multichannel MLPs via Preconditioning and Geometric Refinement

最近の投稿

最近のコメント

アーカイブ

カテゴリー