「cs.LG」カテゴリーアーカイブ

Fast-DataShapley: Neural Modeling for Training Data Valuation

投稿日: 2025年6月6日作成者: jarxiv

要約トレーニングデータの価値と著作権は、人工知能業界で重要です。サービスプラ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

投稿日: 2025年6月6日作成者: jarxiv

要約テスト時間スケーリングパラダイムは、複雑なタスク上の大規模な言語モデル（L … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Control Tax: The Price of Keeping AI in Check

投稿日: 2025年6月6日作成者: jarxiv

要約エージェントAIをハイステークスの現実世界アプリケーションに迅速に統合する … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

ProRefine: Inference-time Prompt Refinement with Textual Feedback

投稿日: 2025年6月6日作成者: jarxiv

要約複数のAIエージェントが協力して推論や計画などの複雑なタスクを達成するエー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models

投稿日: 2025年6月6日作成者: jarxiv

要約現実世界の設定で展開された大規模な言語モデル（LLM）は、繊細、時代遅れ、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

投稿日: 2025年6月6日作成者: jarxiv

要約強化学習（RL）は、特に推論能力を高めるために、大規模な言語モデル（LLM … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

投稿日: 2025年6月6日作成者: jarxiv

要約推論のための大規模な強化学習（RL）の最近の進歩にもかかわらず、高性能の推 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Exploring Diffusion Transformer Designs via Grafting

投稿日: 2025年6月6日作成者: jarxiv

要約モデルアーキテクチャの設計には、オペレーター（注意、畳み込みなど）や構成（ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Quantifying Cross-Modality Memorization in Vision-Language Models

投稿日: 2025年6月6日作成者: jarxiv

要約トレーニング中にニューラルネットワークがどのように、どのように覚えているか … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Stochastic Poisson Surface Reconstruction with One Solve using Geometric Gaussian Processes

投稿日: 2025年6月6日作成者: jarxiv

要約ポアソン表面再構築は、配向点クラウドから表面を再構築するための広く使用され … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG, stat.ML | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Fast-DataShapley: Neural Modeling for Training Data Valuation

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

Control Tax: The Price of Keeping AI in Check

ProRefine: Inference-time Prompt Refinement with Textual Feedback

Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

Exploring Diffusion Transformer Designs via Grafting

Quantifying Cross-Modality Memorization in Vision-Language Models

Stochastic Poisson Surface Reconstruction with One Solve using Geometric Gaussian Processes

最近の投稿

最近のコメント

アーカイブ

カテゴリー