月別アーカイブ: 2025年5月

AMOR: Adaptive Character Control through Multi-Objective Reinforcement Learning

投稿日: 2025年5月30日作成者: jarxiv

要約強化学習（RL）は、運動学的参照運動を追跡する物理ベースとロボットのキャラ … 続きを読む →

カテゴリー: cs.GR, cs.RO | コメントを受け付けていません

MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment

投稿日: 2025年5月30日作成者: jarxiv

要約モデルコンテキストプロトコル（MCP）は、生成AIエージェントのシームレス … 続きを読む →

カテゴリー: cs.CR, cs.LG | コメントを受け付けていません

Global optimization of graph acquisition functions for neural architecture search

投稿日: 2025年5月30日作成者: jarxiv

要約グラフベイジアン最適化（BO）は、神経アーキテクチャ検索（NAS）の強力で … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

投稿日: 2025年5月30日作成者: jarxiv

要約現在の言語モデルは、有限の語彙からトークンを自動化することにより、チェーン … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Optimal Bounds for Adversarial Constrained Online Convex Optimization

投稿日: 2025年5月30日作成者: jarxiv

要約制約されたオンライン凸最適化（COCO）は、標準のオンライン凸最適化（OC … 続きを読む →

カテゴリー: cs.DS, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Optimization-Free Diffusion Model — A Perturbation Theory Approach

投稿日: 2025年5月30日作成者: jarxiv

要約拡散モデルは、生成モデリングの強力なフレームワークとして浮上しており、通常 … 続きを読む →

カテゴリー: cs.LG, cs.NA, math.NA | コメントを受け付けていません

How does Transformer Learn Implicit Reasoning?

投稿日: 2025年5月30日作成者: jarxiv

要約最近の研究では、大規模な言語モデル（LLM）が暗黙的にマルチホップの推論を … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

Bayesian Perspective on Memorization and Reconstruction

投稿日: 2025年5月30日作成者: jarxiv

要約データの再構築の概念に関する新しいベイジアンの視点を紹介し、この視点を活用 … 続きを読む →

カテゴリー: cs.CR, cs.LG | コメントを受け付けていません

AMBER: Adaptive Mesh Generation by Iterative Mesh Resolution Prediction

投稿日: 2025年5月30日作成者: jarxiv

要約基礎となるメッシュの解像度で有限要素法（FEM）スケールを使用して、複雑な … 続きを読む →

カテゴリー: cs.CG, cs.LG | コメントを受け付けていません

Bayesian Optimization from Human Feedback: Near-Optimal Regret Bounds

投稿日: 2025年5月30日作成者: jarxiv

要約優先順位ベースのフィードバックを備えたBayesian Optimizat … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年5月

AMOR: Adaptive Character Control through Multi-Objective Reinforcement Learning

MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment

Global optimization of graph acquisition functions for neural architecture search

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

Optimal Bounds for Adversarial Constrained Online Convex Optimization

Optimization-Free Diffusion Model — A Perturbation Theory Approach

How does Transformer Learn Implicit Reasoning?

Bayesian Perspective on Memorization and Reconstruction

AMBER: Adaptive Mesh Generation by Iterative Mesh Resolution Prediction

Bayesian Optimization from Human Feedback: Near-Optimal Regret Bounds

最近の投稿

最近のコメント

アーカイブ

カテゴリー