月別アーカイブ: 2025年5月

AMOR: Adaptive Character Control through Multi-Objective Reinforcement Learning

要約 強化学習(RL)は、運動学的参照運動を追跡する物理ベースとロボットのキャラ … 続きを読む

カテゴリー: cs.GR, cs.RO | コメントする

MCP Safety Training: Learning to Refuse Falsely Benign MCP Exploits using Improved Preference Alignment

要約 モデルコンテキストプロトコル(MCP)は、生成AIエージェントのシームレス … 続きを読む

カテゴリー: cs.CR, cs.LG | コメントする

Global optimization of graph acquisition functions for neural architecture search

要約 グラフベイジアン最適化(BO)は、神経アーキテクチャ検索(NAS)の強力で … 続きを読む

カテゴリー: cs.LG, math.OC | コメントする

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

要約 現在の言語モデルは、有限の語彙からトークンを自動化することにより、チェーン … 続きを読む

カテゴリー: cs.LG | コメントする

Optimal Bounds for Adversarial Constrained Online Convex Optimization

要約 制約されたオンライン凸最適化(COCO)は、標準のオンライン凸最適化(OC … 続きを読む

カテゴリー: cs.DS, cs.LG, math.OC, stat.ML | コメントする

Optimization-Free Diffusion Model — A Perturbation Theory Approach

要約 拡散モデルは、生成モデリングの強力なフレームワークとして浮上しており、通常 … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA | コメントする

How does Transformer Learn Implicit Reasoning?

要約 最近の研究では、大規模な言語モデル(LLM)が暗黙的にマルチホップの推論を … 続きを読む

カテゴリー: cs.LG | コメントする

Bayesian Perspective on Memorization and Reconstruction

要約 データの再構築の概念に関する新しいベイジアンの視点を紹介し、この視点を活用 … 続きを読む

カテゴリー: cs.CR, cs.LG | コメントする

AMBER: Adaptive Mesh Generation by Iterative Mesh Resolution Prediction

要約 基礎となるメッシュの解像度で有限要素法(FEM)スケールを使用して、複雑な … 続きを読む

カテゴリー: cs.CG, cs.LG | コメントする

Bayesian Optimization from Human Feedback: Near-Optimal Regret Bounds

要約 優先順位ベースのフィードバックを備えたBayesian Optimizat … 続きを読む

カテゴリー: cs.LG | コメントする