cs.LG」カテゴリーアーカイブ

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

要約 逆の問題を解決するための情報に基づいたデータ事前に、より一般的には報酬モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems はコメントを受け付けていません

SpectralAR: Spectral Autoregressive Visual Generation

要約 自己回帰視覚生成は、拡散モデルと比較して、そのスケーラビリティと他のモダリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SpectralAR: Spectral Autoregressive Visual Generation はコメントを受け付けていません

Fine-Grained Perturbation Guidance via Attention Head Selection

要約 拡散モデルの最近のガイダンス方法は、モデルを摂動させて暗黙の弱いモデルを構 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Fine-Grained Perturbation Guidance via Attention Head Selection はコメントを受け付けていません

CoRT: Code-integrated Reasoning within Thinking

要約 O1やDeepSeek-R1などの大規模な推論モデル(LRMS)は、長い考 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CoRT: Code-integrated Reasoning within Thinking はコメントを受け付けていません

Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems

要約 四足ロボットは、制御された環境から現実世界のアプリケーションに能力を拡張し … 続きを読む

カテゴリー: cs.LG, cs.RO | Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems はコメントを受け付けていません

Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations

要約 近隣のエージェント間の空間的相互作用のモデリングは、モーション予測やクラウ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations はコメントを受け付けていません

Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation

要約 多くの複雑なシナリオでは、ロボット操作は、複数の成功したアクションの分布を … 続きを読む

カテゴリー: cs.LG, cs.RO | Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation はコメントを受け付けていません

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

要約 継続的なロボット制御のためにフローマッチングポリシーのファミリーを微調整す … 続きを読む

カテゴリー: cs.LG, cs.RO | ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning はコメントを受け付けていません

Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design

要約 一般的なマルコフ決定プロセスでの人間のフィードバックからの強化学習を研究し … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design はコメントを受け付けていません

Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information

要約 この手紙では、lidar-imu-legの密着した密着性のある臭気測定を提 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information はコメントを受け付けていません