「cs.LG」カテゴリーアーカイブ

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

投稿日: 2025年6月13日作成者: jarxiv

要約逆の問題を解決するための情報に基づいたデータ事前に、より一般的には報酬モデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SpectralAR: Spectral Autoregressive Visual Generation

投稿日: 2025年6月13日作成者: jarxiv

要約自己回帰視覚生成は、拡散モデルと比較して、そのスケーラビリティと他のモダリ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Fine-Grained Perturbation Guidance via Attention Head Selection

投稿日: 2025年6月13日作成者: jarxiv

要約拡散モデルの最近のガイダンス方法は、モデルを摂動させて暗黙の弱いモデルを構 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

CoRT: Code-integrated Reasoning within Thinking

投稿日: 2025年6月13日作成者: jarxiv

要約 O1やDeepSeek-R1などの大規模な推論モデル（LRMS）は、長い考 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems

投稿日: 2025年6月12日作成者: jarxiv

要約四足ロボットは、制御された環境から現実世界のアプリケーションに能力を拡張し … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations

投稿日: 2025年6月12日作成者: jarxiv

要約近隣のエージェント間の空間的相互作用のモデリングは、モーション予測やクラウ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | コメントを受け付けていません

Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation

投稿日: 2025年6月12日作成者: jarxiv

要約多くの複雑なシナリオでは、ロボット操作は、複数の成功したアクションの分布を … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

投稿日: 2025年6月12日作成者: jarxiv

要約継続的なロボット制御のためにフローマッチングポリシーのファミリーを微調整す … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design

投稿日: 2025年6月12日作成者: jarxiv

要約一般的なマルコフ決定プロセスでの人間のフィードバックからの強化学習を研究し … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | コメントを受け付けていません

Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information

投稿日: 2025年6月12日作成者: jarxiv

要約この手紙では、lidar-imu-legの密着した密着性のある臭気測定を提 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

SpectralAR: Spectral Autoregressive Visual Generation

Fine-Grained Perturbation Guidance via Attention Head Selection

CoRT: Code-integrated Reasoning within Thinking

Scoop-and-Toss: Dynamic Object Collection for Quadrupedal Systems

Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations

Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design

Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information

最近の投稿

最近のコメント

アーカイブ

カテゴリー