cs.LG」カテゴリーアーカイブ

Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩により、2Dビジュアル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2 | Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence はコメントを受け付けていません

REOrdering Patches Improves Vision Models

要約 トランスなどのシーケンスモデルでは、入力を1次元シーケンスとして表す必要が … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | REOrdering Patches Improves Vision Models はコメントを受け付けていません

Puzzled by Puzzles: When Vision-Language Models Can’t Take a Hint

要約 レバスパズル、画像を介して言語をエンコードする視覚的な謎、空間的配置、およ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Puzzled by Puzzles: When Vision-Language Models Can’t Take a Hint はコメントを受け付けていません

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

要約 強化学習(RL)はロボット工学の大きな進歩を遂げていますが、その複雑さと長 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control はコメントを受け付けていません

Maximizing Confidence Alone Improves Reasoning

要約 強化学習(RL)により、機械学習モデルが多くの分野で大きな進歩を達成できる … 続きを読む

カテゴリー: cs.AI, cs.LG | Maximizing Confidence Alone Improves Reasoning はコメントを受け付けていません

On the performance of machine-learning-assisted Monte Carlo in sampling from simple statistical physics models

要約 近年、従来の方法を使用して研究できないサンプルが困難なシステムのシミュレー … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG, physics.comp-ph | On the performance of machine-learning-assisted Monte Carlo in sampling from simple statistical physics models はコメントを受け付けていません

Pre-training for Recommendation Unlearning

要約 グラフニューラルネットワーク(GNNS)を搭載した最新の推奨システム(GN … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | Pre-training for Recommendation Unlearning はコメントを受け付けていません

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

要約 河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む

カテゴリー: cs.CV, cs.LG | RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting はコメントを受け付けていません

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

要約 継続的なロボット制御のためにフローマッチングポリシーのファミリーを微調整す … 続きを読む

カテゴリー: cs.LG, cs.RO | ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning はコメントを受け付けていません

A Provable Approach for End-to-End Safe Reinforcement Learning

要約 安全な補強学習(RL)における長年の目標は、学習から運用まで、プロセス全体 … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, cs.RO, math.IT | A Provable Approach for End-to-End Safe Reinforcement Learning はコメントを受け付けていません