「cs.LG」カテゴリーアーカイブ

Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence

投稿日: 2025年5月30日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）の最近の進歩により、2Dビジュアル … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, I.2 | コメントを受け付けていません

REOrdering Patches Improves Vision Models

投稿日: 2025年5月30日作成者: jarxiv

要約トランスなどのシーケンスモデルでは、入力を1次元シーケンスとして表す必要が … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Puzzled by Puzzles: When Vision-Language Models Can’t Take a Hint

投稿日: 2025年5月30日作成者: jarxiv

要約レバスパズル、画像を介して言語をエンコードする視覚的な謎、空間的配置、およ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

投稿日: 2025年5月30日作成者: jarxiv

要約強化学習（RL）はロボット工学の大きな進歩を遂げていますが、その複雑さと長 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Maximizing Confidence Alone Improves Reasoning

投稿日: 2025年5月30日作成者: jarxiv

要約強化学習（RL）により、機械学習モデルが多くの分野で大きな進歩を達成できる … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

On the performance of machine-learning-assisted Monte Carlo in sampling from simple statistical physics models

投稿日: 2025年5月30日作成者: jarxiv

要約近年、従来の方法を使用して研究できないサンプルが困難なシステムのシミュレー … 続きを読む →

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG, physics.comp-ph | コメントを受け付けていません

Pre-training for Recommendation Unlearning

投稿日: 2025年5月30日作成者: jarxiv

要約グラフニューラルネットワーク（GNNS）を搭載した最新の推奨システム（GN … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG | コメントを受け付けていません

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

投稿日: 2025年5月30日作成者: jarxiv

要約河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

投稿日: 2025年5月30日作成者: jarxiv

要約継続的なロボット制御のためにフローマッチングポリシーのファミリーを微調整す … 続きを読む →

カテゴリー: cs.LG, cs.RO | コメントを受け付けていません

A Provable Approach for End-to-End Safe Reinforcement Learning

投稿日: 2025年5月29日作成者: jarxiv

要約安全な補強学習（RL）における長年の目標は、学習から運用まで、プロセス全体 … 続きを読む →

カテゴリー: cs.AI, cs.IT, cs.LG, cs.RO, math.IT | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence

REOrdering Patches Improves Vision Models

Puzzled by Puzzles: When Vision-Language Models Can’t Take a Hint

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

Maximizing Confidence Alone Improves Reasoning

On the performance of machine-learning-assisted Monte Carlo in sampling from simple statistical physics models

Pre-training for Recommendation Unlearning

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

A Provable Approach for End-to-End Safe Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー