-
最近の投稿
- Learning Multimodal Latent Dynamics for Human-Robot Interaction
- Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving
- Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation
- Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations
- Sensor Model Identification via Simultaneous Model Selection and State Variable Determination
-
最近のコメント
表示できるコメントはありません。 cs.AI (39679) cs.CL (30032) cs.CV (45003) cs.HC (3029) cs.LG (44613) cs.RO (23728) cs.SY (3617) eess.IV (5159) eess.SY (3609) stat.ML (5797)
「cs.LG」カテゴリーアーカイブ
Evolutionary Policy Optimization
要約 ポリシー補強学習(RL)アルゴリズムは、強力な漸近パフォーマンスとトレーニ … 続きを読む
Agentic Neural Networks: Self-Evolving Multi-Agent Systems via Textual Backpropagation
要約 複数の大規模な言語モデル(LLMS)を活用すると、複雑で高次元のタスクに対 … 続きを読む
Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO
要約 最近の進歩は、大規模な言語モデル(LLM)の考え方(COT)の推論能力を高 … 続きを読む
StreamSplat: Towards Online Dynamic 3D Reconstruction from Uncalibrated Video Streams
要約 非調整されたビデオストリームからの動的3Dシーンのリアルタイム再構成は、多 … 続きを読む
k-NN as a Simple and Effective Estimator of Transferability
要約 ドメインがシフトされ、タスクが異なり、アーキテクチャが変化する新しい設定で … 続きを読む
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap
要約 ドメイン一般化(DG)は、共有ラベルスペースの仮定の下で、1つ以上のソース … 続きを読む
Segment Concealed Objects with Incomplete Supervision
要約 不完全に監視されている隠されたオブジェクトセグメンテーション(ISCOS) … 続きを読む
Data Augmentation For Small Object using Fast AutoAugment
要約 近年、オブジェクト検出パフォーマンスには大きな進歩があります。 ただし、こ … 続きを読む
Efficient Medical Vision-Language Alignment Through Adapting Masked Vision Models
要約 クロスモーダルコントラスト学習を通じて、医療視覚言語の整合により、検索やゼ … 続きを読む