-
最近の投稿
- Experimental Study on The Effect of Multi-step Deep Reinforcement Learning in POMDPs
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Embodied Scene Understanding for Vision Language Models via MetaVQA
- Estimation-Aware Trajectory Optimization with Set-Valued Measurement Uncertainties
- Combining Movement Primitives with Contraction Theory
-
最近のコメント
表示できるコメントはありません。 cs.AI (32387) cs.CL (24483) cs.CR (2509) cs.CV (38599) cs.LG (37256) cs.RO (18883) cs.SY (2886) eess.IV (4625) eess.SY (2880) stat.ML (4916)
投稿者「jarxiv」のアーカイブ
MANTA: Diffusion Mamba for Efficient and Effective Stochastic Long-Term Dense Anticipation
要約 私たちの研究は、確率論的長期密予測の問題に取り組んでいます。 このタスクの … 続きを読む
Exploring Task-Level Optimal Prompts for Visual In-Context Learning
要約 近年の Vision Foundation Models (VFM) の開 … 続きを読む
Generative Planning with 3D-vision Language Pre-training for End-to-End Autonomous Driving
要約 自動運転は、安全な軌道計画を立てるために周囲の環境を認識して理解する必要が … 続きを読む
CGCOD: Class-Guided Camouflaged Object Detection
要約 カモフラージュオブジェクト検出 (COD) は、周囲にシームレスに溶け込む … 続きを読む
The Surprising Ineffectiveness of Pre-Trained Visual Representations for Model-Based Reinforcement Learning
要約 視覚強化学習 (RL) 手法では、多くの場合、大量のデータが必要になります … 続きを読む
Industrial Anomaly Detection and Localization Using Weakly-Supervised Residual Transformers
要約 産業用異常検出 (AD) の最近の進歩により、トレーニング中に少数の異常サ … 続きを読む
MADiff: Text-Guided Fashion Image Editing with Mask Prediction and Attention-Enhanced Diffusion
要約 テキストガイド付き画像編集モデルは、一般的な領域で大きな成功を収めています … 続きを読む
Feature-based One-For-All: A Universal Framework for Heterogeneous Knowledge Distillation
要約 知識蒸留 (KD) には、事前トレーニングされた重い教師モデルから軽い生徒 … 続きを読む
Enhanced Multi-Scale Cross-Attention for Person Image Generation
要約 本稿では、挑戦的な人物画像生成タスクのために、新しいクロスアテンションベー … 続きを読む