-
最近の投稿
- Geometric Impedance Control on SE(3) for Robotic Manipulators
- Adaptive Energy Regularization for Autonomous Gait Transition and Energy-Efficient Quadruped Locomotion
- CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
- Affordance-Guided Reinforcement Learning via Visual Prompting
- OpenGV 2.0: Motion prior-assisted calibration and SLAM with vehicle-mounted surround-view systems
-
最近のコメント
表示できるコメントはありません。 cs.AI (34674) cs.CL (26212) cs.CR (2657) cs.CV (40510) cs.LG (39676) cs.RO (20296) cs.SY (3081) eess.IV (4814) eess.SY (3075) stat.ML (5222)
「cs.CV」カテゴリーアーカイブ
Evaluating Intelligence via Trial and Error
要約 知能は、限られた回数の試行錯誤の中で解決策を見出す種にとって重要な特性であ … 続きを読む
EchoONE: Segmenting Multiple echocardiography Planes in One Model
要約 臨床における心エコー検査では、心疾患のスクリーニング、診断、治療において、 … 続きを読む
Stereo Hand-Object Reconstruction for Human-to-Robot Handover
要約 手と物体の形状を共同で推定することで、人間からロボットへのハンドオーバーに … 続きを読む
Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation
要約 具現化ビジョンナビゲーションの大幅な進歩により、ディープニューラルネットワ … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key
要約 幻覚は、大規模視覚言語モデル(LVLM)にとって依然として大きな課題である … 続きを読む
StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing
要約 拡散モデルを用いたテキスト映像(T2V)生成における最近の進歩は、大きな注 … 続きを読む
Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control
要約 本研究では、ロバストな異常検出手法である反復的精密化プロセス(IRP)を紹 … 続きを読む
FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation
要約 レシピデータを用いた食品イメージの理解に関する研究は、そのデータの多様性と … 続きを読む
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts
要約 既存のスコアディスティレーションサンプリング(SDS)ベースの手法は、テキ … 続きを読む
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition
要約 捕獲された行動は個体群の健康状態の変化を示す最も早い指標となるため、カメラ … 続きを読む