-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Annotation-Free Curb Detection Leveraging Altitude Difference Image
要約 道路の縁石は、自律走行車の安全性を確保するために不可欠な、重要かつどこにで … 続きを読む
カテゴリー: cs.CV
Annotation-Free Curb Detection Leveraging Altitude Difference Image はコメントを受け付けていません
MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies
要約 マニピュレーションタスクの多くは、ロボットが物体を相対的に再配置することを … 続きを読む
Evaluating Intelligence via Trial and Error
要約 知能は、限られた回数の試行錯誤の中で解決策を見出す種にとって重要な特性であ … 続きを読む
EchoONE: Segmenting Multiple echocardiography Planes in One Model
要約 臨床における心エコー検査では、心疾患のスクリーニング、診断、治療において、 … 続きを読む
カテゴリー: cs.CV
EchoONE: Segmenting Multiple echocardiography Planes in One Model はコメントを受け付けていません
Stereo Hand-Object Reconstruction for Human-to-Robot Handover
要約 手と物体の形状を共同で推定することで、人間からロボットへのハンドオーバーに … 続きを読む
Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation
要約 具現化ビジョンナビゲーションの大幅な進歩により、ディープニューラルネットワ … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key
要約 幻覚は、大規模視覚言語モデル(LVLM)にとって依然として大きな課題である … 続きを読む
カテゴリー: cs.CV
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key はコメントを受け付けていません
StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing
要約 拡散モデルを用いたテキスト映像(T2V)生成における最近の進歩は、大きな注 … 続きを読む
Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control
要約 本研究では、ロバストな異常検出手法である反復的精密化プロセス(IRP)を紹 … 続きを読む
FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation
要約 レシピデータを用いた食品イメージの理解に関する研究は、そのデータの多様性と … 続きを読む