-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
STING-BEE: Towards Vision-Language Model for Real-World X-ray Baggage Security Inspection
要約 コンピュータ支援スクリーニング(CAS)システムの進歩は、X線手荷物検査に … 続きを読む
THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models
要約 大規模視覚言語モデル(LVLM)における幻覚の軽減は、依然として未解決の問 … 続きを読む
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing
要約 ラージ・マルチ・モダリティ・モデル(LMM)は、視覚の理解と生成において大 … 続きを読む
カテゴリー: cs.CV
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing はコメントを受け付けていません
Concept Lancet: Image Editing with Compositional Representation Transplant
要約 拡散モデルは画像編集作業に広く用いられている。既存の編集手法は、多くの場合 … 続きを読む
RoboAct-CLIP: Video-Driven Pre-training of Atomic Action Understanding for Robotics
要約 視覚言語モデル(VLM)は、マルチモーダル知覚と意味論的推論を通じて、タス … 続きを読む
Evaluation of Flight Parameters in UAV-based 3D Reconstruction for Rooftop Infrastructure Assessment
要約 UAVを用いた写真測量による屋上の3D再構築は、インフラ評価のための有望な … 続きを読む
A Chefs KISS — Utilizing semantic information in both ICP and SLAM framework
要約 都市部で自律走行車を利用するためには、信頼性の高いローカライゼーションが必 … 続きを読む
カテゴリー: cs.RO
A Chefs KISS — Utilizing semantic information in both ICP and SLAM framework はコメントを受け付けていません
AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World
要約 スケーラブルで再現性のある政策評価は、ロボット学習における長年の課題であっ … 続きを読む
Let’s move on: Topic Change in Robot-Facilitated Group Discussions
要約 ロボットが司会するグループディスカッションは、人間の参加者間の魅力的で生産 … 続きを読む
Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning
要約 能動的な3Dシーン表現は、遠隔検査、マニピュレーション、テレプレゼンスなど … 続きを読む