-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing
要約 ラージ・マルチ・モダリティ・モデル(LMM)は、視覚の理解と生成において大 … 続きを読む
カテゴリー: cs.CV
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing はコメントを受け付けていません
Concept Lancet: Image Editing with Compositional Representation Transplant
要約 拡散モデルは画像編集作業に広く用いられている。既存の編集手法は、多くの場合 … 続きを読む
Evaluation of Flight Parameters in UAV-based 3D Reconstruction for Rooftop Infrastructure Assessment
要約 UAVを用いた写真測量による屋上の3D再構築は、インフラ評価のための有望な … 続きを読む
Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning
要約 能動的な3Dシーン表現は、遠隔検査、マニピュレーション、テレプレゼンスなど … 続きを読む
MinkOcc: Towards real-time label-efficient semantic occupancy prediction
要約 3Dセマンティック占有予測モデルの開発は、多くの場合、教師あり学習のための … 続きを読む
X-Capture: An Open-Source Portable Device for Multi-Sensory Learning
要約 複数の感覚モダリティを通して物体を理解することは、人間の知覚の基本であり、 … 続きを読む
All-day Depth Completion via Thermal-LiDAR Fusion
要約 疎なLiDARやRGB画像から密な深度を推定する深度補完は、明るい条件下で … 続きを読む
Estimating Scene Flow in Robot Surroundings with Distributed Miniaturized Time-of-Flight Sensors
要約 ロボットの周囲の人間や物体の動きを追跡することは、ロボットの安全な動作や反 … 続きを読む
6DOPE-GS: Online 6D Object Pose Estimation using Gaussian Splatting
要約 効率的で正確なオブジェクトのポーズ推定は、拡張現実感、自律走行、ロボット工 … 続きを読む
Adaptive path planning for efficient object search by UAVs in agricultural fields
要約 本論文では、UAVを用いた農地における物体探索のための適応型パスプランナー … 続きを読む