-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation
要約 ビジョンベースナビゲーションは、画像から情報を抽出した後、カメラを GNC … 続きを読む
カテゴリー: astro-ph.EP, cs.CV, cs.GR, cs.LG
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation はコメントを受け付けていません
NVLM: Open Frontier-Class Multimodal LLMs
要約 NVLM 1.0 は、視覚言語タスクで最先端の結果を達成するフロンティアク … 続きを読む
Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion
要約 3D モデリングでは、デザイナーは既存の 3D モデルを参照として使用して … 続きを読む
カテゴリー: cs.CV
Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion はコメントを受け付けていません
Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation
要約 マルチモダリティ医療画像セグメンテーションは、多様な画像モダリティを統合す … 続きを読む
カテゴリー: cs.CV
Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation はコメントを受け付けていません
NGD-SLAM: Towards Real-Time Dynamic SLAM without GPU
要約 既存の SLAM (Simultaneous Localization a … 続きを読む
P2U-SLAM: A Monocular Wide-FoV SLAM System Based on Point Uncertainty and Pose Uncertainty
要約 この論文では、位置不確実性と点不確実性を利用する、広視野 (FoV) カメ … 続きを読む
SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting
要約 Sim2Real の転送、特に RGB 画像に依存する操作ポリシーの場合、 … 続きを読む
SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps
要約 実際の環境に配置された RGB-D センサーによってキャプチャされた深度マ … 続きを読む
Fit and Prune: Fast and Training-free Visual Token Pruning for Multi-modal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩では、MLLM … 続きを読む
NEUSIS: A Compositional Neuro-Symbolic Framework for Autonomous Perception, Reasoning, and Planning in Complex UAV Search Missions
要約 この論文では、立ち入り禁止ゾーンのある大規模で危険が発生しやすい環境での簡 … 続きを読む