-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Click2Mask: Local Editing with Dynamic Mask Generation
要約 生成モデルの最近の進歩により、画像の生成と編集に革命が起こり、専門家でなく … 続きを読む
MADation: Face Morphing Attack Detection with Foundation Models
要約 近年、顔認識アルゴリズムのパフォーマンスが大幅に向上しているにもかかわらず … 続きを読む
Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection
要約 急速な発展が見られる一方で、リモートセンシングによる物体検出は依然として高 … 続きを読む
カテゴリー: cs.CV
Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection はコメントを受け付けていません
Cosmos World Foundation Model Platform for Physical AI
要約 物理的な AI は、まずデジタルでトレーニングする必要があります。 それ自 … 続きを読む
VTAO-BiManip: Masked Visual-Tactile-Action Pre-training with Object Understanding for Bimanual Dexterous Manipulation
要約 両手の器用な操作は、それぞれの手の自由度とその調整が高いため、ロボット工学 … 続きを読む
MULTI: Multimodal Understanding Leaderboard with Text and Images
要約 マルチモーダル大規模言語モデル (MLLM) の急速な発展により、それらが … 続きを読む
Materialist: Physically Based Editing Using Single-Image Inverse Rendering
要約 シングルビューの逆物理ベース レンダリングに基づいて画像編集を実行するため … 続きを読む
Self-adaptive vision-language model for 3D segmentation of pulmonary artery and vein
要約 肺構造の正確なセグメンテーションは、臨床診断、疾患研究、治療計画において非 … 続きを読む
Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction
要約 磁気共鳴画像法 (MRI) は臨床現場で広く使用されていますが、取得時間が … 続きを読む
Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection
要約 デジタル画像操作の進化、特にディープ生成モデルの進歩は、特にディープフェイ … 続きを読む