-
最近の投稿
- Visual-Haptic Model Mediated Teleoperation for Remote Ultrasound
- Robot Instance Segmentation with Few Annotations for Grasping
- End-to-End Predictive Planner for Autonomous Driving with Consistency Models
- STRIDE: Automating Reward Design, Deep Reinforcement Learning Training and Feedback Optimization in Humanoid Robotics Locomotion
- COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping
-
最近のコメント
表示できるコメントはありません。 cs.AI (33628) cs.CL (25407) cs.CR (2594) cs.CV (39631) cs.LG (38601) cs.RO (19582) cs.SY (2988) eess.IV (4742) eess.SY (2982) stat.ML (5091)
月別アーカイブ: 2025年1月
UDC-VIT: A Real-World Video Dataset for Under-Display Cameras
要約 ディスプレイカメラ(UDC)は、デジタルカメラレンズをディスプレイパネルの … 続きを読む
R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest
要約 人工知能は医学的視覚的質問応答(MED-VQA)に大きな進歩を遂げましたが … 続きを読む
Perspectives: Comparison of Deep Learning Segmentation Models on Biophysical and Biomedical Data
要約 現在、深い学習ベースのアプローチは、画像セグメンテーション、機能選択、デコ … 続きを読む
カテゴリー: cs.CV, eess.IV, physics.bio-ph
コメントする
Vision-based autonomous structural damage detection using data-driven methods
要約 この研究では、再生可能エネルギーインフラストラクチャの重要なコンポーネント … 続きを読む
Inkspire: Supporting Design Exploration with Generative AI through Analogical Sketching
要約 テキストツーイメージ(T2I)AIモデルの能力に最近の進歩により、製品設計 … 続きを読む
DiffusionRenderer: Neural Inverse and Forward Rendering with Video Diffusion Models
要約 照明効果の理解とモデリングは、コンピュータービジョンとグラフィックスの基本 … 続きを読む
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models
要約 実際のシナリオでは、モデルが未知のターゲット分布に適応または一般化する必要 … 続きを読む
Diffusion Autoencoders are Scalable Image Tokenizers
要約 画像をコンパクトな視覚表現にトークン化することは、効率的で高品質の画像生成 … 続きを読む
Foundational Models for 3D Point Clouds: A Survey and Outlook
要約 3Dポイントクラウド表現は、物理的な世界の幾何学的忠実度を維持する上で重要 … 続きを読む
ROSA: Reconstructing Object Shape and Appearance Textures by Adaptive Detail Transfer
要約 コロケートされた光の下でキャプチャされた限られた画像セットからの空間的に変 … 続きを読む