-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding
要約 マルチモーダル大手言語モデル(MLLMS)の急速な発展により、これらのモデ … 続きを読む
X-Driver: Explainable Autonomous Driving with Vision-Language Models
要約 エンドツーエンドの自律運転は大幅に進歩しており、従来のパイプラインよりもオ … 続きを読む
CloudTrack: Scalable UAV Tracking with Cloud Semantics
要約 現在、無人航空機(UAV)は、検索エリアで情報を収集するために、検索および … 続きを読む
PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting
要約 自動運転車の安全性は、特に駐車中の緊急車両(警察車、救急車、消防隊)に衝突 … 続きを読む
Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models
要約 迅速な学習は、いくつかのショットシナリオで、事前に訓練されたビジョン言語モ … 続きを読む
Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections
要約 目的:この研究では、データの共有制限に対処し、最小限の侵襲的手術のためのデ … 続きを読む
Concept-Based Unsupervised Domain Adaptation
要約 コンセプトボトルネックモデル(CBMS)は、人間の理解可能な概念を通じて予 … 続きを読む
Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning
要約 患者の転帰を改善するには、早期の検出と正確な診断が不可欠です。 腫瘍検出の … 続きを読む
EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution
要約 事前に訓練されたテキストからイメージ(T2I)拡散モデルを利用して、ブライ … 続きを読む
カテゴリー: cs.CV
EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution はコメントを受け付けていません
HQC-NBV: A Hybrid Quantum-Classical View Planning Approach
要約 効率的なビュー計画は、コンピュータービジョンとロボット認識における基本的な … 続きを読む
カテゴリー: cs.CV
HQC-NBV: A Hybrid Quantum-Classical View Planning Approach はコメントを受け付けていません