cs.CV」カテゴリーアーカイブ

SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding

要約 マルチモーダル大手言語モデル(MLLMS)の急速な発展により、これらのモデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding はコメントを受け付けていません

X-Driver: Explainable Autonomous Driving with Vision-Language Models

要約 エンドツーエンドの自律運転は大幅に進歩しており、従来のパイプラインよりもオ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.ET, cs.RO | X-Driver: Explainable Autonomous Driving with Vision-Language Models はコメントを受け付けていません

CloudTrack: Scalable UAV Tracking with Cloud Semantics

要約 現在、無人航空機(UAV)は、検索エリアで情報を収集するために、検索および … 続きを読む

カテゴリー: cs.CV, cs.RO | CloudTrack: Scalable UAV Tracking with Cloud Semantics はコメントを受け付けていません

PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting

要約 自動運転車の安全性は、特に駐車中の緊急車両(警察車、救急車、消防隊)に衝突 … 続きを読む

カテゴリー: cs.CV, cs.LG | PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting はコメントを受け付けていません

Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models

要約 迅速な学習は、いくつかのショットシナリオで、事前に訓練されたビジョン言語モ … 続きを読む

カテゴリー: cs.AI, cs.CV | Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models はコメントを受け付けていません

Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections

要約 目的:この研究では、データの共有制限に対処し、最小限の侵襲的手術のためのデ … 続きを読む

カテゴリー: cs.CV, cs.LG | Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections はコメントを受け付けていません

Concept-Based Unsupervised Domain Adaptation

要約 コンセプトボトルネックモデル(CBMS)は、人間の理解可能な概念を通じて予 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Concept-Based Unsupervised Domain Adaptation はコメントを受け付けていません

Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning

要約 患者の転帰を改善するには、早期の検出と正確な診断が不可欠です。 腫瘍検出の … 続きを読む

カテゴリー: cs.CV, eess.IV | Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning はコメントを受け付けていません

EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution

要約 事前に訓練されたテキストからイメージ(T2I)拡散モデルを利用して、ブライ … 続きを読む

カテゴリー: cs.CV | EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution はコメントを受け付けていません

HQC-NBV: A Hybrid Quantum-Classical View Planning Approach

要約 効率的なビュー計画は、コンピュータービジョンとロボット認識における基本的な … 続きを読む

カテゴリー: cs.CV | HQC-NBV: A Hybrid Quantum-Classical View Planning Approach はコメントを受け付けていません