「cs.CV」カテゴリーアーカイブ

SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding

投稿日: 2025年5月9日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）の急速な発展により、これらのモデ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

X-Driver: Explainable Autonomous Driving with Vision-Language Models

投稿日: 2025年5月9日作成者: jarxiv

要約エンドツーエンドの自律運転は大幅に進歩しており、従来のパイプラインよりもオ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.ET, cs.RO | コメントを受け付けていません

CloudTrack: Scalable UAV Tracking with Cloud Semantics

投稿日: 2025年5月9日作成者: jarxiv

要約現在、無人航空機（UAV）は、検索エリアで情報を収集するために、検索および … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting

投稿日: 2025年5月9日作成者: jarxiv

要約自動運転車の安全性は、特に駐車中の緊急車両（警察車、救急車、消防隊）に衝突 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models

投稿日: 2025年5月9日作成者: jarxiv

要約迅速な学習は、いくつかのショットシナリオで、事前に訓練されたビジョン言語モ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections

投稿日: 2025年5月9日作成者: jarxiv

要約目的：この研究では、データの共有制限に対処し、最小限の侵襲的手術のためのデ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Concept-Based Unsupervised Domain Adaptation

投稿日: 2025年5月9日作成者: jarxiv

要約コンセプトボトルネックモデル（CBMS）は、人間の理解可能な概念を通じて予 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning

投稿日: 2025年5月9日作成者: jarxiv

要約患者の転帰を改善するには、早期の検出と正確な診断が不可欠です。腫瘍検出の … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution

投稿日: 2025年5月9日作成者: jarxiv

要約事前に訓練されたテキストからイメージ（T2I）拡散モデルを利用して、ブライ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HQC-NBV: A Hybrid Quantum-Classical View Planning Approach

投稿日: 2025年5月9日作成者: jarxiv

要約効率的なビュー計画は、コンピュータービジョンとロボット認識における基本的な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding

X-Driver: Explainable Autonomous Driving with Vision-Language Models

CloudTrack: Scalable UAV Tracking with Cloud Semantics

PaniCar: Securing the Perception of Advanced Driving Assistance Systems Against Emergency Vehicle Lighting

Biomed-DPT: Dual Modality Prompt Tuning for Biomedical Vision-Language Models

Federated EndoViT: Pretraining Vision Transformers via Federated Learning on Endoscopic Image Collections

Concept-Based Unsupervised Domain Adaptation

Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning

EAM: Enhancing Anything with Diffusion Transformers for Blind Super-Resolution

HQC-NBV: A Hybrid Quantum-Classical View Planning Approach

最近の投稿

最近のコメント

アーカイブ

カテゴリー