cs.CV」カテゴリーアーカイブ

Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring

要約 OpenAI の GPT-4 Vision などの大規模ビジョン言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CV | Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring はコメントを受け付けていません

CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up

要約 拡散トランス (DiT) は、画像生成における主要なアーキテクチャとなって … 続きを読む

カテゴリー: cs.CV | CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up はコメントを受け付けていません

PruneVid: Visual Token Pruning for Efficient Video Large Language Models

要約 このペーパーでは、マルチモーダル ビデオの理解効率を高めるために設計された … 続きを読む

カテゴリー: cs.CV | PruneVid: Visual Token Pruning for Efficient Video Large Language Models はコメントを受け付けていません

POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search

要約 顔ランドマーク検出 (FLD) では、精度と効率のバランスを達成することが … 続きを読む

カテゴリー: cs.CV | POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search はコメントを受け付けていません

Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts

要約 この研究では、英語をベンチマークとして、ウルドゥー語、アルバニア語、タジク … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts はコメントを受け付けていません

Learning ECG Signal Features Without Backpropagation Using Linear Laws

要約 この論文では、理論物理学の概念を活用して時系列データから特徴を自動的に生成 … 続きを読む

カテゴリー: 62H30, 62M10, 68T10, 92C50, cs.AI, cs.CV, cs.LG, G.3, stat.AP, stat.ML | Learning ECG Signal Features Without Backpropagation Using Linear Laws はコメントを受け付けていません

LEDA: Log-Euclidean Diffeomorphic Autoencoder for Efficient Statistical Analysis of Diffeomorphism

要約 画像の位置合わせは、画像間の対応関係を確立する計算解剖学の中心的なタスクで … 続きを読む

カテゴリー: cs.CV, cs.LG | LEDA: Log-Euclidean Diffeomorphic Autoencoder for Efficient Statistical Analysis of Diffeomorphism はコメントを受け付けていません

Camera-Based Localization and Enhanced Normalized Mutual Information

要約 自動運転には、堅牢で優れた位置特定アルゴリズムが不可欠です。 このような車 … 続きを読む

カテゴリー: cs.CV, eess.SP, stat.AP | Camera-Based Localization and Enhanced Normalized Mutual Information はコメントを受け付けていません

NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems

要約 陸上および水上のインフラストラクチャの自律検査は急速に成長している市場であ … 続きを読む

カテゴリー: cs.CV | NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems はコメントを受け付けていません

Synthesizing Moving People with 3D Control

要約 この論文では、特定のターゲット 3D モーション シーケンスに対して単一の … 続きを読む

カテゴリー: cs.AI, cs.CV | Synthesizing Moving People with 3D Control はコメントを受け付けていません