「cs.CV」カテゴリーアーカイブ

Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring

投稿日: 2024年12月23日作成者: jarxiv

要約 OpenAI の GPT-4 Vision などの大規模ビジョン言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up

投稿日: 2024年12月23日作成者: jarxiv

要約拡散トランス (DiT) は、画像生成における主要なアーキテクチャとなって … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PruneVid: Visual Token Pruning for Efficient Video Large Language Models

投稿日: 2024年12月23日作成者: jarxiv

要約このペーパーでは、マルチモーダルビデオの理解効率を高めるために設計された … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search

投稿日: 2024年12月23日作成者: jarxiv

要約顔ランドマーク検出 (FLD) では、精度と効率のバランスを達成することが … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts

投稿日: 2024年12月23日作成者: jarxiv

要約この研究では、英語をベンチマークとして、ウルドゥー語、アルバニア語、タジク … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Learning ECG Signal Features Without Backpropagation Using Linear Laws

投稿日: 2024年12月23日作成者: jarxiv

要約この論文では、理論物理学の概念を活用して時系列データから特徴を自動的に生成 … 続きを読む →

カテゴリー: 62H30, 62M10, 68T10, 92C50, cs.AI, cs.CV, cs.LG, G.3, stat.AP, stat.ML | コメントを受け付けていません

LEDA: Log-Euclidean Diffeomorphic Autoencoder for Efficient Statistical Analysis of Diffeomorphism

投稿日: 2024年12月23日作成者: jarxiv

要約画像の位置合わせは、画像間の対応関係を確立する計算解剖学の中心的なタスクで … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Camera-Based Localization and Enhanced Normalized Mutual Information

投稿日: 2024年12月23日作成者: jarxiv

要約自動運転には、堅牢で優れた位置特定アルゴリズムが不可欠です。このような車 … 続きを読む →

カテゴリー: cs.CV, eess.SP, stat.AP | コメントを受け付けていません

NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems

投稿日: 2024年12月23日作成者: jarxiv

要約陸上および水上のインフラストラクチャの自律検査は急速に成長している市場であ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Synthesizing Moving People with 3D Control

投稿日: 2024年12月23日作成者: jarxiv

要約この論文では、特定のターゲット 3D モーションシーケンスに対して単一の … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Demystifying the Potential of ChatGPT-4 Vision for Construction Progress Monitoring

CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up

PruneVid: Visual Token Pruning for Efficient Video Large Language Models

POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search

Deciphering the Underserved: Benchmarking LLM OCR for Low-Resource Scripts

Learning ECG Signal Features Without Backpropagation Using Linear Laws

LEDA: Log-Euclidean Diffeomorphic Autoencoder for Efficient Statistical Analysis of Diffeomorphism

Camera-Based Localization and Enhanced Normalized Mutual Information

NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems

Synthesizing Moving People with 3D Control

最近の投稿

最近のコメント

アーカイブ

カテゴリー