cs.CV」カテゴリーアーカイブ

Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos

要約 教育ビデオコンテンツでの視覚オブジェクト検出のための新しいベンチマークであ … 続きを読む

カテゴリー: cs.CV, cs.LG | Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos はコメントを受け付けていません

MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model

要約 マルチモーダルメディカルイメージングは​​、構造的および機能的なニューロイ … 続きを読む

カテゴリー: cs.CV, eess.IV | MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model はコメントを受け付けていません

ROSA: Harnessing Robot States for Vision-Language and Action Alignment

要約 ビジョン言語モデル(VLM)の強力な一般化能力により、ビジョン言語アクショ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | ROSA: Harnessing Robot States for Vision-Language and Action Alignment はコメントを受け付けていません

Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning

要約 この研究では、ECGシグナルからのハートビートの分類に対処します。2つの異 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.SP | Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning はコメントを受け付けていません

UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions

要約 ビデオデータセットの品質(画質、解像度、および細かいキャプション)は、ビデ … 続きを読む

カテゴリー: cs.CV | UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions はコメントを受け付けていません

Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry

要約 ビデオカメラの軌跡編集のための新しいフレームワークであるVID-CAMED … 続きを読む

カテゴリー: cs.CV | Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry はコメントを受け付けていません

Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data

要約 山火事は、生態系、野生生物、および人間のコミュニティに大きな脅威をもたらし … 続きを読む

カテゴリー: cs.CV, cs.LG | Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data はコメントを受け付けていません

How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection

要約 イベントカメラは、潜時が低い、時間分解能が高く、エネルギー効率が低いため、 … 続きを読む

カテゴリー: cs.CV | How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection はコメントを受け付けていません

OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning

要約 Transductive Zero-Shot Learning(ZSL)は … 続きを読む

カテゴリー: cs.CV | OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning はコメントを受け付けていません

Test3R: Learning to Reconstruct 3D at Test Time

要約 3D再構成のためのDust3R回帰ペアワイズポイントマップなどの密なマッチ … 続きを読む

カテゴリー: cs.CV | Test3R: Learning to Reconstruct 3D at Test Time はコメントを受け付けていません