投稿者「jarxiv」のアーカイブ

Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos

投稿日: 2025年6月17日作成者: jarxiv

要約教育ビデオコンテンツでの視覚オブジェクト検出のための新しいベンチマークであ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model

投稿日: 2025年6月17日作成者: jarxiv

要約マルチモーダルメディカルイメージングは、構造的および機能的なニューロイ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

ROSA: Harnessing Robot States for Vision-Language and Action Alignment

投稿日: 2025年6月17日作成者: jarxiv

要約ビジョン言語モデル（VLM）の強力な一般化能力により、ビジョン言語アクショ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning

投稿日: 2025年6月17日作成者: jarxiv

要約この研究では、ECGシグナルからのハートビートの分類に対処します。2つの異 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.SP | コメントを受け付けていません

UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions

投稿日: 2025年6月17日作成者: jarxiv

要約ビデオデータセットの品質（画質、解像度、および細かいキャプション）は、ビデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry

投稿日: 2025年6月17日作成者: jarxiv

要約ビデオカメラの軌跡編集のための新しいフレームワークであるVID-CAMED … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data

投稿日: 2025年6月17日作成者: jarxiv

要約山火事は、生態系、野生生物、および人間のコミュニティに大きな脅威をもたらし … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection

投稿日: 2025年6月17日作成者: jarxiv

要約イベントカメラは、潜時が低い、時間分解能が高く、エネルギー効率が低いため、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning

投稿日: 2025年6月17日作成者: jarxiv

要約 Transductive Zero-Shot Learning（ZSL）は … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Test3R: Learning to Reconstruct 3D at Test Time

投稿日: 2025年6月17日作成者: jarxiv

要約 3D再構成のためのDust3R回帰ペアワイズポイントマップなどの密なマッチ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos

MultiViT2: A Data-augmented Multimodal Neuroimaging Prediction Framework via Latent Diffusion Model

ROSA: Harnessing Robot States for Vision-Language and Action Alignment

Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning

UltraVideo: High-Quality UHD Video Dataset with Comprehensive Captions

Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry

Deep Learning for Wildfire Risk Prediction: Integrating Remote Sensing and Environmental Data

How Real is CARLAs Dynamic Vision Sensor? A Study on the Sim-to-Real Gap in Traffic Object Detection

OTFusion: Bridging Vision-only and Vision-Language Models via Optimal Transport for Transductive Zero-Shot Learning

Test3R: Learning to Reconstruct 3D at Test Time

最近の投稿

最近のコメント

アーカイブ

カテゴリー