「cs.CV」カテゴリーアーカイブ

Spatiotemporal Blind-Spot Network with Calibrated Flow Alignment for Self-Supervised Video Denoising

投稿日: 2024年12月17日作成者: jarxiv

要約自己監視型ビデオのノイズ除去は、グラウンドトゥルースデータに依存せずに … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE)

投稿日: 2024年12月17日作成者: jarxiv

要約夜間に写真を撮影する場合、薄暗い環境に対処するために長時間露光を使用するこ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Learning from Synthetic Data for Visual Grounding

投稿日: 2024年12月17日作成者: jarxiv

要約この論文では、テキストによる説明を画像領域に基礎付けるための視覚および言語 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

RQFormer: Rotated Query Transformer for End-to-End Oriented Object Detection

投稿日: 2024年12月17日作成者: jarxiv

要約方向のあるオブジェクトの検出は、複数の方向、さまざまなスケール、および密な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer

投稿日: 2024年12月17日作成者: jarxiv

要約画像キャプションは、画像の自然言語による説明を生成するもので、近年非常に人 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges

投稿日: 2024年12月17日作成者: jarxiv

要約水中探査と監視への関心が高まるにつれ、自律型水中車両 (AUV) が不可欠 … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.SP | コメントを受け付けていません

Ensemble Learning and 3D Pix2Pix for Comprehensive Brain Tumor Analysis in Multimodal MRI

投稿日: 2024年12月17日作成者: jarxiv

要約マルチモーダル磁気共鳴画像法 (MRI) における神経膠腫の影響を受けた脳 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

投稿日: 2024年12月17日作成者: jarxiv

要約 Text-to-Image（TTI）生成モデルは目覚ましい成功を収めている … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

投稿日: 2024年12月17日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、一般的なタスクには熟練し … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Event-based Motion Deblurring via Multi-Temporal Granularity Fusion

投稿日: 2024年12月17日作成者: jarxiv

要約従来のフレームベースのカメラでは、露光時間中に発生する動きにより、必然的に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Spatiotemporal Blind-Spot Network with Calibrated Flow Alignment for Self-Supervised Video Denoising

Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE)

Learning from Synthetic Data for Visual Grounding

RQFormer: Rotated Query Transformer for End-to-End Oriented Object Detection

UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer

Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges

Ensemble Learning and 3D Pix2Pix for Comprehensive Brain Tumor Analysis in Multimodal MRI

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

Event-based Motion Deblurring via Multi-Temporal Granularity Fusion

最近の投稿

最近のコメント

アーカイブ

カテゴリー