cs.CV」カテゴリーアーカイブ

Spatiotemporal Blind-Spot Network with Calibrated Flow Alignment for Self-Supervised Video Denoising

要約 自己監視型ビデオのノイズ除去は、グラウンド トゥルース データに依存せずに … 続きを読む

カテゴリー: cs.CV | Spatiotemporal Blind-Spot Network with Calibrated Flow Alignment for Self-Supervised Video Denoising はコメントを受け付けていません

Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE)

要約 夜間に写真を撮影する場合、薄暗い環境に対処するために長時間露光を使用するこ … 続きを読む

カテゴリー: cs.CV | Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE) はコメントを受け付けていません

Learning from Synthetic Data for Visual Grounding

要約 この論文では、テキストによる説明を画像領域に基礎付けるための視覚および言語 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Learning from Synthetic Data for Visual Grounding はコメントを受け付けていません

RQFormer: Rotated Query Transformer for End-to-End Oriented Object Detection

要約 方向のあるオブジェクトの検出は、複数の方向、さまざまなスケール、および密な … 続きを読む

カテゴリー: cs.CV | RQFormer: Rotated Query Transformer for End-to-End Oriented Object Detection はコメントを受け付けていません

UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer

要約 画像キャプションは、画像の自然言語による説明を生成するもので、近年非常に人 … 続きを読む

カテゴリー: cs.CV | UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer はコメントを受け付けていません

Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges

要約 水中探査と監視への関心が高まるにつれ、自律型水中車両 (AUV) が不可欠 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.SP | Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges はコメントを受け付けていません

Ensemble Learning and 3D Pix2Pix for Comprehensive Brain Tumor Analysis in Multimodal MRI

要約 マルチモーダル磁気共鳴画像法 (MRI) における神経膠腫の影響を受けた脳 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Ensemble Learning and 3D Pix2Pix for Comprehensive Brain Tumor Analysis in Multimodal MRI はコメントを受け付けていません

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む

カテゴリー: cs.AI, cs.CV | Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering はコメントを受け付けていません

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

要約 マルチモーダル大規模言語モデル (MLLM) は、一般的なタスクには熟練し … 続きを読む

カテゴリー: cs.CL, cs.CV | GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training はコメントを受け付けていません

Event-based Motion Deblurring via Multi-Temporal Granularity Fusion

要約 従来のフレームベースのカメラでは、露光時間中に発生する動きにより、必然的に … 続きを読む

カテゴリー: cs.CV | Event-based Motion Deblurring via Multi-Temporal Granularity Fusion はコメントを受け付けていません