月別アーカイブ: 2024年7月

Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models

要約 Vision-and-Language Navigation (VLN) … 続きを読む

カテゴリー: cs.CL, cs.CV | Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models はコメントを受け付けていません

Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack

要約 オンライン ポータルを通じて合成開口レーダー (SAR) 画像に幅広くアク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack はコメントを受け付けていません

ProtoSAM – One Shot Medical Image Segmentation With Foundational Models

要約 この研究では、ワンショット医療画像セグメンテーションのための新しいフレーム … 続きを読む

カテゴリー: cs.AI, cs.CV | ProtoSAM – One Shot Medical Image Segmentation With Foundational Models はコメントを受け付けていません

Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline

要約 近年、Bird’s-Eye View (BEV) 表現に基づく … 続きを読む

カテゴリー: cs.CV | Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline はコメントを受け付けていません

CorMulT: A Semi-supervised Modality Correlation-aware Multimodal Transformer for Sentiment Analysis

要約 マルチモーダル感情分析は、テキスト、画像、音声などの複数のデータ モダリテ … 続きを読む

カテゴリー: cs.AI, cs.CV | CorMulT: A Semi-supervised Modality Correlation-aware Multimodal Transformer for Sentiment Analysis はコメントを受け付けていません

Region-Adaptive Transform with Segmentation Prior for Image Compression

要約 学習型画像圧縮 (LIC) は、近年目覚ましい進歩を見せています。 既存の … 続きを読む

カテゴリー: cs.CV, eess.IV | Region-Adaptive Transform with Segmentation Prior for Image Compression はコメントを受け付けていません

Latent Space Imaging

要約 デジタル イメージング システムは、伝統的に、規則的なグリッド上に編成され … 続きを読む

カテゴリー: cs.CV, eess.IV | Latent Space Imaging はコメントを受け付けていません

Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model

要約 現在の大規模マルチモーダル モデル (LMM) のほとんどは、すでに自然の … 続きを読む

カテゴリー: cs.CV | Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model はコメントを受け付けていません

CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement

要約 低照度画像強化 (LLIE) は、電話写真の需要の急増に伴って進歩してきま … 続きを読む

カテゴリー: cs.CV, eess.IV | CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement はコメントを受け付けていません

Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process

要約 拡散モデルは、さまざまな生成タスクにわたってその有効性を実証しています。 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process はコメントを受け付けていません