月別アーカイブ: 2024年1月

Variational Classification

要約 ニューラル ネットワークのソフトマックス分類器の新しい確率的解釈を提供する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Variational Classification はコメントを受け付けていません

Foundation Model for Endoscopy Video Analysis via Large-scale Self-supervised Pre-train

要約 Foundation モデルは、病気の診断やテキスト レポートの生成など、 … 続きを読む

カテゴリー: cs.CV | Foundation Model for Endoscopy Video Analysis via Large-scale Self-supervised Pre-train はコメントを受け付けていません

VKIE: The Application of Key Information Extraction on Video Text

要約 ビデオから構造化情報を抽出することは、業界の多数の下流アプリケーションにと … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | VKIE: The Application of Key Information Extraction on Video Text はコメントを受け付けていません

DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection

要約 エンコーダ/デコーダ アーキテクチャによって制限されるため、学習ベースのエ … 続きを読む

カテゴリー: cs.CV | DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection はコメントを受け付けていません

Perceptual Video Coding for Machines via Satisfied Machine Ratio Modeling

要約 Videocoding for Machines (VCM) は、機械分析 … 続きを読む

カテゴリー: cs.CV | Perceptual Video Coding for Machines via Satisfied Machine Ratio Modeling はコメントを受け付けていません

WaveletFormerNet: A Transformer-based Wavelet Network for Real-world Non-homogeneous and Dense Fog Removal

要約 ディープ畳み込みニューラル ネットワークは、合成霧の除去において目覚ましい … 続きを読む

カテゴリー: cs.CV | WaveletFormerNet: A Transformer-based Wavelet Network for Real-world Non-homogeneous and Dense Fog Removal はコメントを受け付けていません

Phase-shifted remote photoplethysmography for estimating heart rate and blood pressure from facial video

要約 人間の健康は、高血圧、不整脈、脳卒中などの心血管疾患によって重大な影響を受 … 続きを読む

カテゴリー: cs.CV | Phase-shifted remote photoplethysmography for estimating heart rate and blood pressure from facial video はコメントを受け付けていません

An Automatic Cascaded Model for Hemorrhagic Stroke Segmentation and Hemorrhagic Volume Estimation

要約 出血性脳卒中 (HS) は急速に発症し、健康に大きな脅威をもたらす重篤な状 … 続きを読む

カテゴリー: cs.CV, eess.IV | An Automatic Cascaded Model for Hemorrhagic Stroke Segmentation and Hemorrhagic Volume Estimation はコメントを受け付けていません

Let’s Go Shopping (LGS) — Web-Scale Image-Text Dataset for Visual Concept Understanding

要約 画像分類やキャプションなど、ニューラル ネットワークの視覚および視覚言語ア … 続きを読む

カテゴリー: cs.AI, cs.CV | Let’s Go Shopping (LGS) — Web-Scale Image-Text Dataset for Visual Concept Understanding はコメントを受け付けていません

Diverse super-resolution with pretrained deep hiererarchical VAEs

要約 私たちは、画像の超解像問題に対する多様な解決策を生み出す問題を調査します。 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Diverse super-resolution with pretrained deep hiererarchical VAEs はコメントを受け付けていません