cs.MM」カテゴリーアーカイブ

Rethinking Data Augmentation for Robust Visual Question Answering

要約 データ拡張(DA)(元のトレーニングセットを超える追加のトレーニングサンプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Rethinking Data Augmentation for Robust Visual Question Answering はコメントを受け付けていません

EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA

要約 Text-VQAの自由形式の質問応答タスクでは、画像のめったに見られない、 … 続きを読む

カテゴリー: cs.CV, cs.MM | EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQA はコメントを受け付けていません

Semi-Supervised Temporal Action Detection with Proposal-Free Masking

要約 既存の時間的行動検出(TAD)メソッドは、セグメントレベルの注釈付きの多数 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Semi-Supervised Temporal Action Detection with Proposal-Free Masking はコメントを受け付けていません

Explaining Image Enhancement Black-Box Methods through a Path Planning Based Algorithm

要約 今日、画像から画像への翻訳方法は、自然な画像を強調するための最先端技術です … 続きを読む

カテゴリー: cs.CV, cs.MM | Explaining Image Enhancement Black-Box Methods through a Path Planning Based Algorithm はコメントを受け付けていません

Dress Code: High-Resolution Multi-Category Virtual Try-On

要約 画像ベースの仮想試着は、衣料品の外観を対象者の画像に転写することを目的とし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Dress Code: High-Resolution Multi-Category Virtual Try-On はコメントを受け付けていません

RTN: Reinforced Transformer Network for Coronary CT Angiography Vessel-level Image Quality Assessment

要約 冠状動脈CT血管造影(CCTA)は、心血管疾患の正確な診断を著しく損なうさ … 続きを読む

カテゴリー: cs.CV, cs.MM | RTN: Reinforced Transformer Network for Coronary CT Angiography Vessel-level Image Quality Assessment はコメントを受け付けていません

Intra-Modal Constraint Loss For Image-Text Retrieval

要約 クロスモーダル検索は、コンピュータービジョンと自然言語処理の両方の分野で大 … 続きを読む

カテゴリー: cs.CV, cs.MM | Intra-Modal Constraint Loss For Image-Text Retrieval はコメントを受け付けていません

Modality-Aware Contrastive Instance Learning with Self-Distillation for Weakly-Supervised Audio-Visual Violence Detection

要約 弱く監視された視聴覚暴力の検出は、ビデオレベルのラベルを持つマルチモーダル … 続きを読む

カテゴリー: cs.CV, cs.MM | Modality-Aware Contrastive Instance Learning with Self-Distillation for Weakly-Supervised Audio-Visual Violence Detection はコメントを受け付けていません

Long-term Leap Attention, Short-term Periodic Shift for Video Classification

要約 ビデオトランスフォーマーは、静的ビジョントランスフォーマーよりも計算負荷が … 続きを読む

カテゴリー: cs.CV, cs.MM | Long-term Leap Attention, Short-term Periodic Shift for Video Classification はコメントを受け付けていません

Learning from Label Relationships in Human Affect

要約 自動化された方法での人間の影響と精神状態の推定は、時間分解能が低いかまった … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | Learning from Label Relationships in Human Affect はコメントを受け付けていません