cs.MM」カテゴリーアーカイブ

Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content

要約 近年、ユーザー生成コンテンツ (UGC) ビデオがインターネットを支配して … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content はコメントを受け付けていません

Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval

要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval はコメントを受け付けていません

FlowGrad: Using Motion for Visual Sound Source Localization

要約 視覚的な音源定位に関する最新の研究は、自己管理型の方法で学習されたセマンテ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | FlowGrad: Using Motion for Visual Sound Source Localization はコメントを受け付けていません

AI4Food-NutritionDB: Food Image Database, Nutrition Taxonomy, and Recognition Benchmark

要約 健康的なライフスタイルをリードすることは、座りっぱなしのライフスタイルと貧 … 続きを読む

カテゴリー: cs.CV, cs.MM | AI4Food-NutritionDB: Food Image Database, Nutrition Taxonomy, and Recognition Benchmark はコメントを受け付けていません

Investigating Modality Bias in Audio Visual Video Parsing

要約 オーディオとビジュアルのイベント ラベルを時間境界で検出することを含むオー … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | Investigating Modality Bias in Audio Visual Video Parsing はコメントを受け付けていません

DrawMon: A Distributed System for Detection of Atypical Sketch Content in Concurrent Pictionary Games

要約 人気のあるスケッチ ベースの推測ゲームである Pictionary は、制 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | DrawMon: A Distributed System for Detection of Atypical Sketch Content in Concurrent Pictionary Games はコメントを受け付けていません

MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation

要約 マルチモーダル コンテンツで応答することは、インテリジェントな会話型エージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation はコメントを受け付けていません

Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content

要約 近年、UGC(User-Generated-Content)動画がインター … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content はコメントを受け付けていません

Using Set Covering to Generate Databases for Holistic Steganalysis

要約 運用フレームワークの中で、ステガノグラファーが使用するカバーは、研究者がス … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Using Set Covering to Generate Databases for Holistic Steganalysis はコメントを受け付けていません

MarginNCE: Robust Sound Localization with a Negative Margin

要約 本研究の目的は、自己教師付きアプローチにより、視覚的シーンにおける音源の位 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | MarginNCE: Robust Sound Localization with a Negative Margin はコメントを受け付けていません