cs.MM」カテゴリーアーカイブ

MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation

要約 マルチモーダル コンテンツで応答することは、インテリジェントな会話型エージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation はコメントを受け付けていません

Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content

要約 近年、UGC(User-Generated-Content)動画がインター … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | Disentangling Aesthetic and Technical Effects for Video Quality Assessment of User Generated Content はコメントを受け付けていません

Using Set Covering to Generate Databases for Holistic Steganalysis

要約 運用フレームワークの中で、ステガノグラファーが使用するカバーは、研究者がス … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Using Set Covering to Generate Databases for Holistic Steganalysis はコメントを受け付けていません

MarginNCE: Robust Sound Localization with a Negative Margin

要約 本研究の目的は、自己教師付きアプローチにより、視覚的シーンにおける音源の位 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | MarginNCE: Robust Sound Localization with a Negative Margin はコメントを受け付けていません

Recovering Sign Bits of DCT Coefficients in Digital Images as an Optimization Problem

要約 DCT 係数の不明な情報、欠落情報、破損情報、歪んだ情報、または失われた情 … 続きを読む

カテゴリー: 68P30, cs.CV, cs.MM | Recovering Sign Bits of DCT Coefficients in Digital Images as an Optimization Problem はコメントを受け付けていません

Universal Perturbation Attack on Differentiable No-Reference Image- and Video-Quality Metrics

要約 普遍的な敵対的摂動攻撃は、畳み込みニューラル ネットワークを使用する画像分 … 続きを読む

カテゴリー: cs.CV, cs.MM | Universal Perturbation Attack on Differentiable No-Reference Image- and Video-Quality Metrics はコメントを受け付けていません

Point-Syn2Real: Semi-Supervised Synthetic-to-Real Cross-Domain Learning for Object Classification in 3D Point Clouds

要約 LiDAR 3D 点群データを使用したオブジェクト分類は、自動運転などの最 … 続きを読む

カテゴリー: cs.CV, cs.MM | Point-Syn2Real: Semi-Supervised Synthetic-to-Real Cross-Domain Learning for Object Classification in 3D Point Clouds はコメントを受け付けていません

Combining Automatic Speaker Verification and Prosody Analysis for Synthetic Speech Detection

要約 メディア コンテンツ合成技術の急速な普及と、オーディオとビデオのディープフ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Combining Automatic Speaker Verification and Prosody Analysis for Synthetic Speech Detection はコメントを受け付けていません

ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network

要約 このホワイト ペーパーでは、ViGAT と呼ばれる純粋な注意のボトムアップ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network はコメントを受け付けていません

FedVMR: A New Federated Learning method for Video Moment Retrieval

要約 大きな成功を収めたにもかかわらず、既存のビデオ モーメント検索 (VMR) … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | FedVMR: A New Federated Learning method for Video Moment Retrieval はコメントを受け付けていません