「cs.MM」カテゴリーアーカイブ

Comprint: Image Forgery Detection and Localization using Compression Fingerprints

投稿日: 2022年10月6日作成者: jarxiv

要約画像をリアルに編集する操作ツールが広く出回っているため、誰でも簡単に誤報を … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Hiding Images in Deep Probabilistic Models

投稿日: 2022年10月6日作成者: jarxiv

要約近年、ディープニューラルネットワーク（DNN）を用いたデータハイディングが … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.MM | コメントを受け付けていません

Promising or Elusive? Unsupervised Object Segmentation from Real-world Single Images

投稿日: 2022年10月6日作成者: jarxiv

要約本論文では、単一画像からの教師無しオブジェクトセグメンテーションの問題を研 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.RO | コメントを受け付けていません

Geometry Driven Progressive Warping for One-Shot Face Animation

投稿日: 2022年10月6日作成者: jarxiv

要約フェイスアニメーションは、ポーズや表情がアニメーションするフォトリアリステ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Learning Semantic Ambiguities for Zero-Shot Learning

投稿日: 2022年9月29日作成者: jarxiv

要約ゼロショット学習 (ZSL) は、トレーニング時に視覚的なサンプルが利用で … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

CALIP: Zero-Shot Enhancement of CLIP with Parameter-free Attention

投稿日: 2022年9月29日作成者: jarxiv

要約 Contrastive Language-Image Pre-traini … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

投稿日: 2022年9月29日作成者: jarxiv

要約ユーモアは、人間の感情と認識の重要な要素です。その自動理解は、より自然な … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Marine Video Kit: A New Marine Video Dataset for Content-based Analysis and Retrieval

投稿日: 2022年9月26日作成者: jarxiv

要約異常なドメイン固有のビデオコレクションの効果的な分析は、最先端の汎用モデ … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.MM | コメントを受け付けていません

Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval

投稿日: 2022年9月26日作成者: jarxiv

要約マルチメディア情報検索でますます一般的なタスクとして、ビデオモーメント検 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | コメントを受け付けていません

Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering

投稿日: 2022年9月22日作成者: jarxiv

要約 Text-based Visual Question Answering~ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Comprint: Image Forgery Detection and Localization using Compression Fingerprints

Hiding Images in Deep Probabilistic Models

Promising or Elusive? Unsupervised Object Segmentation from Real-world Single Images

Geometry Driven Progressive Warping for One-Shot Face Animation

Learning Semantic Ambiguities for Zero-Shot Learning

CALIP: Zero-Shot Enhancement of CLIP with Parameter-free Attention

Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

Marine Video Kit: A New Marine Video Dataset for Content-based Analysis and Retrieval

Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval

Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering

最近の投稿

最近のコメント

アーカイブ

カテゴリー