cs.MM」カテゴリーアーカイブ

Weakly-Supervised Temporal Article Grounding

要約 トリミングされていない長いビデオと自然言語のクエリが与えられた場合、ビデオ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Weakly-Supervised Temporal Article Grounding はコメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

要約 アニメの線画の自動彩色は、アニメ業界に大きなメリットをもたらすことから、近 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Attention-Aware Anime Line Drawing Colorization はコメントを受け付けていません

HDR image watermarking using saliency detection and quantization index modulation

要約 ハイ ダイナミック レンジ (HDR) 画像は、インターネット上で急速に流 … 続きを読む

カテゴリー: cs.CV, cs.MM | HDR image watermarking using saliency detection and quantization index modulation はコメントを受け付けていません

Topic-switch adapted Japanese Dialogue System based on PLATO-2

要約 PLATO-2 などの大規模なオープン ドメイン対話システムは、英語と中国 … 続きを読む

カテゴリー: cs.CL, cs.MM | Topic-switch adapted Japanese Dialogue System based on PLATO-2 はコメントを受け付けていません

Saliency detection and quantization index modulation based high payload HDR image watermarking

要約 ハイ ダイナミック レンジ (HDR) 画像は、インターネット上で急速に流 … 続きを読む

カテゴリー: cs.CV, cs.MM | Saliency detection and quantization index modulation based high payload HDR image watermarking はコメントを受け付けていません

Video-Text Retrieval by Supervised Multi-Space Multi-Grained Alignment

要約 ビデオテキスト検索の最近の進歩は、より良い表現学習の探求によって進歩しまし … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG, cs.MM | Video-Text Retrieval by Supervised Multi-Space Multi-Grained Alignment はコメントを受け付けていません

MultiViz: Towards Visualizing and Understanding Multimodal Models

要約 現実世界のアプリケーションに対するマルチモーダル モデルの可能性は、利害関 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MultiViz: Towards Visualizing and Understanding Multimodal Models はコメントを受け付けていません

Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions

要約 マルチモーダル機械学習は、言語、音響、視覚、触覚、生理学的メッセージなど、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions はコメントを受け付けていません

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

要約 一般化された深いモデルに対する緊急の需要により、BERT、ViT、GPT … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey はコメントを受け付けていません

Foundation Models for Natural Language Processing — Pre-trained Language Models Integrating Media

要約 このオープン アクセス ブックは、Foundation Models の研 … 続きを読む

カテゴリー: 68W20, 68W25, cs.CL, cs.CV, cs.LG, cs.MM, I.2.10 | Foundation Models for Natural Language Processing — Pre-trained Language Models Integrating Media はコメントを受け付けていません