「cs.MM」カテゴリーアーカイブ

Weakly-Supervised Temporal Article Grounding

投稿日: 2023年2月27日作成者: jarxiv

要約トリミングされていない長いビデオと自然言語のクエリが与えられた場合、ビデオ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

投稿日: 2023年2月27日作成者: jarxiv

要約アニメの線画の自動彩色は、アニメ業界に大きなメリットをもたらすことから、近 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | コメントを受け付けていません

HDR image watermarking using saliency detection and quantization index modulation

投稿日: 2023年2月24日作成者: jarxiv

要約ハイダイナミックレンジ (HDR) 画像は、インターネット上で急速に流 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Topic-switch adapted Japanese Dialogue System based on PLATO-2

投稿日: 2023年2月23日作成者: jarxiv

要約 PLATO-2 などの大規模なオープンドメイン対話システムは、英語と中国 … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

Saliency detection and quantization index modulation based high payload HDR image watermarking

投稿日: 2023年2月23日作成者: jarxiv

要約ハイダイナミックレンジ (HDR) 画像は、インターネット上で急速に流 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Video-Text Retrieval by Supervised Multi-Space Multi-Grained Alignment

投稿日: 2023年2月21日作成者: jarxiv

要約ビデオテキスト検索の最近の進歩は、より良い表現学習の探求によって進歩しまし … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG, cs.MM | コメントを受け付けていません

MultiViz: Towards Visualizing and Understanding Multimodal Models

投稿日: 2023年2月21日作成者: jarxiv

要約現実世界のアプリケーションに対するマルチモーダルモデルの可能性は、利害関 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions

投稿日: 2023年2月21日作成者: jarxiv

要約マルチモーダル機械学習は、言語、音響、視覚、触覚、生理学的メッセージなど、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

投稿日: 2023年2月21日作成者: jarxiv

要約一般化された深いモデルに対する緊急の需要により、BERT、ViT、GPT … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Foundation Models for Natural Language Processing — Pre-trained Language Models Integrating Media

投稿日: 2023年2月20日作成者: jarxiv

要約このオープンアクセスブックは、Foundation Models の研 … 続きを読む →

カテゴリー: 68W20, 68W25, cs.CL, cs.CV, cs.LG, cs.MM, I.2.10 | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Weakly-Supervised Temporal Article Grounding

Attention-Aware Anime Line Drawing Colorization

HDR image watermarking using saliency detection and quantization index modulation

Topic-switch adapted Japanese Dialogue System based on PLATO-2

Saliency detection and quantization index modulation based high payload HDR image watermarking

Video-Text Retrieval by Supervised Multi-Space Multi-Grained Alignment

MultiViz: Towards Visualizing and Understanding Multimodal Models

Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Foundation Models for Natural Language Processing — Pre-trained Language Models Integrating Media

最近の投稿

最近のコメント

アーカイブ

カテゴリー