「cs.MM」カテゴリーアーカイブ

Deeply-Coupled Convolution-Transformer with Spatial-temporal Complementary Learning for Video-based Person Re-identification

投稿日: 2023年4月28日作成者: jarxiv

要約タイトル：深い相互コンビューション・空間・時間相補的学習を持つ転送器を用い … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.MM | コメントを受け付けていません

Figments and Misalignments: A Framework for Fine-grained Crossmodal Misinformation Detection

投稿日: 2023年4月28日作成者: jarxiv

要約タイトル：フィグメンツとミスアライメント：細かい交差モーダルの誤情報検出の … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Listen2Scene: Interactive material-aware binaural sound propagation for reconstructed 3D scenes

投稿日: 2023年4月27日作成者: jarxiv

要約タイトル：再構成された3Dシーンのためのインタラクティブな物質に注意を払っ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

TCR: Short Video Title Generation and Cover Selection with Attention Refinement

投稿日: 2023年4月26日作成者: jarxiv

要約タイトル：TCR：アテンションリファインメントによる短い動画のタイトル生成 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Listen2Scene: Interactive material-aware binaural soundbpropagation for reconstructed 3D scenes

投稿日: 2023年4月26日作成者: jarxiv

要約タイトル： Listen2Scene：再構築された3Dシーンのためのインタ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

MMC: Multi-Modal Colorization of Images using Textual Descriptions

投稿日: 2023年4月26日作成者: jarxiv

要約タイトル：テキスト説明を用いた画像のマルチモーダルカラーリング（MMC） … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection

投稿日: 2023年4月25日作成者: jarxiv

要約タイトル：多様な憎悪検知のためのトポロジー認識最適輸送要約： &#821 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM | コメントを受け付けていません

Robust and Efficient Memory Network for Video Object Segmentation

投稿日: 2023年4月25日作成者: jarxiv

要約タイトル：ビデオオブジェクトセグメンテーションのための堅牢かつ効率的なメモ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

MMC: Multi-Modal Colorization of Images using Textual Descriptions

投稿日: 2023年4月25日作成者: jarxiv

要約タイトル：テキスト記述を用いたマルチモーダル画像着色（MMC: Multi … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

GRIG: Few-Shot Generative Residual Image Inpainting

投稿日: 2023年4月25日作成者: jarxiv

要約タイトル：GRIG: Few-Shot Generative Residu … 続きを読む →

カテゴリー: cs.CV, cs.MM, I.4.4 | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Deeply-Coupled Convolution-Transformer with Spatial-temporal Complementary Learning for Video-based Person Re-identification

Figments and Misalignments: A Framework for Fine-grained Crossmodal Misinformation Detection

Listen2Scene: Interactive material-aware binaural sound propagation for reconstructed 3D scenes

TCR: Short Video Title Generation and Cover Selection with Attention Refinement

Listen2Scene: Interactive material-aware binaural soundbpropagation for reconstructed 3D scenes

MMC: Multi-Modal Colorization of Images using Textual Descriptions

TOT: Topology-Aware Optimal Transport For Multimodal Hate Detection

Robust and Efficient Memory Network for Video Object Segmentation

MMC: Multi-Modal Colorization of Images using Textual Descriptions

GRIG: Few-Shot Generative Residual Image Inpainting

最近の投稿

最近のコメント

アーカイブ

カテゴリー