cs.MM」カテゴリーアーカイブ

PheME: A deep ensemble framework for improving phenotype prediction from multi-modal data

要約 【タイトル】PheME:マルチモーダルデータからの表現型予測を改善する深層 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.MM, q-bio.QM | PheME: A deep ensemble framework for improving phenotype prediction from multi-modal data はコメントを受け付けていません

Retrieval-based Knowledge Augmented Vision Language Pre-training

要約 タイトル:検索ベースの知識付与ビジョン言語事前学習 要約: -最近の大規模 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Retrieval-based Knowledge Augmented Vision Language Pre-training はコメントを受け付けていません

Robust Cross-Modal Knowledge Distillation for Unconstrained Videos

要約 【タイトル】制約のないビデオに対する強力なクロスモーダル知識蒸留 【要約】 … 続きを読む

カテゴリー: cs.CV, cs.MM | Robust Cross-Modal Knowledge Distillation for Unconstrained Videos はコメントを受け付けていません

Automatic Localization and Detection Applicable to Robust Image Watermarking Resisting against Camera Shooting

要約 タイトル:カメラ撮影に対抗可能な頑健な画像透かしに適用可能な自動ローカリゼ … 続きを読む

カテゴリー: cs.CV, cs.MM | Automatic Localization and Detection Applicable to Robust Image Watermarking Resisting against Camera Shooting はコメントを受け付けていません

Deeply-Coupled Convolution-Transformer with Spatial-temporal Complementary Learning for Video-based Person Re-identification

要約 タイトル:深い相互コンビューション・空間・時間相補的学習を持つ転送器を用い … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | Deeply-Coupled Convolution-Transformer with Spatial-temporal Complementary Learning for Video-based Person Re-identification はコメントを受け付けていません

Figments and Misalignments: A Framework for Fine-grained Crossmodal Misinformation Detection

要約 タイトル:フィグメンツとミスアライメント:細かい交差モーダルの誤情報検出の … 続きを読む

カテゴリー: cs.CV, cs.MM | Figments and Misalignments: A Framework for Fine-grained Crossmodal Misinformation Detection はコメントを受け付けていません

Listen2Scene: Interactive material-aware binaural sound propagation for reconstructed 3D scenes

要約 タイトル:再構成された3Dシーンのためのインタラクティブな物質に注意を払っ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Listen2Scene: Interactive material-aware binaural sound propagation for reconstructed 3D scenes はコメントを受け付けていません

TCR: Short Video Title Generation and Cover Selection with Attention Refinement

要約 タイトル:TCR:アテンションリファインメントによる短い動画のタイトル生成 … 続きを読む

カテゴリー: cs.CV, cs.MM | TCR: Short Video Title Generation and Cover Selection with Attention Refinement はコメントを受け付けていません

Listen2Scene: Interactive material-aware binaural soundbpropagation for reconstructed 3D scenes

要約 タイトル: Listen2Scene:再構築された3Dシーンのためのインタ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Listen2Scene: Interactive material-aware binaural soundbpropagation for reconstructed 3D scenes はコメントを受け付けていません

MMC: Multi-Modal Colorization of Images using Textual Descriptions

要約 タイトル:テキスト説明を用いた画像のマルチモーダルカラーリング(MMC) … 続きを読む

カテゴリー: cs.CV, cs.MM | MMC: Multi-Modal Colorization of Images using Textual Descriptions はコメントを受け付けていません