cs.MM」カテゴリーアーカイブ

Bi-Calibration Networks for Weakly-Supervised Video Representation Learning

要約 検索されたクエリまたは周囲のテキスト(タイトルなど)と組み合わせた大量のW … 続きを読む

カテゴリー: cs.CV, cs.MM | Bi-Calibration Networks for Weakly-Supervised Video Representation Learning はコメントを受け付けていません

Grounded Language-Image Pre-training

要約 このホワイトペーパーでは、オブジェクトレベル、言語認識、およびセマンティッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Grounded Language-Image Pre-training はコメントを受け付けていません

whu-nercms at trecvid2021:instance search task

要約 論文のTRECVID2021でWHU-NERCMSの実験方法と結果を簡単に … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | whu-nercms at trecvid2021:instance search task はコメントを受け付けていません

Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval

要約 この研究の目標は、細粒度の製品カテゴリに対して、弱教師ありマルチモーダルイ … 続きを読む

カテゴリー: cs.CV, cs.DB, cs.IR, cs.MM | Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval はコメントを受け付けていません

SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning

要約 3D環境向けのオンザフライのジオメトリベースのオーディオレンダリング用のプ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | SoundSpaces 2.0: A Simulation Platform for Visual-Acoustic Learning はコメントを受け付けていません

AVATAR: Unconstrained Audiovisual Speech Recognition

要約 視聴覚自動音声認識(AV-ASR)は、ASRの拡張機能であり、多くの場合、 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | AVATAR: Unconstrained Audiovisual Speech Recognition はコメントを受け付けていません

Variable Bitrate Neural Fields

要約 符号付き距離関数や放射輝度フィールドなどのスカラーフィールドとベクトルフィ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM | Variable Bitrate Neural Fields はコメントを受け付けていません

Comprehending and Ordering Semantics for Image Captioning

要約 画像の豊富なセマンティクスを理解し、それらを言語順に並べることは、画像のキ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Comprehending and Ordering Semantics for Image Captioning はコメントを受け付けていません

Stand-Alone Inter-Frame Attention in Video Models

要約 ビデオの独自性としてのモーションは、ビデオ理解モデルの開発に不可欠です。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Stand-Alone Inter-Frame Attention in Video Models はコメントを受け付けていません

Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and Heuristic Rule-based Methods for Object Manipulation

要約 このホワイトペーパーでは、SAPIEN ManiSkill Challen … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.RO | Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and Heuristic Rule-based Methods for Object Manipulation はコメントを受け付けていません