cs.MM」カテゴリーアーカイブ

IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression

要約 点群は3次元コンテンツの重要な表現であり、バーチャルリアリティ、複合現実感 … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.MM, eess.IV, math.IT | IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression はコメントを受け付けていません

Causal Reasoning Meets Visual Representation Learning: A Prospective Study

要約 視覚表現学習は、視覚理解、ビデオ理解、マルチモーダル分析、ヒューマン コン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Causal Reasoning Meets Visual Representation Learning: A Prospective Study はコメントを受け付けていません

Unified Normalization for Accelerating and Stabilizing Transformers

要約 Transformers の堅実な成果により、Transformer はさ … 続きを読む

カテゴリー: cs.CV, cs.MM | Unified Normalization for Accelerating and Stabilizing Transformers はコメントを受け付けていません

Shadow-Aware Dynamic Convolution for Shadow Removal

要約 多くの収集された画像に広範囲の影があるため、多くのダウンストリーム マルチ … 続きを読む

カテゴリー: cs.CV, cs.MM | Shadow-Aware Dynamic Convolution for Shadow Removal はコメントを受け付けていません

ALADIN: Distilling Fine-grained Alignment Scores for Efficient Image-Text Matching and Retrieval

要約 画像とテキストのマッチングは、視覚と言語の共同理解を伴うタスクの中で主導的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | ALADIN: Distilling Fine-grained Alignment Scores for Efficient Image-Text Matching and Retrieval はコメントを受け付けていません

CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation

要約 マルチモーダル感情分析とうつ病推定は、マルチモーダルデータを使用して人間の … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation はコメントを受け付けていません

Content-oriented learned image compression

要約 近年、ディープニューラルネットワークの開発により、エンドツーエンドで最適化 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Content-oriented learned image compression はコメントを受け付けていません

End-To-End Audiovisual Feature Fusion for Active Speaker Detection

要約 アクティブスピーカー検出は、人間と機械の相互作用において重要な役割を果たし … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | End-To-End Audiovisual Feature Fusion for Active Speaker Detection はコメントを受け付けていません

VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training

要約 ファッションの服装を美的に心地よいものと見なすためには、それらを構成する衣 … 続きを読む

カテゴリー: cs.CV, cs.MM | VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training はコメントを受け付けていません

AutoTransition: Learning to Recommend Video Transition Effects

要約 ビデオトランジションエフェクトは、ビデオ編集で広く使用されており、ショット … 続きを読む

カテゴリー: cs.CV, cs.MM | AutoTransition: Learning to Recommend Video Transition Effects はコメントを受け付けていません