cs.MM」カテゴリーアーカイブ

CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation

要約 マルチモーダル感情分析とうつ病推定は、マルチモーダルデータを使用して人間の … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | CubeMLP: A MLP-based Model for Multimodal Sentiment Analysis and Depression Estimation はコメントを受け付けていません

Content-oriented learned image compression

要約 近年、ディープニューラルネットワークの開発により、エンドツーエンドで最適化 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Content-oriented learned image compression はコメントを受け付けていません

End-To-End Audiovisual Feature Fusion for Active Speaker Detection

要約 アクティブスピーカー検出は、人間と機械の相互作用において重要な役割を果たし … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | End-To-End Audiovisual Feature Fusion for Active Speaker Detection はコメントを受け付けていません

VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training

要約 ファッションの服装を美的に心地よいものと見なすためには、それらを構成する衣 … 続きを読む

カテゴリー: cs.CV, cs.MM | VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training はコメントを受け付けていません

AutoTransition: Learning to Recommend Video Transition Effects

要約 ビデオトランジションエフェクトは、ビデオ編集で広く使用されており、ショット … 続きを読む

カテゴリー: cs.CV, cs.MM | AutoTransition: Learning to Recommend Video Transition Effects はコメントを受け付けていません

Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis

要約 コンテンツ編集用のツールが成熟し、メディアを合成するための人工知能(AI) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis はコメントを受け付けていません

Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis

要約 コンテンツ編集用のツールが成熟し、メディアを合成するための人工知能(AI) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis はコメントを受け付けていません

Learned Video Compression via Heterogeneous Deformable Compensation Network

要約 学習したビデオ圧縮は、動き補償が最も困難な問題の1つと見なされている、高度 … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Learned Video Compression via Heterogeneous Deformable Compensation Network はコメントを受け付けていません

Panoptic Scene Graph Generation

要約 既存の研究では、シーングラフ生成(SGG)(画像のシーンを理解するための重 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Panoptic Scene Graph Generation はコメントを受け付けていません

ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network

要約 このホワイトペーパーでは、ViGATと呼ばれる純粋な注意のボトムアップアプ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention network はコメントを受け付けていません