「cs.MM」カテゴリーアーカイブ

WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar

投稿日: 2024年3月20日作成者: jarxiv

要約人間の意図に基づく水路の認識は、水環境における無人水上車両 (USV) の … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.RO | コメントを受け付けていません

Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation

投稿日: 2024年3月20日作成者: jarxiv

要約この論文では、第 6 回野生感情行動分析 (ABAW) コンペティションの … 続きを読む →

カテゴリー: cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Mixture-of-Prompt-Experts for Multi-modal Semantic Understanding

投稿日: 2024年3月19日作成者: jarxiv

要約単なる表面的なコンテンツ関係マイニングを超えた、マルチモーダルな意味論的な … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation

投稿日: 2024年3月19日作成者: jarxiv

要約音楽生成ダンスの研究は、斬新かつ挑戦的なイメージ生成タスクです。音楽とシ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling

投稿日: 2024年3月15日作成者: jarxiv

要約歌詞の翻訳は、1 世紀以上にわたって研究されてきた分野であり、現在、計算言 … 続きを読む →

カテゴリー: cs.CL, cs.LG, cs.MM | コメントを受け付けていません

M&M: Multimodal-Multitask Model Integrating Audiovisual Cues in Cognitive Load Assessment

投稿日: 2024年3月15日作成者: jarxiv

要約この論文では、認知負荷評価 (CLA) 用の AVCAffe データセット … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

投稿日: 2024年3月15日作成者: jarxiv

要約暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Content-aware Masked Image Modeling Transformer for Stereo Image Compression

投稿日: 2024年3月14日作成者: jarxiv

要約既存の学習ベースのステレオ画像コーデックは、単一画像コーデックから派生した … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV | コメントを受け付けていません

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

投稿日: 2024年3月14日作成者: jarxiv

要約暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Leveraging Compressed Frame Sizes For Ultra-Fast Video Classification

投稿日: 2024年3月14日作成者: jarxiv

要約ビデオをスポーツビデオやミュージックビデオなどの異なるカテゴリに分類す … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar

Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation

Mixture-of-Prompt-Experts for Multi-modal Semantic Understanding

QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation

K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling

M&M: Multimodal-Multitask Model Integrating Audiovisual Cues in Cognitive Load Assessment

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

Content-aware Masked Image Modeling Transformer for Stereo Image Compression

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

Leveraging Compressed Frame Sizes For Ultra-Fast Video Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー