cs.MM」カテゴリーアーカイブ

Perceptual Depth Quality Assessment of Stereoscopic Omnidirectional Images

要約 奥行き知覚は、没入型仮想現実 (VR) 視覚環境の視聴者エクスペリエンスに … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Perceptual Depth Quality Assessment of Stereoscopic Omnidirectional Images はコメントを受け付けていません

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS, F.2.2 | Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention はコメントを受け付けていません

A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection

要約 この論文では、堅牢なオーディオビジュアルディープフェイク検出モデルを開発す … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection はコメントを受け付けていません

A Multi-task Adversarial Attack Against Face Authentication

要約 顔認証システムなどの深層学習ベースの ID 管理システムは、敵対的な攻撃に … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM | A Multi-task Adversarial Attack Against Face Authentication はコメントを受け付けていません

Lost in Overlap: Exploring Watermark Collision in LLMs

要約 コンテンツ生成における大規模言語モデル (LLM) の急増により、テキスト … 続きを読む

カテゴリー: cs.CL, cs.MM | Lost in Overlap: Exploring Watermark Collision in LLMs はコメントを受け付けていません

3D Gaussian Editing with A Single Image

要約 現実世界からキャプチャされた 3D シーンのモデリングと操作は、さまざまな … 続きを読む

カテゴリー: cs.CV, cs.MM | 3D Gaussian Editing with A Single Image はコメントを受け付けていません

End-to-end Semantic-centric Video-based Multimodal Affective Computing

要約 汎用人工知能 (AGI) への道において、人間の愛情を理解することは、機械 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | End-to-end Semantic-centric Video-based Multimodal Affective Computing はコメントを受け付けていません

Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G

要約 過去 20 年にわたり、モノのインターネット (IoT) は変革的な概念と … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.MM, cs.NI | Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G はコメントを受け付けていません

Diseño de sonido para producciones audiovisuales e historias sonoras en el aula. Hacia una docencia creativa mediante el uso de herramientas inteligentes

要約 この研究は、オーディオビジュアル作品のサウンドデザインを教えた教育経験を共 … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | Diseño de sonido para producciones audiovisuales e historias sonoras en el aula. Hacia una docencia creativa mediante el uso de herramientas inteligentes はコメントを受け付けていません

DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection

要約 赤外線可視物体検出は、赤外線画像と可視画像のペアの補完情報を活用することで … 続きを読む

カテゴリー: cs.CV, cs.MM | DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection はコメントを受け付けていません