cs.MM」カテゴリーアーカイブ

Face Consistency Benchmark for GenAI Video

要約 人工知能によって駆動されるビデオ生成は、動的で現実的なコンテンツの作成を可 … 続きを読む

カテゴリー: cs.CV, cs.MM | Face Consistency Benchmark for GenAI Video はコメントを受け付けていません

Machine Learning-Based Prediction of Quality Shifts on Video Streaming Over 5G

要約 Quality of Experience(QOE)は、YouTubeのよ … 続きを読む

カテゴリー: cs.LG, cs.MM | Machine Learning-Based Prediction of Quality Shifts on Video Streaming Over 5G はコメントを受け付けていません

Detecting Multimedia Generated by Large AI Models: A Survey

要約 大規模なAIモデル(LAIMS)、特に拡散モデルと大規模な言語モデルの急速 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM | Detecting Multimedia Generated by Large AI Models: A Survey はコメントを受け付けていません

WavReward: Spoken Dialogue Models With Generalist Reward Evaluators

要約 GPT-4O-Audioなどのエンドツーエンドの音声対話モデルは、最近、音 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | WavReward: Spoken Dialogue Models With Generalist Reward Evaluators はコメントを受け付けていません

HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment

要約 メッシュ品質評価(MQA)モデルは、さまざまなアプリケーションでのメッシュ … 続きを読む

カテゴリー: cs.CV, cs.MM | HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment はコメントを受け付けていません

FMNV: A Dataset of Media-Published News Videos for Fake News Detection

要約 ニュースメディア、特にビデオベースのプラットフォームは、日常生活に深く埋め … 続きを読む

カテゴリー: cs.CV, cs.MM | FMNV: A Dataset of Media-Published News Videos for Fake News Detection はコメントを受け付けていません

Multi-Domain Audio Question Answering Toward Acoustic Content Reasoning in The DCASE 2025 Challenge

要約 DCASE 2025チャレンジのタスク5を紹介します。音響質問(AQA)ベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Multi-Domain Audio Question Answering Toward Acoustic Content Reasoning in The DCASE 2025 Challenge はコメントを受け付けていません

Differentiating Emigration from Return Migration of Scholars Using Name-Based Nationality Detection Models

要約 ほとんどのWebおよびデジタルトレースデータには、プライバシーの懸念による … 続きを読む

カテゴリー: cs.CL, cs.DL, cs.MM | Differentiating Emigration from Return Migration of Scholars Using Name-Based Nationality Detection Models はコメントを受け付けていません

Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study

要約 自動化されたヘイトスピーチ検出への関心が高まっているにもかかわらず、既存の … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.MM | Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study はコメントを受け付けていません

TCAN: Text-oriented Cross Attention Network for Multimodal Sentiment Analysis

要約 マルチモーダル感情分析(MSA)は、言語、視覚、音響のモダリティを活用する … 続きを読む

カテゴリー: cs.CL, cs.MM | TCAN: Text-oriented Cross Attention Network for Multimodal Sentiment Analysis はコメントを受け付けていません