cs.MM」カテゴリーアーカイブ

A Hierarchical Compression Technique for 3D Gaussian Splatting Compression

要約 3D ガウス スプラッティング (GS) は、新しいビュー合成において優れ … 続きを読む

カテゴリー: cs.CV, cs.MM | コメントする

A multi-purpose automatic editing system based on lecture semantics for remote education

要約 遠隔授業は、その利便性と安全性により、特にパンデミックのような極端な状況下 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | コメントする

Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models

要約 最近、単一の統合モデルを使用してさまざまなオーディオ タスクに同時に取り組 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM, cs.SD, eess.AS | Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models はコメントを受け付けていません

Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks

要約 この論文では、テーブルトップ ロール プレイング ゲーム (TRPG) の … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.NE, cs.SD, eess.AS | Long-Form Text-to-Music Generation with Adaptive Prompts: A Case of Study in Tabletop Role-Playing Games Soundtracks はコメントを受け付けていません

Learning to Unify Audio, Visual and Text for Audio-Enhanced Multilingual Visual Answer Localization

要約 多言語ビジュアル回答ローカリゼーション (MVAL) の目標は、特定の多言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.IR, cs.MM | Learning to Unify Audio, Visual and Text for Audio-Enhanced Multilingual Visual Answer Localization はコメントを受け付けていません

3D Audio-Visual Segmentation

要約 シーン中の発音体を認識することは、具現化AIにおける長年の課題であり、ロボ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | 3D Audio-Visual Segmentation はコメントを受け付けていません

Diffusion-based Generative Multicasting with Intent-aware Semantic Decomposition

要約 生成拡散モデル(GDM)は近年、将来のワイヤレスネットワークにおいて非常に … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.MM, eess.SP, math.IT | Diffusion-based Generative Multicasting with Intent-aware Semantic Decomposition はコメントを受け付けていません

Towards Robust Multimodal Sentiment Analysis with Incomplete Data

要約 マルチモーダル感情分析(MSA)の分野では最近、データの不完全性という問題 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM | Towards Robust Multimodal Sentiment Analysis with Incomplete Data はコメントを受け付けていません

Aligning Audio-Visual Joint Representations with an Agentic Workflow

要約 ビジュアル コンテンツと付随するオーディオ信号は、オーディオビジュアル ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Aligning Audio-Visual Joint Representations with an Agentic Workflow はコメントを受け付けていません

Aligning Audio-Visual Joint Representations with an Agentic Workflow

要約 ビジュアル コンテンツと付随するオーディオ信号は、オーディオビジュアル ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Aligning Audio-Visual Joint Representations with an Agentic Workflow はコメントを受け付けていません