cs.MM」カテゴリーアーカイブ

Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)

要約 Explainable AI for the Arts (XAIxArts … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS | Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) はコメントを受け付けていません

GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting

要約 暗黙的ニューラル表現 (INR) は最近、画像表現と圧縮において大きな成功 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV | GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting はコメントを受け付けていません

Frieren: Efficient Video-to-Audio Generation with Rectified Flow Matching

要約 ビデオ – オーディオ (V2A) 生成は、サイレント ビデオ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Frieren: Efficient Video-to-Audio Generation with Rectified Flow Matching はコメントを受け付けていません

Resolving Sentiment Discrepancy for Multimodal Sentiment Detection via Semantics Completion and Decomposition

要約 近年のソーシャル メディア投稿の急増に伴い、マルチモーダル (画像とテキス … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SI | Resolving Sentiment Discrepancy for Multimodal Sentiment Detection via Semantics Completion and Decomposition はコメントを受け付けていません

Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack

要約 オンライン ポータルを通じて合成開口レーダー (SAR) 画像に幅広くアク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack はコメントを受け付けていません

Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

要約 ユーモアは人間の社会的行動、感情、認知の重要な要素です。 その自動理解によ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results はコメントを受け付けていません

MERGE — A Bimodal Dataset for Static Music Emotion Recognition

要約 音楽感情認識 (MER) 分野は、特徴エンジニアリング、機械学習、深層学習 … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG, cs.MM, cs.SD | MERGE — A Bimodal Dataset for Static Music Emotion Recognition はコメントを受け付けていません

Pseudo-triplet Guided Few-shot Composed Image Retrieval

要約 合成画像検索 (CIR) は、マルチモーダル クエリ (参照画像とそれに対 … 続きを読む

カテゴリー: cs.CV, cs.MM | Pseudo-triplet Guided Few-shot Composed Image Retrieval はコメントを受け付けていません

EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture

要約 本稿では、トランスフォーマ・アーキテクチャのパワーを活用し、高性能な成果を … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture はコメントを受け付けていません

VCoME: Verbal Video Composition with Multimodal Editing Effects

要約 ボイスオーバーやテキストオーバーレイを特徴とする言葉によるビデオは、価値あ … 続きを読む

カテゴリー: cs.CV, cs.MM | VCoME: Verbal Video Composition with Multimodal Editing Effects はコメントを受け付けていません