cs.MM」カテゴリーアーカイブ

Learning Language-guided Adaptive Hyper-modality Representation for Multimodal Sentiment Analysis

要約 マルチモーダル感情分析 (MSA) は、複数のソース (言語、ビデオ、音声 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Learning Language-guided Adaptive Hyper-modality Representation for Multimodal Sentiment Analysis はコメントを受け付けていません

CLIP as RNN: Segment Countless Visual Concepts without Training Endeavor

要約 既存のオープンボキャブラリーの画像セグメンテーション方法では、マスクの注釈 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM | CLIP as RNN: Segment Countless Visual Concepts without Training Endeavor はコメントを受け付けていません

Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal Structured Representations

要約 大規模な視覚言語の事前トレーニングは、マルチモーダルな理解と生成タスクにお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM | Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal Structured Representations はコメントを受け付けていません

Concept-centric Personalization with Large-scale Diffusion Priors

要約 大規模な拡散モデルは多様なオープンワールド コンテンツを生成する能力が高い … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Concept-centric Personalization with Large-scale Diffusion Priors はコメントを受け付けていません

Accelerated Event-Based Feature Detection and Compression for Surveillance Video Systems

要約 監視ビデオの強力な時間的一貫性により、従来の方法で魅力的な圧縮パフォーマン … 続きを読む

カテゴリー: cs.CV, cs.MM | Accelerated Event-Based Feature Detection and Compression for Surveillance Video Systems はコメントを受け付けていません

More than Vanilla Fusion: a Simple, Decoupling-free, Attention Module for Multimodal Fusion Based on Signal Theory

要約 バニラ フュージョン手法は、依然として主流のオーディオビジュアルタスクの大 … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | More than Vanilla Fusion: a Simple, Decoupling-free, Attention Module for Multimodal Fusion Based on Signal Theory はコメントを受け付けていません

Alternating Gradient Descent and Mixture-of-Experts for Integrated Multimodal Perception

要約 シンプルでスケーラブルなマルチモーダル マルチタスク トレーニングおよびモ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, eess.IV | Alternating Gradient Descent and Mixture-of-Experts for Integrated Multimodal Perception はコメントを受け付けていません

SmartMask: Context Aware High-Fidelity Mask Generation for Fine-grained Object Insertion and Layout Control

要約 生成画像修復とオブジェクト挿入の分野は、最近の潜在拡散モデルの出現により大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG, cs.MM | SmartMask: Context Aware High-Fidelity Mask Generation for Fine-grained Object Insertion and Layout Control はコメントを受け付けていません

PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding

要約 テキストから画像への生成における最近の進歩により、指定されたテキスト プロ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding はコメントを受け付けていません

Generating Illustrated Instructions

要約 イラスト付き説明書、つまりユーザーのニーズに合わせてカスタマイズされた視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Generating Illustrated Instructions はコメントを受け付けていません