cs.MM」カテゴリーアーカイブ

VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision

要約 タイトル:VLPD:Vision-Language Semantic Se … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision はコメントを受け付けていません

Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck

要約 タイトル:バリアブルインフォメーションボトルネックでマルチモーダルエンティ … 続きを読む

カテゴリー: cs.CL, cs.MM | Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck はコメントを受け付けていません

Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing

要約 タイトル: 人間中心の潜在拡散モデルによるファッション画像編集のためのマル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing はコメントを受け付けていません

ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules

要約 タイトル:「heuristicルールを必要としないチャートの解析および理解 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules はコメントを受け付けていません

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

要約 タイトル:DAMO-StreamNet:自律走行におけるストリーミング知覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving はコメントを受け付けていません

DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning

要約 タイトル:DreamArtist:Positive-Negative Pr … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning はコメントを受け付けていません

Dance Style Transfer with Cross-modal Transformer

要約 タイトル:クロスモーダルトランスフォーマーを用いたダンススタイルの転移 要 … 続きを読む

カテゴリー: cs.LG, cs.MM | Dance Style Transfer with Cross-modal Transformer はコメントを受け付けていません

Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion

要約 タイトル:マルチグレイン情報融合によるソーシャルメディア上のマルチモーダル … 続きを読む

カテゴリー: cs.CV, cs.MM | Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion はコメントを受け付けていません

Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations

要約 タイトル:手順ビデオとその解説から学習手順に関するビデオ表現 要約: &# … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations はコメントを受け付けていません

Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective

要約 タイトル:因果関係の観点から画像復元のための歪み不変表現の学習 要約: & … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective はコメントを受け付けていません