cs.MM」カテゴリーアーカイブ

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

要約 タイトル:DAMO-StreamNet:自律走行におけるストリーミング知覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving はコメントを受け付けていません

DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning

要約 タイトル:DreamArtist:Positive-Negative Pr … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning はコメントを受け付けていません

Dance Style Transfer with Cross-modal Transformer

要約 タイトル:クロスモーダルトランスフォーマーを用いたダンススタイルの転移 要 … 続きを読む

カテゴリー: cs.LG, cs.MM | Dance Style Transfer with Cross-modal Transformer はコメントを受け付けていません

Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion

要約 タイトル:マルチグレイン情報融合によるソーシャルメディア上のマルチモーダル … 続きを読む

カテゴリー: cs.CV, cs.MM | Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion はコメントを受け付けていません

Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations

要約 タイトル:手順ビデオとその解説から学習手順に関するビデオ表現 要約: &# … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations はコメントを受け付けていません

Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective

要約 タイトル:因果関係の観点から画像復元のための歪み不変表現の学習 要約: & … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective はコメントを受け付けていません

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

要約 タイトル:LongShortNet:ストリーミング知覚における時間的および … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception はコメントを受け付けていません

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

要約 リアルタイム認識、またはストリーミング認識は、自動運転の重要な側面であり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving はコメントを受け付けていません

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research

要約 オーディオ言語 (AL) マルチモーダル学習タスクの進歩は、近年重要です。 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research はコメントを受け付けていません

ProContEXT: Exploring Progressive Context Transformer for Tracking

要約 既存のビジュアル オブジェクト トラッキング (VOT) は、最初のフレー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | ProContEXT: Exploring Progressive Context Transformer for Tracking はコメントを受け付けていません