「cs.MM」カテゴリーアーカイブ

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：DAMO-StreamNet：自律走行におけるストリーミング知覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | コメントを受け付けていません

DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：DreamArtist：Positive-Negative Pr … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Dance Style Transfer with Cross-modal Transformer

投稿日: 2023年4月4日作成者: jarxiv

要約タイトル：クロスモーダルトランスフォーマーを用いたダンススタイルの転移要 … 続きを読む →

カテゴリー: cs.LG, cs.MM | コメントを受け付けていません

Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion

投稿日: 2023年4月4日作成者: jarxiv

要約タイトル：マルチグレイン情報融合によるソーシャルメディア上のマルチモーダル … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations

投稿日: 2023年4月3日作成者: jarxiv

要約タイトル：手順ビデオとその解説から学習手順に関するビデオ表現要約： &# … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective

投稿日: 2023年4月3日作成者: jarxiv

要約タイトル：因果関係の観点から画像復元のための歪み不変表現の学習要約： & … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

投稿日: 2023年4月3日作成者: jarxiv

要約タイトル：LongShortNet：ストリーミング知覚における時間的および … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

投稿日: 2023年3月31日作成者: jarxiv

要約リアルタイム認識、またはストリーミング認識は、自動運転の重要な側面であり、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | コメントを受け付けていません

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research

投稿日: 2023年3月31日作成者: jarxiv

要約オーディオ言語 (AL) マルチモーダル学習タスクの進歩は、近年重要です。 … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

ProContEXT: Exploring Progressive Context Transformer for Tracking

投稿日: 2023年3月31日作成者: jarxiv

要約既存のビジュアルオブジェクトトラッキング (VOT) は、最初のフレー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

DreamArtist: Towards Controllable One-Shot Text-to-Image Generation via Positive-Negative Prompt-Tuning

Dance Style Transfer with Cross-modal Transformer

Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion

Learning Procedure-aware Video Representation from Instructional Videos and Their Narrations

Learning Distortion Invariant Representation for Image Restoration from A Causality Perspective

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

DAMO-StreamNet: Optimizing Streaming Perception in Autonomous Driving

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research

ProContEXT: Exploring Progressive Context Transformer for Tracking

最近の投稿

最近のコメント

アーカイブ

カテゴリー