「cs.MM」カテゴリーアーカイブ

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

投稿日: 2022年11月29日作成者: jarxiv

要約 Grounded Situation Recognition (GSR) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation

投稿日: 2022年11月29日作成者: jarxiv

要約ビデオの異常検出のための非常に高速なフレームレベルモデルを提案します。こ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, stat.ML | コメントを受け付けていません

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation

投稿日: 2022年11月29日作成者: jarxiv

要約大規模言語モデル (LLM) をテキストベースのアクション生成モデルに組み … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Training Data Improvement for Image Forgery Detection using Comprint

投稿日: 2022年11月28日作成者: jarxiv

要約偽情報を広めるために使用されると、操作された画像は世界中の消費者にとって脅 … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

投稿日: 2022年11月24日作成者: jarxiv

要約ストリーミング認識は、自動運転システムの遅延と精度を首尾一貫して考慮する自 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Improving Visual-textual Sentiment Analysis by Fusing Expert Features

投稿日: 2022年11月24日作成者: jarxiv

要約 Visual-textual センチメント分析は、画像とテキストのペアを入 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

A Graph-Based Method for Soccer Action Spotting Using Unsupervised Player Classification

投稿日: 2022年11月23日作成者: jarxiv

要約サッカービデオのアクションスポッティングは、ゲームの特定の重要なアクシ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

VideoMap: Video Editing in Latent Space

投稿日: 2022年11月23日作成者: jarxiv

要約ビデオは、メディアの主要な形式になっています。ただし、ビデオ編集インター … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Videogenic: Video Highlights via Photogenic Moments

投稿日: 2022年11月23日作成者: jarxiv

要約このホワイトペーパーでは、ビデオからハイライトモーメントを抽出するとい … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos

投稿日: 2022年11月17日作成者: jarxiv

要約ビデオアクションのセグメンテーションと認識タスクは、多くの分野で広く適用 … 続きを読む →

カテゴリー: 68T01, 68T30, 68T45, cs.CV, cs.MM, I.2.10 | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation

Training Data Improvement for Image Forgery Detection using Comprint

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

Improving Visual-textual Sentiment Analysis by Fusing Expert Features

A Graph-Based Method for Soccer Action Spotting Using Unsupervised Player Classification

VideoMap: Video Editing in Latent Space

Videogenic: Video Highlights via Photogenic Moments

Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos

最近の投稿

最近のコメント

アーカイブ

カテゴリー