cs.MM」カテゴリーアーカイブ

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

要約 Grounded Situation Recognition (GSR) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement はコメントを受け付けていません

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation

要約 ビデオの異常検出のための非常に高速なフレームレベル モデルを提案します。こ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, stat.ML | Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation はコメントを受け付けていません

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation

要約 大規模言語モデル (LLM) をテキストベースのアクション生成モデルに組み … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation はコメントを受け付けていません

Training Data Improvement for Image Forgery Detection using Comprint

要約 偽情報を広めるために使用されると、操作された画像は世界中の消費者にとって脅 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG, cs.MM | Training Data Improvement for Image Forgery Detection using Comprint はコメントを受け付けていません

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

要約 ストリーミング認識は、自動運転システムの遅延と精度を首尾一貫して考慮する自 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception はコメントを受け付けていません

Improving Visual-textual Sentiment Analysis by Fusing Expert Features

要約 Visual-textual センチメント分析は、画像とテキストのペアを入 … 続きを読む

カテゴリー: cs.CV, cs.MM | Improving Visual-textual Sentiment Analysis by Fusing Expert Features はコメントを受け付けていません

A Graph-Based Method for Soccer Action Spotting Using Unsupervised Player Classification

要約 サッカー ビデオのアクション スポッティングは、ゲームの特定の重要なアクシ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | A Graph-Based Method for Soccer Action Spotting Using Unsupervised Player Classification はコメントを受け付けていません

VideoMap: Video Editing in Latent Space

要約 ビデオは、メディアの主要な形式になっています。 ただし、ビデオ編集インター … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | VideoMap: Video Editing in Latent Space はコメントを受け付けていません

Videogenic: Video Highlights via Photogenic Moments

要約 このホワイト ペーパーでは、ビデオからハイライト モーメントを抽出するとい … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | Videogenic: Video Highlights via Photogenic Moments はコメントを受け付けていません

Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos

要約 ビデオ アクションのセグメンテーションと認識タスクは、多くの分野で広く適用 … 続きを読む

カテゴリー: 68T01, 68T30, 68T45, cs.CV, cs.MM, I.2.10 | Semantic2Graph: Graph-based Multi-modal Feature Fusion for Action Segmentation in Videos はコメントを受け付けていません