cs.MM」カテゴリーアーカイブ

Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language Explanations

要約 Visual Entailment with natural langua … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language Explanations はコメントを受け付けていません

Audio-Visual Activity Guided Cross-Modal Identity Association for Active Speaker Detection

要約 ビデオでのアクティブ スピーカーの検出は、ビデオ フレームに表示されるソー … 続きを読む

カテゴリー: cs.CV, cs.MM | Audio-Visual Activity Guided Cross-Modal Identity Association for Active Speaker Detection はコメントを受け付けていません

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation

要約 大規模言語モデル (LLM) をテキストベースのアクション生成モデルに組み … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation はコメントを受け付けていません

Intra-class Adaptive Augmentation with Neighbor Correction for Deep Metric Learning

要約 ディープ メトリック ラーニングは、意味的に類似したサンプルが近くにあり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | Intra-class Adaptive Augmentation with Neighbor Correction for Deep Metric Learning はコメントを受け付けていません

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement

要約 Grounded Situation Recognition (GSR) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement はコメントを受け付けていません

Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation

要約 ビデオの異常検出のための非常に高速なフレームレベル モデルを提案します。こ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, stat.ML | Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation はコメントを受け付けていません

Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation

要約 大規模言語モデル (LLM) をテキストベースのアクション生成モデルに組み … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | Action-GPT: Leveraging Large-scale Language Models for Improved and Generalized Zero Shot Action Generation はコメントを受け付けていません

Training Data Improvement for Image Forgery Detection using Comprint

要約 偽情報を広めるために使用されると、操作された画像は世界中の消費者にとって脅 … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG, cs.MM | Training Data Improvement for Image Forgery Detection using Comprint はコメントを受け付けていません

LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception

要約 ストリーミング認識は、自動運転システムの遅延と精度を首尾一貫して考慮する自 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | LongShortNet: Exploring Temporal and Semantic Features Fusion in Streaming Perception はコメントを受け付けていません

Improving Visual-textual Sentiment Analysis by Fusing Expert Features

要約 Visual-textual センチメント分析は、画像とテキストのペアを入 … 続きを読む

カテゴリー: cs.CV, cs.MM | Improving Visual-textual Sentiment Analysis by Fusing Expert Features はコメントを受け付けていません