cs.MM」カテゴリーアーカイブ

Learning from Label Relationships in Human Affect

要約 自動化された方法での人間の影響と精神状態の推定は、多くの困難に直面します。 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | Learning from Label Relationships in Human Affect はコメントを受け付けていません

Late multimodal fusion for image and audio music transcription

要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS, I.4 | Late multimodal fusion for image and audio music transcription はコメントを受け付けていません

PPMN: Pixel-Phrase Matching Network for One-Stage Panoptic Narrative Grounding

要約 PNG(Panoptic Narrative Grounding)は、静止 … 続きを読む

カテゴリー: cs.CV, cs.MM | PPMN: Pixel-Phrase Matching Network for One-Stage Panoptic Narrative Grounding はコメントを受け付けていません

PSUMNet: Unified Modality Part Streams are All You Need for Efficient Pose-based Action Recognition

要約 ポーズに基づくアクション認識は、入力スケルトンをモノリシックに扱うアプロー … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | PSUMNet: Unified Modality Part Streams are All You Need for Efficient Pose-based Action Recognition はコメントを受け付けていません

Seeing your sleep stage: cross-modal distillation from EEG to infrared video

要約 様々な疾患の診断には、睡眠段階の分類が不可欠である。しかし、既存の自動診断 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Seeing your sleep stage: cross-modal distillation from EEG to infrared video はコメントを受け付けていません

Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System

要約 ある出来事を複数のカメラで撮影すると、視聴者はその出来事の全体像を把握する … 続きを読む

カテゴリー: cs.CV, cs.MM | Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System はコメントを受け付けていません

Consistency-based Self-supervised Learning for Temporal Anomaly Localization

要約 この研究では、予測器が通常の例からだけでなく、学習中に利用可能になった少数 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Consistency-based Self-supervised Learning for Temporal Anomaly Localization はコメントを受け付けていません

Language Supervised Training for Skeleton-based Action Recognition

要約 スケルトンに基づく行動認識は、その計算効率の高さと照明条件に対する頑健性か … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Language Supervised Training for Skeleton-based Action Recognition はコメントを受け付けていません

Boosting neural video codecs by exploiting hierarchical redundancy

要約 動画像圧縮では、動き補償や残差補償により、以前に復号されたフレームの画素を … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | Boosting neural video codecs by exploiting hierarchical redundancy はコメントを受け付けていません

DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval

要約 本論文では、大規模データセットにおける高性能かつ計算効率の高いコンテンツベ … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval はコメントを受け付けていません