「cs.MM」カテゴリーアーカイブ

Seeing your sleep stage: cross-modal distillation from EEG to infrared video

投稿日: 2022年8月12日作成者: jarxiv

要約様々な疾患の診断には、睡眠段階の分類が不可欠である。しかし、既存の自動診断 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System

投稿日: 2022年8月11日作成者: jarxiv

要約ある出来事を複数のカメラで撮影すると、視聴者はその出来事の全体像を把握する … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Consistency-based Self-supervised Learning for Temporal Anomaly Localization

投稿日: 2022年8月11日作成者: jarxiv

要約この研究では、予測器が通常の例からだけでなく、学習中に利用可能になった少数 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Language Supervised Training for Skeleton-based Action Recognition

投稿日: 2022年8月11日作成者: jarxiv

要約スケルトンに基づく行動認識は、その計算効率の高さと照明条件に対する頑健性か … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Boosting neural video codecs by exploiting hierarchical redundancy

投稿日: 2022年8月9日作成者: jarxiv

要約動画像圧縮では、動き補償や残差補償により、以前に復号されたフレームの画素を … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, eess.IV | コメントを受け付けていません

DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval

投稿日: 2022年8月8日作成者: jarxiv

要約本論文では、大規模データセットにおける高性能かつ計算効率の高いコンテンツベ … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.MM | コメントを受け付けていません

IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression

投稿日: 2022年8月5日作成者: jarxiv

要約点群は3次元コンテンツの重要な表現であり、バーチャルリアリティ、複合現実感 … 続きを読む →

カテゴリー: cs.CV, cs.IT, cs.MM, eess.IV, math.IT | コメントを受け付けていません

Causal Reasoning Meets Visual Representation Learning: A Prospective Study

投稿日: 2022年8月3日作成者: jarxiv

要約視覚表現学習は、視覚理解、ビデオ理解、マルチモーダル分析、ヒューマンコン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Unified Normalization for Accelerating and Stabilizing Transformers

投稿日: 2022年8月3日作成者: jarxiv

要約 Transformers の堅実な成果により、Transformer はさ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Shadow-Aware Dynamic Convolution for Shadow Removal

投稿日: 2022年8月2日作成者: jarxiv

要約多くの収集された画像に広範囲の影があるため、多くのダウンストリームマルチ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Seeing your sleep stage: cross-modal distillation from EEG to infrared video

Automatic Camera Control and Directing with an Ultra-High-Definition Collaborative Recording System

Consistency-based Self-supervised Learning for Temporal Anomaly Localization

Language Supervised Training for Skeleton-based Action Recognition

Boosting neural video codecs by exploiting hierarchical redundancy

DnS: Distill-and-Select for Efficient and Accurate Video Indexing and Retrieval

IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression

Causal Reasoning Meets Visual Representation Learning: A Prospective Study

Unified Normalization for Accelerating and Stabilizing Transformers

Shadow-Aware Dynamic Convolution for Shadow Removal

最近の投稿

最近のコメント

アーカイブ

カテゴリー