cs.MM」カテゴリーアーカイブ

Unifying Two-Stream Encoders with Transformers for Cross-Modal Retrieval

要約 既存のクロスモーダル検索方法のほとんどは、画像とテキストに対して異なるアー … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | Unifying Two-Stream Encoders with Transformers for Cross-Modal Retrieval はコメントを受け付けていません

Learning to Pan-sharpening with Memories of Spatial Details

要約 パンシャープニングは、リモート センシング システムで最も一般的に使用され … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Learning to Pan-sharpening with Memories of Spatial Details はコメントを受け付けていません

SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event based Recognition

要約 イベントカメラベースのパターン認識は、近年新たに浮上した研究テーマです。 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.NE | SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event based Recognition はコメントを受け付けていません

Your Negative May not Be True Negative: Boosting Image-Text Matching with False Negative Elimination

要約 既存の画像とテキストのマッチング手法のほとんどは、最適化目標としてトリプレ … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | Your Negative May not Be True Negative: Boosting Image-Text Matching with False Negative Elimination はコメントを受け付けていません

DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis

要約 近年、拡散モデルが画像合成における最も強力なアプローチとして浮上しています … 続きを読む

カテゴリー: cs.CV, cs.MM | DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis はコメントを受け付けていません

DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis

要約 近年、拡散モデルが画像合成における最も強力なアプローチとして浮上しています … 続きを読む

カテゴリー: cs.CV, cs.MM | DiffSynth: Latent In-Iteration Deflickering for Realistic Video Synthesis はコメントを受け付けていません

Video-based Person Re-identification with Long Short-Term Representation Learning

要約 ビデオベースの人物再識別 (V-ReID) は、重複していないカメラで撮影 … 続きを読む

カテゴリー: cs.CV, cs.MM | Video-based Person Re-identification with Long Short-Term Representation Learning はコメントを受け付けていません

Efficient Labelling of Affective Video Datasets via Few-Shot & Multi-Task Contrastive Learning

要約 ディープラーニング技術は優れた感情予測を達成していますが、それでも大量のラ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | Efficient Labelling of Affective Video Datasets via Few-Shot & Multi-Task Contrastive Learning はコメントを受け付けていません

Disentangling Multi-view Representations Beyond Inductive Bias

要約 多視点(または-モダリティ)表現学習は、異なるビュー表現間の関係を理解する … 続きを読む

カテゴリー: cs.CV, cs.MM | Disentangling Multi-view Representations Beyond Inductive Bias はコメントを受け付けていません

SVCNet: Scribble-based Video Colorization Network with Temporal Aggregation

要約 本論文では、SVCNetと呼ばれる、時間集約を用いた走り書きに基づく動画色 … 続きを読む

カテゴリー: cs.CV, cs.MM | SVCNet: Scribble-based Video Colorization Network with Temporal Aggregation はコメントを受け付けていません