cs.MM」カテゴリーアーカイブ

EViT: Privacy-Preserving Image Retrieval via Encrypted Vision Transformer in Cloud Computing

要約 画像検索システムは、ユーザーが大量の画像をリアルタイムで参照および検索する … 続きを読む

カテゴリー: cs.CV, cs.MM | EViT: Privacy-Preserving Image Retrieval via Encrypted Vision Transformer in Cloud Computing はコメントを受け付けていません

Hierarchical Local-Global Transformer for Temporal Sentence Grounding

要約 この論文では、特定の文のクエリに従って、トリミングされていないビデオの特定 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR, cs.MM | Hierarchical Local-Global Transformer for Temporal Sentence Grounding はコメントを受け付けていません

PanorAMS: Automatic Annotation for Detecting Objects in Urban Context

要約 地理参照されたパノラマ画像の大規模なコレクションは、世界中の都市で自由に利 … 続きを読む

カテゴリー: cs.CV, cs.MM | PanorAMS: Automatic Annotation for Detecting Objects in Urban Context はコメントを受け付けていません

PanorAMS: Automatic Annotation for Detecting Objects in Urban Context

要約 地理参照されたパノラマ画像の大規模なコレクションは、世界中の都市で自由に利 … 続きを読む

カテゴリー: cs.CV, cs.MM | PanorAMS: Automatic Annotation for Detecting Objects in Urban Context はコメントを受け付けていません

Deep Decomposition and Bilinear Pooling Network for Blind Night-Time Image Quality Evaluation

要約 元の参照情報なしで画質を正確に予測することを目的としたブラインド画質評価 … 続きを読む

カテゴリー: cs.CV, cs.MM | Deep Decomposition and Bilinear Pooling Network for Blind Night-Time Image Quality Evaluation はコメントを受け付けていません

Partially Relevant Video Retrieval

要約 テキストからビデオへの検索 (T2VR) の現在の方法は、MSVD、MSR … 続きを読む

カテゴリー: cs.CV, cs.MM | Partially Relevant Video Retrieval はコメントを受け付けていません

Cross-Lingual Cross-Modal Retrieval with Noise-Robust Learning

要約 クロスモーダル検索の分野における最近の開発にもかかわらず、手動で注釈を付け … 続きを読む

カテゴリー: cs.CV, cs.MM | Cross-Lingual Cross-Modal Retrieval with Noise-Robust Learning はコメントを受け付けていません

Late multimodal fusion for image and audio music transcription

要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS, I.4 | Late multimodal fusion for image and audio music transcription はコメントを受け付けていません

Learned Lossless JPEG Transcoding via Joint Lossy and Residual Compression

要約 一般的に使用される画像圧縮形式として、JPEG は画像の送信と保存に広く適 … 続きを読む

カテゴリー: cs.CV, cs.MM | Learned Lossless JPEG Transcoding via Joint Lossy and Residual Compression はコメントを受け付けていません

Retrieval-Augmented Transformer for Image Captioning

要約 画像キャプション モデルは、入力画像の自然言語による説明を提供することで、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Retrieval-Augmented Transformer for Image Captioning はコメントを受け付けていません