cs.IR」カテゴリーアーカイブ

Intra-class Adaptive Augmentation with Neighbor Correction for Deep Metric Learning

要約 ディープ メトリック ラーニングは、意味的に類似したサンプルが近くにあり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | Intra-class Adaptive Augmentation with Neighbor Correction for Deep Metric Learning はコメントを受け付けていません

Contrastive Masked Autoencoders for Self-Supervised Video Hashing

要約 Self-Supervised Video Hashing (SSVH) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Contrastive Masked Autoencoders for Self-Supervised Video Hashing はコメントを受け付けていません

Informative Sample-Aware Proxy for Deep Metric Learning

要約 さまざまな教師あり深層メトリック学習法の中で、プロキシベースのアプローチは … 続きを読む

カテゴリー: cs.CV, cs.IR | Informative Sample-Aware Proxy for Deep Metric Learning はコメントを受け付けていません

Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval

要約 マルチメディア情報検索でますます一般的なタスクとして、ビデオ モーメント検 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval はコメントを受け付けていません

On Analyzing the Role of Image for Visual-enhanced Relation Extraction

要約 マルチモーダルな関係抽出は、ナレッジ グラフの構築に不可欠なタスクです。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | On Analyzing the Role of Image for Visual-enhanced Relation Extraction はコメントを受け付けていません

Tables to LaTeX: structure and content extraction from scientific tables

要約 科学文書には、重要な情報を簡潔にまとめた表が含まれています。 PDF 研究 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Tables to LaTeX: structure and content extraction from scientific tables はコメントを受け付けていません

FedVMR: A New Federated Learning method for Video Moment Retrieval

要約 大きな成功を収めたにもかかわらず、既存のビデオ モーメント検索 (VMR) … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM | FedVMR: A New Federated Learning method for Video Moment Retrieval はコメントを受け付けていません

Structuring User-Generated Content on Social Media with Multimodal Aspect-Based Sentiment Analysis

要約 人々は自分の意見や経験をソーシャル メディアに投稿し、エンド ユーザーの感 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Structuring User-Generated Content on Social Media with Multimodal Aspect-Based Sentiment Analysis はコメントを受け付けていません

Multimodal Transformer Distillation for Audio-Visual Synchronization

要約 視聴覚同期は、ビデオ内の口の動きと音声が同期しているかどうかを判断すること … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.SD, eess.AS | Multimodal Transformer Distillation for Audio-Visual Synchronization はコメントを受け付けていません

Graph Neural Networks for Nomination and Representation Learning of Web Elements

要約 このホワイト ペーパーでは、DOM 要素の指名と表現学習の未調査の問題に取 … 続きを読む

カテゴリー: 68T07, cs.CL, cs.CV, cs.HC, cs.IR, cs.LG | Graph Neural Networks for Nomination and Representation Learning of Web Elements はコメントを受け付けていません