cs.IR」カテゴリーアーカイブ

Semantically Enhanced Hard Negatives for Cross-modal Information Retrieval

要約 Visual Semantic Embedding (VSE) は、画像の … 続きを読む

カテゴリー: cs.CV, cs.IR | Semantically Enhanced Hard Negatives for Cross-modal Information Retrieval はコメントを受け付けていません

Re-ViLM: Retrieval-Augmented Visual Language Model for Zero and Few-Shot Image Captioning

要約 ビジョン エンコーダー (Flamingo など) を使用して事前トレーニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Re-ViLM: Retrieval-Augmented Visual Language Model for Zero and Few-Shot Image Captioning はコメントを受け付けていません

LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Retrieval

要約 画像テキスト検索(Image-text retrieval: ITR)は、 … 続きを読む

カテゴリー: cs.CV, cs.IR | LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Retrieval はコメントを受け付けていません

Open Problems in Applied Deep Learning

要約 この作業は、機械学習メカニズムをバイレベル最適化問題として定式化します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.IR, cs.LG | Open Problems in Applied Deep Learning はコメントを受け付けていません

Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study

要約 クロスモーダル検索 (CMR) へのほとんどのアプローチは、オブジェクト中 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG, cs.MM | Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study はコメントを受け付けていません

Online Backfilling with No Regret for Large-Scale Image Retrieval

要約 バックフィルは、画像検索システムでアップグレードされたモデルからすべてのギ … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | Online Backfilling with No Regret for Large-Scale Image Retrieval はコメントを受け付けていません

Retrieving Users’ Opinions on Social Media with Multimodal Aspect-Based Sentiment Analysis

要約 人々は自分の意見や経験をソーシャルメディアに投稿し、エンドユーザーの感情を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Retrieving Users’ Opinions on Social Media with Multimodal Aspect-Based Sentiment Analysis はコメントを受け付けていません

Saliency-Aware Spatio-Temporal Artifact Detection for Compressed Video Quality Assessment

要約 圧縮された映像には,Perceivable Encoding Artifa … 続きを読む

カテゴリー: cs.CV, cs.IR, eess.IV | Saliency-Aware Spatio-Temporal Artifact Detection for Compressed Video Quality Assessment はコメントを受け付けていません

DCC: A Cascade based Approach to Detect Communities in Social Networks

要約 ソーシャル ネットワークのコミュニティ検出は、ネットワークに固有の最も類似 … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG, cs.SI, J.4; G.4; I.6 | DCC: A Cascade based Approach to Detect Communities in Social Networks はコメントを受け付けていません

Reasoning with Language Model Prompting: A Survey

要約 複雑な問題解決に不可欠な能力である推論は、医療診断、交渉など、さまざまな実 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Reasoning with Language Model Prompting: A Survey はコメントを受け付けていません