月別アーカイブ: 2022年9月

MVPTR: Multi-Level Semantic Alignment for Vision-Language Pre-Training via Multi-Stage Learning

要約 以前のビジョン言語事前トレーニング モデルは、主にトークンとオブジェクト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | MVPTR: Multi-Level Semantic Alignment for Vision-Language Pre-Training via Multi-Stage Learning はコメントを受け付けていません

NAAP-440 Dataset and Baseline for Network Architecture Accuracy Prediction

要約 ネットワーク アーキテクチャ検索 (NAS) は、さまざまなターゲット プ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE | NAAP-440 Dataset and Baseline for Network Architecture Accuracy Prediction はコメントを受け付けていません

A multi view multi stage and multi window framework for pulmonary artery segmentation from CT scans

要約 PARSE2022 Challengeの最終リザルト9位のテクニカルレポー … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A multi view multi stage and multi window framework for pulmonary artery segmentation from CT scans はコメントを受け付けていません

Transformers and CNNs both Beat Humans on SBIR

要約 スケッチベースの画像検索 (SBIR) は、手書きスケッチ クエリのセマン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, I.2.10 | Transformers and CNNs both Beat Humans on SBIR はコメントを受け付けていません

Point cloud completion via structured feature maps using a feedback network

要約 この論文では、特徴学習の観点から点群補完の挑戦的な問題に取り組みます。 私 … 続きを読む

カテゴリー: cs.CV | Point cloud completion via structured feature maps using a feedback network はコメントを受け付けていません

WildQA: In-the-Wild Video Question Answering

要約 既存のビデオ理解データセットは、主に人間とのやり取りに焦点を当てており、ビ … 続きを読む

カテゴリー: cs.CL, cs.CV | WildQA: In-the-Wild Video Question Answering はコメントを受け付けていません

Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video

要約 オーディオビジュアル自動音声認識 (AV-ASR) は、追加の情報源として … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video はコメントを受け付けていません

FreeGaze: Resource-efficient Gaze Estimation via Frequency Domain Contrastive Learning

要約 視線推定は、認知心理学の基礎研究から注意を認識するモバイル システムに至る … 続きを読む

カテゴリー: cs.AI, cs.CV | FreeGaze: Resource-efficient Gaze Estimation via Frequency Domain Contrastive Learning はコメントを受け付けていません

Out-of-Vocabulary Challenge Report

要約 このホワイト ペーパーでは、Out-Of-Vocabulary 2022 … 続きを読む

カテゴリー: cs.CV | Out-of-Vocabulary Challenge Report はコメントを受け付けていません

Efficient Unsupervised Learning for Plankton Images

要約 その場でプランクトンの個体数を監視することは、水生生態系を維持するための基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Unsupervised Learning for Plankton Images はコメントを受け付けていません