月別アーカイブ: 2022年6月

CMT: Convolutional Neural Networks Meet Vision Transformers

要約 ビジョントランスフォーマーは、画像内の長距離依存関係をキャプチャできるため … 続きを読む

カテゴリー: cs.CV | CMT: Convolutional Neural Networks Meet Vision Transformers はコメントを受け付けていません

Towards Understanding Why Mask-Reconstruction Pretraining Helps in Downstream Tasks

要約 教師なし事前トレーニングの場合、マスク再構築事前トレーニング(MRP)は、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, stat.ML | Towards Understanding Why Mask-Reconstruction Pretraining Helps in Downstream Tasks はコメントを受け付けていません

Identifying High Accuracy Regions in Traffic Camera Images to Enhance the Estimation of Road Traffic Metrics: A Quadtree-Based Method

要約 都市部でのリアルタイムカメラフィードの数の増加により、効果的な交通計画、運 … 続きを読む

カテゴリー: cs.CV, cs.CY | Identifying High Accuracy Regions in Traffic Camera Images to Enhance the Estimation of Road Traffic Metrics: A Quadtree-Based Method はコメントを受け付けていません

PETS-SWINF: A regression method that considers images with metadata based Neural Network for pawpularity prediction on 2021 Kaggle Competition ‘PetFinder.my’

要約 何百万もの野良動物が路上で苦しんでいるか、世界中の避難所で毎日安楽死させら … 続きを読む

カテゴリー: cs.AI, cs.CV | PETS-SWINF: A regression method that considers images with metadata based Neural Network for pawpularity prediction on 2021 Kaggle Competition ‘PetFinder.my’ はコメントを受け付けていません

FLAME: Facial Landmark Heatmap Activated Multimodal Gaze Estimation

要約 3D視線推定は、3D空間での人の視線を予測することです。 同じものの人に依 … 続きを読む

カテゴリー: 68T05, 68T10, cs.AI, cs.CV, I.5 | FLAME: Facial Landmark Heatmap Activated Multimodal Gaze Estimation はコメントを受け付けていません

How Unique Is a Face: An Investigative Study

要約 顔認識は、国境管理から銀行セクターのセキュリティに至るまでのアプリケーショ … 続きを読む

カテゴリー: 68T05, 68T10, cs.CV, I.5 | How Unique Is a Face: An Investigative Study はコメントを受け付けていません

Object Scene Representation Transformer

要約 3D空間でのオブジェクトとそのジオメトリに関する世界の構成的理解は、人間の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Object Scene Representation Transformer はコメントを受け付けていません

A Multi-task Framework for Infrared Small Target Detection and Segmentation

要約 赤外線画像の複雑な背景とノイズのために、赤外線の小さなターゲットの検出は、 … 続きを読む

カテゴリー: cs.CV | A Multi-task Framework for Infrared Small Target Detection and Segmentation はコメントを受け付けていません

Comprehending and Ordering Semantics for Image Captioning

要約 画像の豊富なセマンティクスを理解し、それらを言語順に並べることは、画像のキ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Comprehending and Ordering Semantics for Image Captioning はコメントを受け付けていません

Stand-Alone Inter-Frame Attention in Video Models

要約 ビデオの独自性としてのモーションは、ビデオ理解モデルの開発に不可欠です。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Stand-Alone Inter-Frame Attention in Video Models はコメントを受け付けていません