月別アーカイブ: 2022年9月

Levenshtein OCR

要約 Vision-Language Transformer (VLT)に基づく … 続きを読む

カテゴリー: cs.CV | Levenshtein OCR はコメントを受け付けていません

VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training

要約 ファッションの着こなしが美的であるとみなされるためには、それを構成する衣服 … 続きを読む

カテゴリー: cs.CV, cs.MM | VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training はコメントを受け付けていません

nVFNet-RDC: Replay and Non-Local Distillation Collaboration for Continual Object Detection

要約 継続的学習(Continual Learning: CL)は、新しい環境に … 続きを読む

カテゴリー: cs.CV | nVFNet-RDC: Replay and Non-Local Distillation Collaboration for Continual Object Detection はコメントを受け付けていません

TransCrowd: weakly-supervised crowd counting with transformers

要約 群衆計測の主流は、通常、畳み込みニューラルネットワーク(CNN)を利用して … 続きを読む

カテゴリー: cs.CV | TransCrowd: weakly-supervised crowd counting with transformers はコメントを受け付けていません

An Iteratively Optimized Patch Label Inference Network for Automatic Pavement Distress Detection

要約 我々は、ひび割れやポットホールなどの特定のものだけに限定されない様々な舗装 … 続きを読む

カテゴリー: cs.CV | An Iteratively Optimized Patch Label Inference Network for Automatic Pavement Distress Detection はコメントを受け付けていません

Exploring Adversarial Attacks and Defenses in Vision Transformers trained with DINO

要約 本研究では、DINOを用いて学習した自己教師ありVision Transf … 続きを読む

カテゴリー: cs.AI, cs.CV | Exploring Adversarial Attacks and Defenses in Vision Transformers trained with DINO はコメントを受け付けていません

Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering

要約 マルチモーダルビデオ質問応答は、正解を予測し、質問に関連する時間的境界を局 … 続きを読む

カテゴリー: cs.CV, cs.MM | Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering はコメントを受け付けていません

Representing Camera Response Function by a Single Latent Variable and Fully Connected Neural Network

要約 シーン照度から画像強度へのマッピングをモデル化することは、多くのコンピュー … 続きを読む

カテゴリー: cs.CV | Representing Camera Response Function by a Single Latent Variable and Fully Connected Neural Network はコメントを受け付けていません

Application of image-to-image translation in improving pedestrian detection

要約 低照度下では、有効なターゲット領域がないため、歩行者の認識や画像間の変換な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Application of image-to-image translation in improving pedestrian detection はコメントを受け付けていません

Positive-Negative Equal Contrastive Loss for Semantic Segmentation

要約 文脈情報は様々なコンピュータビジョンタスクにとって重要であり、これまでの研 … 続きを読む

カテゴリー: cs.CV | Positive-Negative Equal Contrastive Loss for Semantic Segmentation はコメントを受け付けていません