月別アーカイブ: 2022年8月

Self-Supervised Visual Place Recognition by Mining Temporal and Feature Neighborhoods

要約 ディープネットワークを利用した視覚的場所認識(VPR)は、最先端のパフォー … 続きを読む

カテゴリー: cs.CV | Self-Supervised Visual Place Recognition by Mining Temporal and Feature Neighborhoods はコメントを受け付けていません

Low-light Enhancement Method Based on Attention Map Net

要約 低照度画像強調は、一部の複雑な視覚タスクにとって重要な前処理タスクです。 … 続きを読む

カテゴリー: cs.CV, eess.IV | Low-light Enhancement Method Based on Attention Map Net はコメントを受け付けていません

Text to Image Generation: Leaving no Language Behind

要約 人工知能 (AI) の最新のアプリケーションの 1 つは、自然言語の記述か … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Text to Image Generation: Leaving no Language Behind はコメントを受け付けていません

Facilitated machine learning for image-based fruit quality assessment

要約 画像ベースの機械学習モデルを使用して、農産物の選別と等級付けをより効率的に … 続きを読む

カテゴリー: cs.CV | Facilitated machine learning for image-based fruit quality assessment はコメントを受け付けていません

Dispersed Pixel Perturbation-based Imperceptible Backdoor Trigger for Image Classifier Models

要約 典型的なディープ ニューラル ネットワーク (DNN) バックドア攻撃は、 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2 | Dispersed Pixel Perturbation-based Imperceptible Backdoor Trigger for Image Classifier Models はコメントを受け付けていません

Level Set-Based Camera Pose Estimation From Multiple 2D/3D Ellipse-Ellipsoid Correspondences

要約 この論文では、単一のRGB画像と、楕円体モデルで表されるオブジェクトの事前 … 続きを読む

カテゴリー: cs.CV | Level Set-Based Camera Pose Estimation From Multiple 2D/3D Ellipse-Ellipsoid Correspondences はコメントを受け付けていません

IPNET:Influential Prototypical Networks for Few Shot Learning

要約 プロトタイプ ネットワーク (PN) は、シンプルでありながら効果的な数シ … 続きを読む

カテゴリー: cs.CV | IPNET:Influential Prototypical Networks for Few Shot Learning はコメントを受け付けていません

PyMIC: A deep learning toolkit for annotation-efficient medical image segmentation

要約 背景と目的: 医療画像セグメンテーション用の既存のディープ ラーニング プ … 続きを読む

カテゴリー: cs.CV, eess.IV | PyMIC: A deep learning toolkit for annotation-efficient medical image segmentation はコメントを受け付けていません

BanglaWriting: A multi-purpose offline Bangla handwriting dataset

要約 この記事では、BanglaWriting という名前のバングラ手書きデータ … 続きを読む

カテゴリー: cs.CV, cs.LG | BanglaWriting: A multi-purpose offline Bangla handwriting dataset はコメントを受け付けていません

VLMAE: Vision-Language Masked Autoencoder

要約 画像と言語のモデリングは、大規模な画像とテキストのペア データからマルチモ … 続きを読む

カテゴリー: cs.CV | VLMAE: Vision-Language Masked Autoencoder はコメントを受け付けていません