月別アーカイブ: 2023年9月

Towards Reliable Dermatology Evaluation Benchmarks

投稿日: 2023年9月14日作成者: jarxiv

要約デジタル皮膚科学のベンチマークデータセットには、モデルのパフォーマンス推 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Differentiable JPEG: The Devil is in the Details

投稿日: 2023年9月14日作成者: jarxiv

要約 JPEG は、依然として最も広く普及している非可逆画像符号化方式の 1 つ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Instance Adaptive Prototypical Contrastive Embedding for Generalized Zero Shot Learning

投稿日: 2023年9月14日作成者: jarxiv

要約一般化ゼロショット学習 (GZSL) は、トレーニング中に目に見えないラベ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RFDforFin: Robust Deep Forgery Detection for GAN-generated Fingerprint Images

投稿日: 2023年9月14日作成者: jarxiv

要約画像生成技術の急速な発展に伴い、GAN で生成された指紋画像の悪意のある悪 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deep Visual-Genetic Biometrics for Taxonomic Classification of Rare Species

投稿日: 2023年9月14日作成者: jarxiv

要約視覚的バイオメトリクスと遺伝的バイオメトリクスは、生物学的応用において種と … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | コメントを受け付けていません

Event and Entity Extraction from Generated Video Captions

投稿日: 2023年9月14日作成者: jarxiv

要約人間によるマルチメディアデータの注釈付けには時間とコストがかかり、セマン … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

DWRSeg: Rethinking Efficient Acquisition of Multi-scale Contextual Information for Real-time Semantic Segmentation

投稿日: 2023年9月14日作成者: jarxiv

要約現在の研究の多くは、マルチレートの深さ方向拡張畳み込みを直接採用して、1 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

TMSA: Towards Arbitrary Text-driven Image Manipulation via Space Alignment

投稿日: 2023年9月14日作成者: jarxiv

要約最近の GAN 反転手法は、実画像入力を StyleGAN の対応する編集 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models

投稿日: 2023年9月14日作成者: jarxiv

要約 MiniGPT-4 や LLaVA などの大規模視覚言語モデル (LVLM … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Exploiting Multiple Priors for Neural 3D Indoor Reconstruction

投稿日: 2023年9月14日作成者: jarxiv

要約ニューラルインプリシットモデリングを使用すると、小さなオブジェクトに対 … 続きを読む →

カテゴリー: cs.CV, I.3.5 | コメントを受け付けていません

月別アーカイブ: 2023年9月

Towards Reliable Dermatology Evaluation Benchmarks

Differentiable JPEG: The Devil is in the Details

Instance Adaptive Prototypical Contrastive Embedding for Generalized Zero Shot Learning

RFDforFin: Robust Deep Forgery Detection for GAN-generated Fingerprint Images

Deep Visual-Genetic Biometrics for Taxonomic Classification of Rare Species

Event and Entity Extraction from Generated Video Captions

DWRSeg: Rethinking Efficient Acquisition of Multi-scale Contextual Information for Real-time Semantic Segmentation

TMSA: Towards Arbitrary Text-driven Image Manipulation via Space Alignment

AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models

Exploiting Multiple Priors for Neural 3D Indoor Reconstruction

最近の投稿

最近のコメント

アーカイブ

カテゴリー