月別アーカイブ: 2023年5月

DisCLIP: Open-Vocabulary Referring Expression Generation

要約 Referring Expressions Generation (REG … 続きを読む

カテゴリー: cs.CV | DisCLIP: Open-Vocabulary Referring Expression Generation はコメントを受け付けていません

DENTEX: An Abnormal Tooth Detection with Dental Enumeration and Diagnosis Benchmark for Panoramic X-rays

要約 パノラマ X 線写真は歯科治療計画のために頻繁に使用されますが、その読影に … 続きを読む

カテゴリー: cs.CV | DENTEX: An Abnormal Tooth Detection with Dental Enumeration and Diagnosis Benchmark for Panoramic X-rays はコメントを受け付けていません

Trade-off Between Efficiency and Consistency for Removal-based Explanations

要約 現在の説明手法の状況では、SHAP や LIME などの最も主流のアプロー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Trade-off Between Efficiency and Consistency for Removal-based Explanations はコメントを受け付けていません

Calliffusion: Chinese Calligraphy Generation and Style Transfer with Diffusion Modeling

要約 本稿では、拡散モデルを用いて高品質な書道を生成するシステムCalliffu … 続きを読む

カテゴリー: cs.CV | Calliffusion: Chinese Calligraphy Generation and Style Transfer with Diffusion Modeling はコメントを受け付けていません

Men Also Do Laundry: Multi-Attribute Bias Amplification

要約 コンピュータ ビジョン システムの導入が広がるにつれ、これらのシステムが有 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Men Also Do Laundry: Multi-Attribute Bias Amplification はコメントを受け付けていません

Learning from Children: Improving Image-Caption Pretraining via Curriculum

要約 画像キャプションの事前トレーニングは、ゼロショット画像分類や物体検出などの … 続きを読む

カテゴリー: cs.CL, cs.CV | Learning from Children: Improving Image-Caption Pretraining via Curriculum はコメントを受け付けていません

Context-Preserving Two-Stage Video Domain Translation for Portrait Stylization

要約 本物の人間の顔の画像を芸術的に様式化された画像に変換するポートレートの様式 … 続きを読む

カテゴリー: cs.CV | Context-Preserving Two-Stage Video Domain Translation for Portrait Stylization はコメントを受け付けていません

V1T: large-scale mouse V1 response prediction using a Vision Transformer

要約 自然な視覚刺激に対する視覚野の神経反応の正確な予測モデルは、計算論的神経科 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, q-bio.NC | V1T: large-scale mouse V1 response prediction using a Vision Transformer はコメントを受け付けていません

Recognizing People by Body Shape Using Deep Networks of Images and Words

要約 個人識別の一般的かつ重要な用途は、顔が見えないか、十分に解像されていない距 … 続きを読む

カテゴリー: cs.CV | Recognizing People by Body Shape Using Deep Networks of Images and Words はコメントを受け付けていません

LANCE: Stress-testing Visual Models by Generating Language-guided Counterfactual Images

要約 我々は、言語ガイド付き反事実テスト画像(LANCE)を生成することにより、 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | LANCE: Stress-testing Visual Models by Generating Language-guided Counterfactual Images はコメントを受け付けていません