月別アーカイブ: 2022年6月

Variational Nested Dropout

要約 ネストされたドロップアウトは、トレーニング中に事前定義された重要度に基づい … 続きを読む

カテゴリー: cs.CV, cs.LG | Variational Nested Dropout はコメントを受け付けていません

Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks

要約 ポーズ推定、オブジェクト検出、深度推定、画像生成、領域キャプションや参照表 … 続きを読む

カテゴリー: cs.CV | Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks はコメントを受け付けていません

VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix

要約 既存のビジョン言語事前トレーニング(VLP)の方法は、主にペアの画像テキス … 続きを読む

カテゴリー: cs.CV | VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix はコメントを受け付けていません

VectorMapNet: End-to-end Vectorized HD Map Learning

要約 自動運転システムでは、移動する障害物や静的な高解像度(HD)セマンティック … 続きを読む

カテゴリー: cs.CV, cs.RO | VectorMapNet: End-to-end Vectorized HD Map Learning はコメントを受け付けていません

Cross-task Attention Mechanism for Dense Multi-task Learning

要約 マルチタスク学習は、最近、複雑なシーンを包括的に理解するための有望なソリュ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Cross-task Attention Mechanism for Dense Multi-task Learning はコメントを受け付けていません

TAVA: Template-free Animatable Volumetric Actors

要約 座標ベースのボリューム表現は、画像からフォトリアリスティックな仮想アバター … 続きを読む

カテゴリー: cs.AI, cs.CV | TAVA: Template-free Animatable Volumetric Actors はコメントを受け付けていません

Skin Deep Unlearning: Artefact and Instrument Debiasing in the Context of Melanoma Classification

要約 畳み込みニューラルネットワークは、皮膚病変画像からの黒色腫の分類において皮 … 続きを読む

カテゴリー: cs.CV | Skin Deep Unlearning: Artefact and Instrument Debiasing in the Context of Melanoma Classification はコメントを受け付けていません

SeCGAN: Parallel Conditional Generative Adversarial Networks for Face Editing via Semantic Consistency

要約 意味的にガイドされた条件付き生成的敵対的ネットワーク(cGAN)は、近年、 … 続きを読む

カテゴリー: cs.CV | SeCGAN: Parallel Conditional Generative Adversarial Networks for Face Editing via Semantic Consistency はコメントを受け付けていません

Self-Adaptive Label Augmentation for Semi-supervised Few-shot Classification

要約 数ショットの分類は、ラベル付けされたサンプルが数個しかない場合に、新しいタ … 続きを読む

カテゴリー: cs.CV | Self-Adaptive Label Augmentation for Semi-supervised Few-shot Classification はコメントを受け付けていません

Zero-Shot Video Question Answering via Frozen Bidirectional Language Models

要約 ビデオ質問応答(VideoQA)は、トレーニングに多様なマルチモーダルデー … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Zero-Shot Video Question Answering via Frozen Bidirectional Language Models はコメントを受け付けていません