月別アーカイブ: 2022年6月

Variational Nested Dropout

投稿日: 2022年6月20日作成者: jarxiv

要約ネストされたドロップアウトは、トレーニング中に事前定義された重要度に基づい … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks

投稿日: 2022年6月20日作成者: jarxiv

要約ポーズ推定、オブジェクト検出、深度推定、画像生成、領域キャプションや参照表 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix

投稿日: 2022年6月20日作成者: jarxiv

要約既存のビジョン言語事前トレーニング（VLP）の方法は、主にペアの画像テキス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VectorMapNet: End-to-end Vectorized HD Map Learning

投稿日: 2022年6月20日作成者: jarxiv

要約自動運転システムでは、移動する障害物や静的な高解像度（HD）セマンティック … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Cross-task Attention Mechanism for Dense Multi-task Learning

投稿日: 2022年6月20日作成者: jarxiv

要約マルチタスク学習は、最近、複雑なシーンを包括的に理解するための有望なソリュ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

TAVA: Template-free Animatable Volumetric Actors

投稿日: 2022年6月20日作成者: jarxiv

要約座標ベースのボリューム表現は、画像からフォトリアリスティックな仮想アバター … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Skin Deep Unlearning: Artefact and Instrument Debiasing in the Context of Melanoma Classification

投稿日: 2022年6月20日作成者: jarxiv

要約畳み込みニューラルネットワークは、皮膚病変画像からの黒色腫の分類において皮 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SeCGAN: Parallel Conditional Generative Adversarial Networks for Face Editing via Semantic Consistency

投稿日: 2022年6月17日作成者: jarxiv

要約意味的にガイドされた条件付き生成的敵対的ネットワーク（cGAN）は、近年、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Self-Adaptive Label Augmentation for Semi-supervised Few-shot Classification

投稿日: 2022年6月17日作成者: jarxiv

要約数ショットの分類は、ラベル付けされたサンプルが数個しかない場合に、新しいタ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Zero-Shot Video Question Answering via Frozen Bidirectional Language Models

投稿日: 2022年6月17日作成者: jarxiv

要約ビデオ質問応答（VideoQA）は、トレーニングに多様なマルチモーダルデー … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2022年6月

Variational Nested Dropout

Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks

VLMixer: Unpaired Vision-Language Pre-training via Cross-Modal CutMix

VectorMapNet: End-to-end Vectorized HD Map Learning

Cross-task Attention Mechanism for Dense Multi-task Learning

TAVA: Template-free Animatable Volumetric Actors

Skin Deep Unlearning: Artefact and Instrument Debiasing in the Context of Melanoma Classification

SeCGAN: Parallel Conditional Generative Adversarial Networks for Face Editing via Semantic Consistency

Self-Adaptive Label Augmentation for Semi-supervised Few-shot Classification

Zero-Shot Video Question Answering via Frozen Bidirectional Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー