月別アーカイブ: 2022年7月

Compositional Visual Generation with Composable Diffusion Models

要約 DALLE-2などの大規模なテキストガイド拡散モデルは、自然言語の説明が与 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Compositional Visual Generation with Composable Diffusion Models はコメントを受け付けていません

Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search

要約 他の深くスケーラブルなアーキテクチャベースのNASアプローチとは異なり、B … 続きを読む

カテゴリー: cs.CV | Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search はコメントを受け付けていません

MINSU (Mobile Inventory And Scanning Unit):Computer Vision and AI

要約 MINSU(Mobile Inventory and Scanning U … 続きを読む

カテゴリー: cs.AI, cs.CV | MINSU (Mobile Inventory And Scanning Unit):Computer Vision and AI はコメントを受け付けていません

Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis

要約 コンテンツ編集用のツールが成熟し、メディアを合成するための人工知能(AI) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Video Manipulations Beyond Faces: A Dataset with Human-Machine Analysis はコメントを受け付けていません

Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search

要約 他の深くスケーラブルなアーキテクチャベースのNASアプローチとは異なり、B … 続きを読む

カテゴリー: cs.CV | Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search はコメントを受け付けていません

S-Prompts Learning with Pre-trained Transformers: An Occam’s Razor for Domain Incremental Learning

要約 最先端のディープニューラルネットワークは、継続的な学習における壊滅的な忘却 … 続きを読む

カテゴリー: cs.CV, cs.LG | S-Prompts Learning with Pre-trained Transformers: An Occam’s Razor for Domain Incremental Learning はコメントを受け付けていません

Compositional Human-Scene Interaction Synthesis with Semantic Control

要約 仮想人間とその3D環境の間の自然な相互作用を合成することは、コンピューター … 続きを読む

カテゴリー: cs.CV | Compositional Human-Scene Interaction Synthesis with Semantic Control はコメントを受け付けていません

Unsupervised Image Representation Learning with Deep Latent Particles

要約 オブジェクトの位置を外観から解きほぐす視覚データの新しい表現を提案します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Unsupervised Image Representation Learning with Deep Latent Particles はコメントを受け付けていません

Multimodal-GuideNet: Gaze-Probe Bidirectional Guidance in Obstetric Ultrasound Scanning

要約 アイトラッカーは、超音波(US)スキャン中に超音波検査者に視覚的なガイダン … 続きを読む

カテゴリー: cs.CV | Multimodal-GuideNet: Gaze-Probe Bidirectional Guidance in Obstetric Ultrasound Scanning はコメントを受け付けていません

ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer

要約 最近、ビジョントランスフォーマーは、大規模な畳み込みベースのモデルを大幅に … 続きを読む

カテゴリー: cs.CV | ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer はコメントを受け付けていません