Adversarial Latent Autoencoder with Self-Attention for Structural Image Synthesis

要約

ディープ ジェネレーティブ モデル (DGM) によって推進されるジェネレーティブ エンジニアリング デザイン アプローチは、産業エンジニアリング プロセスを促進するために提案されています。
このようなプロセスでは、設計は、詳細レベルに応じて、青写真、設計図、CAD モデルなどの画像の形式で行われることがよくあります。
DGM は、動物、人間の顔、風景などの自然画像の合成に使用されて成功しています。
ただし、工業デザインの画像は、豊富な構造パターンと長距離の依存関係が含まれているという点で、自然の風景とは根本的に異なります。これらは、畳み込みベースの DGM が生成するのが困難です。
さらに、DGM 駆動の生成プロセスは通常、ランダムなノイズの多い入力に基づいてトリガーされるため、予測不可能なサンプルが出力されるため、効率的な工業デザインの検討を実行できません。
我々は、複雑なエンジニアリング部品の実現可能な設計イメージを生成できる新しいモデル Self-Attention Adversarial Latent Autoencoder (SA-ALAE) を提案することで、これらの課題に取り組みます。
SA-ALAE を使用すると、ユーザーは既存の設計の新しいバリエーションを探索できるだけでなく、潜在空間で操作することで生成プロセスを制御することもできます。
SA-ALAE の可能性は、実際の自動車設計タスクでエンジニアリング ブループリントを生成することによって示されます。

要約(オリジナル)

Generative Engineering Design approaches driven by Deep Generative Models (DGM) have been proposed to facilitate industrial engineering processes. In such processes, designs often come in the form of images, such as blueprints, engineering drawings, and CAD models depending on the level of detail. DGMs have been successfully employed for synthesis of natural images, e.g., displaying animals, human faces and landscapes. However, industrial design images are fundamentally different from natural scenes in that they contain rich structural patterns and long-range dependencies, which are challenging for convolution-based DGMs to generate. Moreover, DGM-driven generation process is typically triggered based on random noisy inputs, which outputs unpredictable samples and thus cannot perform an efficient industrial design exploration. We tackle these challenges by proposing a novel model Self-Attention Adversarial Latent Autoencoder (SA-ALAE), which allows generating feasible design images of complex engineering parts. With SA-ALAE, users can not only explore novel variants of an existing design, but also control the generation process by operating in latent space. The potential of SA-ALAE is shown by generating engineering blueprints in a real automotive design task.

arxiv情報

著者 Jiajie Fan,Laure Vuaille,Hao Wang,Thomas Bäck
発行日 2023-07-19 17:50:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.CV, eess.IV パーマリンク