Evaluation of Architectural Synthesis Using Generative AI

要約

マルチモーダル生成AIの最近の進歩は、技術的な図面の解釈や3D CADモデルの作成など、専門的な知識を必要とする3D CADモデルの作成など、専門的な建築タスクを民主化する可能性があります。
このペーパーでは、建築3D合成のタスクにおけるGPT-4OとClaude 3.5の2つのシステムの比較評価を紹介します。
Palladioの4冊の建築書(1965年)の2つの建物、Villa RotondaとPalazzo Portoの2つの建物に関するケーススタディを実施しています。
これらの建物の高レベルの建築モデルと図面は、Palladioの元のテキストと図面に触発され、準備されました。
シーケンシャルテキストと画像のプロンプトを通じて、(1)図面からの建物の2Dおよび3D表現の解釈、(2)建物をCADソフトウェアスクリプトにエンコードすること、および(3)出力に基づく自己改善のシステムの能力を評価します。
両方のシステムは個々の部品を正常に生成しますが、これらの部分を望ましい空間関係に正確に組み立てるのに苦労しています。クロード3.5は、特にその出力の自己修正において、パフォーマンスの向上を実証します。
この研究は、規律固有の知識を必要とするインテリジェントな人間のタスクを実行する際に、既製のAIシステムの長所と短所のベンチマークに関する継続的な研究に貢献しています。
調査結果は、言語対応のAIシステムが建築設計プロセスで共同技術アシスタントとして機能する可能性を強調しています。

要約(オリジナル)

Recent advancements in multimodal Generative AI have the potential to democratize specialized architectural tasks, such as interpreting technical drawings and creating 3D CAD models, which traditionally require expert knowledge. This paper presents a comparative evaluation of two systems: GPT-4o and Claude 3.5, in the task of architectural 3D synthesis. We conduct a case study on two buildings from Palladio’s Four Books of Architecture (1965): Villa Rotonda and Palazzo Porto. High-level architectural models and drawings of these buildings were prepared, inspired by Palladio’s original texts and drawings. Through sequential text and image prompting, we assess the systems’ abilities in (1) interpreting 2D and 3D representations of buildings from drawings, (2) encoding the buildings into a CAD software script, and (3) self-improving based on outputs. While both systems successfully generate individual parts, they struggle to accurately assemble these parts into the desired spatial relationships, with Claude 3.5 demonstrating better performance, particularly in self-correcting its output. This study contributes to ongoing research on benchmarking the strengths and weaknesses of off-the-shelf AI systems in performing intelligent human tasks that require discipline-specific knowledge. The findings highlight the potential of language-enabled AI systems to act as collaborative technical assistants in the architectural design process.

arxiv情報

著者 Jingfei Huang,Alexandros Haridis
発行日 2025-03-04 18:39:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC パーマリンク