ArchSeek: Retrieving Architectural Case Studies Using Vision-Language Models

要約

デザイナーが先例の例に依存して進行中のプロジェクトを導くか鼓舞するため、関連するケーススタディを効率的に検索することは、建築設計で重要です。
ただし、従来のテキストベースの検索ツールは、建築知識の本質的に視覚的で複雑な性質を捉えるのに苦労しており、しばしば時間と不正確な探索につながります。
このペーパーでは、建築設計の専門家向けに調整された推奨機能を備えた革新的なケーススタディ検索システムであるArchseekを紹介します。
ビジョン言語モデルとクロスモーダル埋め込みからの視覚的理解機能を搭載しているため、微調整されたコントロールを備えたテキストと画像クエリ、およびインタラクションベースのデザインケースの推奨事項が可能になります。
建築家に、他の視覚駆動型のデザインフィールドに潜在的なアプリケーションを備えた、デザインのインスピレーションを発見するためのより効率的でパーソナライズされた方法を提供します。
ソースコードは、https://github.com/danruili/archseekで入手できます。

要約(オリジナル)

Efficiently searching for relevant case studies is critical in architectural design, as designers rely on precedent examples to guide or inspire their ongoing projects. However, traditional text-based search tools struggle to capture the inherently visual and complex nature of architectural knowledge, often leading to time-consuming and imprecise exploration. This paper introduces ArchSeek, an innovative case study search system with recommendation capability, tailored for architecture design professionals. Powered by the visual understanding capabilities from vision-language models and cross-modal embeddings, it enables text and image queries with fine-grained control, and interaction-based design case recommendations. It offers architects a more efficient, personalized way to discover design inspirations, with potential applications across other visually driven design fields. The source code is available at https://github.com/danruili/ArchSeek.

arxiv情報

著者 Danrui Li,Yichao Shi,Yaluo Wang,Ziying Shi,Mubbasir Kapadia
発行日 2025-03-24 13:50:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク