G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness

要約

ユーザーインターフェイス(UI)のデザインの有効性を評価することは、美学を超えて、説得力の設計の中心であるユーザーの行動に影響を与えるまで拡張されます。
A/Bテストは、どのUIの変動がより高いユーザーエンゲージメントを促進するかを決定するための主な方法ですが、費用がかかり、時間がかかります。
最近のビジョン言語モデル(VLM)は自動化されたUI分析を処理できますが、現在のアプローチは、比較説得力ではなく、孤立した設計属性に焦点を当てています。ユーザーインタラクションを最適化する重要な要因です。
これに対処するために、A/Bテスト結果と専門家の理論的根拠にラベルを付ける300の実世界のUI画像ペアを特徴とするペアワイズUI設計説得力評価タスク用に設計されたベンチマークであるWiserui-Benchを紹介します。
さらに、ポジションバイアスを削減し、評価の精度を向上させることにより、VLMベースの説得力評価を強化する新しい推論時間推論戦略であるG-Focusを提案します。
実験結果は、GフォーカスがペアワイズUI評価の一貫性と精度で既存の推論戦略を上回ることを示しています。
UI説得力のVLM駆動型評価を促進することにより、私たちの研究は、A/Bテストを補完するアプローチを提供し、スケーラブルなUI優先モデリングの進捗状況を推進し、設計最適化を提供します。
コードとデータは公開されます。

要約(オリジナル)

Evaluating user interface (UI) design effectiveness extends beyond aesthetics to influencing user behavior, a principle central to Design Persuasiveness. A/B testing is the predominant method for determining which UI variations drive higher user engagement, but it is costly and time-consuming. While recent Vision-Language Models (VLMs) can process automated UI analysis, current approaches focus on isolated design attributes rather than comparative persuasiveness-the key factor in optimizing user interactions. To address this, we introduce WiserUI-Bench, a benchmark designed for Pairwise UI Design Persuasiveness Assessment task, featuring 300 real-world UI image pairs labeled with A/B test results and expert rationales. Additionally, we propose G-FOCUS, a novel inference-time reasoning strategy that enhances VLM-based persuasiveness assessment by reducing position bias and improving evaluation accuracy. Experimental results show that G-FOCUS surpasses existing inference strategies in consistency and accuracy for pairwise UI evaluation. Through promoting VLM-driven evaluation of UI persuasiveness, our work offers an approach to complement A/B testing, propelling progress in scalable UI preference modeling and design optimization. Code and data will be released publicly.

arxiv情報

著者 Jaehyun Jeon,Jang Han Yoon,Min Soo Kim,Sumin Shim,Yejin Choi,Hanbin Kim,Youngjae Yu
発行日 2025-05-09 04:56:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク