From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization

要約

拡散モデルや大規模な視覚言語モデル(LVLMS)などの基礎モデル(FMS)は、教育的文脈で広く適用されていますが、教育学的に効果的な視覚的説明を生成する能力はまだ限られています。
ほとんどの既存のアプローチは、主にテキストの推論に焦点を当てており、概念的理解をサポートする上で構造化された解釈可能な視覚化の重要な役割を見落としています。
教育環境でのFMSの視覚的推論機能をより適切に評価するために、マルチドメインのマルチレベルのベンチマークであるEduvisbenchを紹介します。
Eduvisbenchは、視覚的に接地されたソリューションを必要とする多様なSTEM問題セットと、教育理論によって情報を提供する細かい評価ルーブリックを特徴としています。
私たちの経験的分析は、既存のモデルが複雑な推論を分解し、それを人間の認知プロセスに合わせた視覚表現に変換するという固有の課題に頻繁に闘っていることを明らかにしています。
これらの制限に対処するために、教育計画、推論の分解、メタ認知プロンプト、視覚化設計のために専門的なエージェントを調整するマルチエージェント共同フレームワークであるEduvisagentを提案します。
実験結果は、エデュビサージェントがすべてのベースラインを大幅に上回り、40.2%の改善を達成し、より多くの教育的に整合した視覚化を提供することを示しています。
EduvisbenchとEduvisagentは、https://github.com/aiming-lab/eduvisbenchおよびhttps://github.com/aiming-lab/eduvisagentで入手できます。

要約(オリジナル)

While foundation models (FMs), such as diffusion models and large vision-language models (LVLMs), have been widely applied in educational contexts, their ability to generate pedagogically effective visual explanations remains limited. Most existing approaches focus primarily on textual reasoning, overlooking the critical role of structured and interpretable visualizations in supporting conceptual understanding. To better assess the visual reasoning capabilities of FMs in educational settings, we introduce EduVisBench, a multi-domain, multi-level benchmark. EduVisBench features diverse STEM problem sets requiring visually grounded solutions, along with a fine-grained evaluation rubric informed by pedagogical theory. Our empirical analysis reveals that existing models frequently struggle with the inherent challenge of decomposing complex reasoning and translating it into visual representations aligned with human cognitive processes. To address these limitations, we propose EduVisAgent, a multi-agent collaborative framework that coordinates specialized agents for instructional planning, reasoning decomposition, metacognitive prompting, and visualization design. Experimental results show that EduVisAgent substantially outperforms all baselines, achieving a 40.2% improvement and delivering more educationally aligned visualizations. EduVisBench and EduVisAgent are available at https://github.com/aiming-lab/EduVisBench and https://github.com/aiming-lab/EduVisAgent.

arxiv情報

著者 Haonian Ji,Shi Qiu,Siyang Xin,Siwei Han,Zhaorun Chen,Hongyi Wang,Dake Zhang,Huaxiu Yao
発行日 2025-05-22 16:02:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG パーマリンク