GeoUni: A Unified Model for Generating Geometry Diagrams, Problems and Problem Solutions

要約

ユニークで個別化されたジオメトリ問題の作成を可能にする方法で、単一のフレームワーク内で問題の解と図を生成できる最初の統合されたジオメトリエキスパートモデルであるGeouniを提案します。
伝統的に、幾何学の問題を解決し、図を生成することは、機械学習における個別のタスクとして扱われてきましたが、問題の作成をサポートするために両方を統合するモデルはありませんでした。
ただし、幾何学の習得には、問題の解決から幾何学的関係の視覚化まで、最後にテーラードの問題を作成することまで、これらすべてのスキルの摩擦のない統合が必要であると考えています。
私たちの広範な実験は、幾何学的推論タスクに671Bパラメーターを備えたDeepSeek-R1などの大規模なモデルに匹敵する1.5Bパラメーターのみを備えたGeouniが実現することを示しています。
Geouniは、GPT-4O画像生成を含むテキストから画像へのモデルと統一モデルの両方を超えて、正確な幾何学図を生成することに優れています。
最も重要なことは、Geouniは、特定のナレッジポイントに基づいて一致する図でテキストの問題を正常に生成できる唯一のモデルであり、現在のモデルを超えて拡張される幅広い機能を提供することです。

要約(オリジナル)

We propose GeoUni, the first unified geometry expert model capable of generating problem solutions and diagrams within a single framework in a way that enables the creation of unique and individualized geometry problems. Traditionally, solving geometry problems and generating diagrams have been treated as separate tasks in machine learning, with no models successfully integrating both to support problem creation. However, we believe that mastery in geometry requires frictionless integration of all of these skills, from solving problems to visualizing geometric relationships, and finally, crafting tailored problems. Our extensive experiments demonstrate that GeoUni, with only 1.5B parameters, achieves performance comparable to larger models such as DeepSeek-R1 with 671B parameters in geometric reasoning tasks. GeoUni also excels in generating precise geometric diagrams, surpassing both text-to-image models and unified models, including the GPT-4o image generation. Most importantly, GeoUni is the only model capable of successfully generating textual problems with matching diagrams based on specific knowledge points, thus offering a wider range of capabilities that extend beyond current models.

arxiv情報

著者 Jo-Ku Cheng,Zeren Zhang,Ran Chen,Jingyang Deng,Ziran Qin,Jinwen Ma
発行日 2025-05-08 14:36:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク