Geometric Algebra Transformers


幾何学的データに関連する問題は、コンピューター ビジョン、ロボット工学、化学、物理学などのさまざまな分野で発生します。
この論文では、幾何学的データの汎用アーキテクチャである幾何代数変換器 (GATr) を紹介します。
GATr は、射影幾何代数の入力、出力、および隠れ状態を表し、一般的な幾何オブジェクトとそれに作用する演算子の効率的な 16 次元ベクトル空間表現を提供します。
GATr は、3D ユークリッド空間の対称群である E(3) に関して等変です。
トランスフォーマーとしての GATr は、スケーラブルで表現力が豊かで多用途です。
n ボディ モデリングとロボット プランニングの実験では、GATr は非幾何学的ベースラインに比べて大幅な改善を示しました。


Problems involving geometric data arise in a variety of fields, including computer vision, robotics, chemistry, and physics. Such data can take numerous forms, such as points, direction vectors, planes, or transformations, but to date there is no single architecture that can be applied to such a wide variety of geometric types while respecting their symmetries. In this paper we introduce the Geometric Algebra Transformer (GATr), a general-purpose architecture for geometric data. GATr represents inputs, outputs, and hidden states in the projective geometric algebra, which offers an efficient 16-dimensional vector space representation of common geometric objects as well as operators acting on them. GATr is equivariant with respect to E(3), the symmetry group of 3D Euclidean space. As a transformer, GATr is scalable, expressive, and versatile. In experiments with n-body modeling and robotic planning, GATr shows strong improvements over non-geometric baselines.


著者 Johann Brehmer,Pim de Haan,Sönke Behrends,Taco Cohen
発行日 2023-05-28 18:48:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.RO, stat.ML パーマリンク