Phase Transitions in the Output Distribution of Large Language Models

要約

物理システムでは、温度などのパラメーターを変更すると、相転移、つまり物質のある状態から別の状態への突然の変化が引き起こされることがあります。
最近、同様の現象が大規模な言語モデルでも観察されています。
通常、相転移を特定するタスクでは、人間による分析と、どの低次元特性を監視および分析するかを絞り込むために、システムについての事前の理解が必要です。
データから相転移を自動検出するための統計的手法が、最近物理学界で提案されています。
これらの方法は主にシステムに依存せず、ここで示すように、大規模な言語モデルの動作を研究するために適応できます。
特に、統計的距離を介して生成された出力の分布変化を定量化します。これは、次のトークンにわたる確率分布にアクセスすることで効率的に推定できます。
この多用途なアプローチは、動作の新しい段階や未踏の移行を発見することができます。これは、言語モデルとその新たな機能の急速な発展を考慮すると、特に興味深い能力です。

要約(オリジナル)

In a physical system, changing parameters such as temperature can induce a phase transition: an abrupt change from one state of matter to another. Analogous phenomena have recently been observed in large language models. Typically, the task of identifying phase transitions requires human analysis and some prior understanding of the system to narrow down which low-dimensional properties to monitor and analyze. Statistical methods for the automated detection of phase transitions from data have recently been proposed within the physics community. These methods are largely system agnostic and, as shown here, can be adapted to study the behavior of large language models. In particular, we quantify distributional changes in the generated output via statistical distances, which can be efficiently estimated with access to the probability distribution over next-tokens. This versatile approach is capable of discovering new phases of behavior and unexplored transitions — an ability that is particularly exciting in light of the rapid development of language models and their emergent capabilities.

arxiv情報

著者 Julian Arnold,Flemming Holtorf,Frank Schäfer,Niels Lörch
発行日 2024-05-27 12:04:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.stat-mech, cs.AI, cs.CL, cs.LG パーマリンク