要約
チャートンの作業に基づいて、小さな変圧器モデルをトレーニングして、M \ ‘obius関数$ \ mu(n)$とスクエアフリーインジケーター関数$ \ mu^2(n)$を計算します。
モデルは、自明でない予測力を達成します。
次に、追加のモデルを繰り返しトレーニングして、モデルがどのように機能するかを理解し、最終的に理論的な説明を見つけます。
要約(オリジナル)
Building on work of Charton, we train small transformer models to calculate the M\’obius function $\mu(n)$ and the squarefree indicator function $\mu^2(n)$. The models attain nontrivial predictive power. We then iteratively train additional models to understand how the model functions, ultimately finding a theoretical explanation.
arxiv情報
著者 | David Lowry-Duda |
発行日 | 2025-02-14 17:50:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google