要約
このホワイトペーパーでは、\ textIT {計算観測}および\ textIT {制限入力ソース}を組み込むために金の誘導性推論フレームワークを拡張することにより、計算可能な関数を制限で学習する問題を研究します。
従来の入出力の観察を無料で、より現実的な制約の下で一般的な再帰関数の学習性を研究するために、時間に縛られた観察と政策指示観測を紹介します。
一般的な再帰関数のクラスを制限で学習するには、入出力の観測では十分ではありませんが、計算の複雑さの制約を課すか、おおよその時間帯観測で補充することにより、この学習障壁を克服します。
さらに、\ textit {計算エージェント}の観察に関する正式なフレームワークを構築し、ポリシーの軌跡からの学習コンピューター機能が入力と出力からの合理的な関数の学習に減少し、有限状態のトランスデューサーの推論との興味深いつながりを明らかにすることを示します。
ネガティブな面では、ポリシートリューストの観測であっても、線形時間計算可能な関数のクラスには、計算可能または多項量の特性セットが存在できないことを示します。
要約(オリジナル)
This paper studies the problem of learning computable functions in the limit by extending Gold’s inductive inference framework to incorporate \textit{computational observations} and \textit{restricted input sources}. Complimentary to the traditional Input-Output Observations, we introduce Time-Bound Observations, and Policy-Trajectory Observations to study the learnability of general recursive functions under more realistic constraints. While input-output observations do not suffice for learning the class of general recursive functions in the limit, we overcome this learning barrier by imposing computational complexity constraints or supplementing with approximate time-bound observations. Further, we build a formal framework around observations of \textit{computational agents} and show that learning computable functions from policy trajectories reduces to learning rational functions from input and output, thereby revealing interesting connections to finite-state transducer inference. On the negative side, we show that computable or polynomial-mass characteristic sets cannot exist for the class of linear-time computable functions even for policy-trajectory observations.
arxiv情報
著者 | Hristo Papazov,Nicolas Flammarion |
発行日 | 2025-06-18 15:17:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google