Smart Choices and the Selection Monad

要約

タイトル:スマートチョイスと選択のモナド

要約:
– 選択とその結果のコストや報酬を使ってシステムを説明することは、最適化技術や機械学習法によって実現される選択を、アルゴリズムデザイナーやプログラマーがどのように行うか指定する必要がないというメリットを提供する。
– この方法をプログラミング言語の観点から研究し、選択と報酬をサポートする2つの小型言語を定義し、オペレーションと示唆意味を与えた。
– 二番目の言語の場合、可能なプログラム値と期待される報酬の間に相関がある程度異なる3つの示唆的な意味を考える。
– オペレーショナル示唆意味は、可能な実行戦略の空間上の最適化と標準構造の通常の示唆意味を組み合わせている。
– 示唆的な意味は合成的であり、選択を扱うために拡張モナドを使用し、報酬や確率などの他の効果を扱うために補助モナドを使用する。
– 2つの意味がすべての場合で一致する適切性定理を証明し、報酬のない場合の基本型の完全性を確立するために、報酬と確率を組み合わせた選択の公理を提示する。

要約(オリジナル)

Describing systems in terms of choices and their resulting costs and rewards offers the promise of freeing algorithm designers and programmers from specifying how those choices should be made; in implementations, the choices can be realized by optimization techniques and, increasingly, by machine-learning methods. We study this approach from a programming-language perspective. We define two small languages that support decision-making abstractions: one with choices and rewards, and the other additionally with probabilities. We give both operational and denotational semantics. In the case of the second language we consider three denotational semantics, with varying degrees of correlation between possible program values and expected rewards. The operational semantics combine the usual semantics of standard constructs with optimization over spaces of possible execution strategies. The denotational semantics, which are compositional, rely on the selection monad, to handle choice, augmented with an auxiliary monad to handle other effects, such as rewards or probability. We establish adequacy theorems that the two semantics coincide in all cases. We also prove full abstraction at base types, with varying notions of observation in the probabilistic case corresponding to the various degrees of correlation. We present axioms for choice combined with rewards and probability, establishing completeness at base types for the case of rewards without probability.

arxiv情報

著者 Martin Abadi,Gordon Plotkin
発行日 2023-04-19 07:36:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.LO, cs.PL パーマリンク