要約
このポジション ペーパーは、不確実性の下での意思決定における最先端の技術を反映しています。
古典的な仮定は、確率はシステム内のすべての不確実性を十分に捉えることができるというものです。
この論文では、特に偶然的不確実性と認識論的不確実性を明確に区別することによって、この古典的な解釈を超える不確実性に焦点を当てています。
この論文では、マルコフ決定プロセス (MDP) の概要と、部分的な可観測性と敵対的行動を説明するための拡張について取り上げています。
これらのモデルは、偶然の不確実性を十分に捉えていますが、認識論的な不確実性をしっかりと説明することはできません。
その結果、より堅牢な解釈で不確実性を示す、いわゆる不確実性モデルの完全な概要を提示します。
正式な検証から、制御ベースの抽象化、強化学習に至るまで、離散モデルと連続モデルの両方のソリューション手法をいくつか示します。
このホワイトペーパーの不可欠な部分として、モデルベースの方法で豊富な種類の不確実性を処理するときに発生するいくつかの重要な課題をリストして説明します。
要約(オリジナル)
This position paper reflects on the state-of-the-art in decision-making under uncertainty. A classical assumption is that probabilities can sufficiently capture all uncertainty in a system. In this paper, the focus is on the uncertainty that goes beyond this classical interpretation, particularly by employing a clear distinction between aleatoric and epistemic uncertainty. The paper features an overview of Markov decision processes (MDPs) and extensions to account for partial observability and adversarial behavior. These models sufficiently capture aleatoric uncertainty but fail to account for epistemic uncertainty robustly. Consequently, we present a thorough overview of so-called uncertainty models that exhibit uncertainty in a more robust interpretation. We show several solution techniques for both discrete and continuous models, ranging from formal verification, over control-based abstractions, to reinforcement learning. As an integral part of this paper, we list and discuss several key challenges that arise when dealing with rich types of uncertainty in a model-based fashion.
arxiv情報
| 著者 | Thom Badings,Thiago D. Simão,Marnix Suilen,Nils Jansen | 
| 発行日 | 2023-03-10 10:53:33+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
