要約
生成人工知能(GAI)の出現は、社会が知識の習得について考える方法を変えた変曲点を告げました。
GAIは意思決定に対して完全に信頼することはできませんが、決定パイプラインに統合できる貴重な情報を提供する場合があります。
ガイの確実性と固有のランダム性の欠如を問題として見るのではなく、私たちはそれを機会と見なしています。
実際、指定されたプロンプトに対するさまざまな回答を活用して、AI予測の保証を反映する事前の分布を構築することができます。
この事前の分布は、AI駆動型の事前に完全にベイジアン分析を行うために、カスタマイズされたデータセットと組み合わせることができます。
この論文では、ノンパラメトリックベイジアンフレームワーク内でそのような可能性を探ります。
基本的なアイデアは、データ生成モデルを使用したデータ生成分布に関するDirichletプロセスの事前分布をそのベースラインとして割り当てることで構成されています。
前のハイパーパラメーターは、サンプル外で調整して、AI事前の情報性を評価できます。
後部シミュレーションは、観測された(ラベル付けされた)データと、AIを使用してラベルが帰属している偽データで構成される拡張データで適切にランダム化された機能を計算することによって達成されます。
この戦略は並行して、条件からのサンプリングとは対照的に、最適化により事後からIIDサンプルを迅速に生成できます。
私たちの方法により、(予測)推論と不確実性の定量化が、AI予測をコヒーレントな確率的方法で活用します。
要約(オリジナル)
The advent of Generative Artificial Intelligence (GAI) has heralded an inflection point that changed how society thinks about knowledge acquisition. While GAI cannot be fully trusted for decision-making, it may still provide valuable information that can be integrated into a decision pipeline. Rather than seeing the lack of certitude and inherent randomness of GAI as a problem, we view it as an opportunity. Indeed, variable answers to given prompts can be leveraged to construct a prior distribution which reflects assuredness of AI predictions. This prior distribution may be combined with tailored datasets for a fully Bayesian analysis with an AI-driven prior. In this paper, we explore such a possibility within a non-parametric Bayesian framework. The basic idea consists of assigning a Dirichlet process prior distribution on the data-generating distribution with AI generative model as its baseline. Hyper-parameters of the prior can be tuned out-of-sample to assess the informativeness of the AI prior. Posterior simulation is achieved by computing a suitably randomized functional on an augmented data that consists of observed (labeled) data as well as fake data whose labels have been imputed using AI. This strategy can be parallelized and rapidly produces iid samples from the posterior by optimization as opposed to sampling from conditionals. Our method enables (predictive) inference and uncertainty quantification leveraging AI predictions in a coherent probabilistic manner.
arxiv情報
著者 | Veronika Ročková,Sean O’Hagan |
発行日 | 2025-04-01 15:27:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google