要約
人間の行動をモデル化するために生成エージェントを使用してサンドボックス社会をシミュレートし、それによって公共政策を評価するための実際の人間の試験への過度の依存を減らすことができますか?
この作業では、事例研究として、ワクチン接種サービスの入手可能性にもかかわらず、ワクチンの受け入れまたは拒否の遅延または拒否の遅延または拒否として定義された、ワクチンのためらうことを使用して、健康関連の意思決定をシミュレートする可能性を調査します(Macdonald、2015)。
この目的のために、大規模な言語モデル(LLM)を搭載した100の生成エージェントを使用して、VACSIMフレームワークを紹介します。
VACSIMは、次の手順でワクチン政策の結果をシミュレートします。1)国勢調査データに基づく人口統計を持つエージェントの集団を即座に導きます。
2)ソーシャルネットワークを介してエージェントを接続し、ソーシャルダイナミクスと疾患関連情報の関数としてワクチンの態度をモデル化します。
3)ワクチンのためらいを緩和することを目的としたさまざまな公衆衛生の介入を設計および評価する。
実際の結果に合わせて、シミュレーションのウォームアップと態度変調を導入して、エージェントの態度を調整します。
さまざまなLLMシミュレーションの信頼性を評価するための一連の評価を提案します。
実験は、LlamaやQwenなどのモデルが人間の行動の側面をシミュレートできるだけでなく、人口統計プロファイルの一貫性のない応答など、現実世界のアライメントの課題を強調できることを示しています。
LLM駆動型シミュレーションのこの初期の調査は、決定的な政策ガイダンスとして機能することを意図したものではありません。
代わりに、政策開発のためのソーシャルシミュレーションを調べるための行動の呼びかけとして機能します。
要約(オリジナル)
Can we simulate a sandbox society with generative agents to model human behavior, thereby reducing the over-reliance on real human trials for assessing public policies? In this work, we investigate the feasibility of simulating health-related decision-making, using vaccine hesitancy, defined as the delay in acceptance or refusal of vaccines despite the availability of vaccination services (MacDonald, 2015), as a case study. To this end, we introduce the VacSim framework with 100 generative agents powered by Large Language Models (LLMs). VacSim simulates vaccine policy outcomes with the following steps: 1) instantiate a population of agents with demographics based on census data; 2) connect the agents via a social network and model vaccine attitudes as a function of social dynamics and disease-related information; 3) design and evaluate various public health interventions aimed at mitigating vaccine hesitancy. To align with real-world results, we also introduce simulation warmup and attitude modulation to adjust agents’ attitudes. We propose a series of evaluations to assess the reliability of various LLM simulations. Experiments indicate that models like Llama and Qwen can simulate aspects of human behavior but also highlight real-world alignment challenges, such as inconsistent responses with demographic profiles. This early exploration of LLM-driven simulations is not meant to serve as definitive policy guidance; instead, it serves as a call for action to examine social simulation for policy development.
arxiv情報
著者 | Abe Bohan Hou,Hongru Du,Yichen Wang,Jingyu Zhang,Zixiao Wang,Paul Pu Liang,Daniel Khashabi,Lauren Gardner,Tianxing He |
発行日 | 2025-04-02 15:30:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google