ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making

要約

人工知能(AI)の最近の進歩にもかかわらず、トレーニングデータセットでは考慮されていないタスクでパーソナライズされた意思決定を確保することは課題をもたらします。
この問題に対処するために、データセット生成ツールキットDGTと生成されたデータでトレーニングされた意思決定モジュールDMMを含む2フェーズバリュー駆動型の意思決定フレームワークであるValuePilotを提案します。
DGTは、値の寸法に基づいてシナリオを生成し、自動化されたフィルタリング手法と人間のキュレーションを使用して、データセットの有効性を確保するための人間のキュレーションを備えたシナリオを生成できます。
生成されたデータセットでは、DMMはシナリオの固有の値を認識し、アクションの実現可能性を計算し、複数の値ディメンション間のトレードオフをナビゲートしてパーソナライズされた決定を下すことを学びます。
広範な実験は、人間の価値の好みを考えると、DMMが人間の決定と最も密接に整合し、Claude-3.5-Sonnet、Gemini-2-Flash、llama-3.1-405b、およびGPT-4oを上回ることを示しています。
この研究は、価値駆動型の意思決定の予備的な調査です。
私たちは、コミュニティ内での価値主導の意思決定とパーソナライズされた意思決定への関心を刺激することを願っています。

要約(オリジナル)

Despite recent advances in artificial intelligence (AI), it poses challenges to ensure personalized decision-making in tasks that are not considered in training datasets. To address this issue, we propose ValuePilot, a two-phase value-driven decision-making framework comprising a dataset generation toolkit DGT and a decision-making module DMM trained on the generated data. DGT is capable of generating scenarios based on value dimensions and closely mirroring real-world tasks, with automated filtering techniques and human curation to ensure the validity of the dataset. In the generated dataset, DMM learns to recognize the inherent values of scenarios, computes action feasibility and navigates the trade-offs between multiple value dimensions to make personalized decisions. Extensive experiments demonstrate that, given human value preferences, our DMM most closely aligns with human decisions, outperforming Claude-3.5-Sonnet, Gemini-2-flash, Llama-3.1-405b and GPT-4o. This research is a preliminary exploration of value-driven decision-making. We hope it will stimulate interest in value-driven decision-making and personalized decision-making within the community.

arxiv情報

著者 Yitong Luo,Hou Hei Lam,Ziang Chen,Zhenliang Zhang,Xue Feng
発行日 2025-03-06 16:02:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク