Whose Opinions Do Language Models Reflect?

要約

言語モデル (LM) は、主観的なクエリに応答して LM によって反映される意見が、ユーザーの満足度だけでなく、社会全体の見方を形作ることの両方に大きな影響を与える可能性がある、オープンエンドのコンテキストでますます使用されています。
この作業では、高品質の世論調査とそれに関連する人間の反応を活用して、LM によって反映された意見を調査するための定量的フレームワークを提示しました。
このフレームワークを使用して、OpinionsQA を作成します。これは、妊娠中絶から自動化に至るまでのトピックについて、LM の意見と米国の 60 の人口統計グループの意見との整合性を評価するための新しいデータセットです。
トピック全体で、現在のLMが反映している見解と米国の人口統計グループの見解との間にはかなりの不一致が見られます.気候変動に関する民主党と共和党の分裂と同等です.
特に、この不整合は、LM を特定の人口統計グループに明示的に誘導した後でも持続します。
私たちの分析は、人間のフィードバックで調整された一部の LM の左寄りの傾向に関する以前の観察を確認するだけでなく、現在の LM では意見が十分に反映されていないグループ (65 歳以上や未亡人など) も明らかにしました。
私たちのコードとデータは、https://github.com/tatsu-lab/opinions_qa で入手できます。

要約(オリジナル)

Language models (LMs) are increasingly being used in open-ended contexts, where the opinions reflected by LMs in response to subjective queries can have a profound impact, both on user satisfaction, as well as shaping the views of society at large. In this work, we put forth a quantitative framework to investigate the opinions reflected by LMs — by leveraging high-quality public opinion polls and their associated human responses. Using this framework, we create OpinionsQA, a new dataset for evaluating the alignment of LM opinions with those of 60 US demographic groups over topics ranging from abortion to automation. Across topics, we find substantial misalignment between the views reflected by current LMs and those of US demographic groups: on par with the Democrat-Republican divide on climate change. Notably, this misalignment persists even after explicitly steering the LMs towards particular demographic groups. Our analysis not only confirms prior observations about the left-leaning tendencies of some human feedback-tuned LMs, but also surfaces groups whose opinions are poorly reflected by current LMs (e.g., 65+ and widowed individuals). Our code and data are available at https://github.com/tatsu-lab/opinions_qa.

arxiv情報

著者 Shibani Santurkar,Esin Durmus,Faisal Ladhak,Cinoo Lee,Percy Liang,Tatsunori Hashimoto
発行日 2023-03-30 17:17:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG パーマリンク