
Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback

要約 GPT-4 などの財団モデルは、犯罪の幇助や人種差別的なテキストの作成など

カテゴリー: 68T01, 68T50, 91B12, 91B14, cs.AI, cs.CL, cs.CY, cs.GT, cs.LG, I.2.0

Learning to Manipulate under Limited Information

要約 社会的選択理論の古典的な結果によれば、合理的な優先投票方法は、個人に不誠実

カテゴリー: 68T07, 91B10, 91B12, 91B14, cs.AI, cs.GT, cs.LG, cs.MA, econ.TH, I.2.11