Should agentic conversational AI change how we think about ethics? Characterising an interactional ethics centred on respect

要約

大規模言語モデル (LLM) に基づく会話エージェントの人気が高まっているため、エージェントの動作が倫理的かつ適切であることを確認する必要があります。
この分野の作業は主に「HHH」基準を中心に行っています。つまり、出力をより有益かつ正直なものにし、有害な(偏見のある、有毒な、または不正確な)記述を避けます。
この意味論的な焦点は、LLM エージェントを単なる媒体または出力生成システムとして見る場合には役立ちますが、さまざまな社会的状況において、同じ発話行為が多かれ少なかれ無粋または無思慮に見える可能性がある実用的な要因を説明できません。
エージェント AI への推進により、システムがますます積極的に目標を追求し、世界中でアクションを実行するようになるため、インタラクションの実用論を考慮することが不可欠になります。
私たちは、関係的および状況的要因を中心とした倫理への相互作用的アプローチを提案します。
私たちは、社会的アクターとしてのシステムが(一連の)相互作用において個人を敬意を持って扱うことが何を意味するのかを探ります。
私たちの研究は、状況に応じた社会的相互作用のレベルで、ほとんど未調査の一連のリスクを予測し、エージェント LLM テクノロジーが人々を適切に扱うのに役立つ実用的な提案を提供します。

要約(オリジナル)

With the growing popularity of conversational agents based on large language models (LLMs), we need to ensure their behaviour is ethical and appropriate. Work in this area largely centres around the ‘HHH’ criteria: making outputs more helpful and honest, and avoiding harmful (biased, toxic, or inaccurate) statements. Whilst this semantic focus is useful when viewing LLM agents as mere mediums or output-generating systems, it fails to account for pragmatic factors that can make the same speech act seem more or less tactless or inconsiderate in different social situations. With the push towards agentic AI, wherein systems become increasingly proactive in chasing goals and performing actions in the world, considering the pragmatics of interaction becomes essential. We propose an interactional approach to ethics that is centred on relational and situational factors. We explore what it means for a system, as a social actor, to treat an individual respectfully in a (series of) interaction(s). Our work anticipates a set of largely unexplored risks at the level of situated social interaction, and offers practical suggestions to help agentic LLM technologies treat people well.

arxiv情報

著者 Lize Alberts,Geoff Keeling,Amanda McCroskery
発行日 2024-05-16 09:53:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T42, cs.AI, cs.CL, cs.HC, H.5.2 パーマリンク