The Only Way is Ethics: A Guide to Ethical Research with Large Language Models

要約

大規模言語モデル (LLM) の倫理的考慮事項を検討する多くの研究が行われています。パフォーマンスと害を測定するためのツールの批判。
アイデア出しを支援するツールキットを提案する。
労働者に対するリスクについて話し合う。
プライバシーやセキュリティなどに関する法律の検討。LLM に焦点を当てた単一の実践的なガイドにこれらのリソースを統合する作業はまだありません。
私たちはこの野心的な目標に挑戦します。
私たちは、NLP 実践者や他者の研究の倫理的影響を評価する任務を負った人々向けのオープンで生きたリソースとして提供する「LLM 倫理ホワイトペーパー」を紹介します。
私たちの目標は、倫理に関する文献を、コンピュータ科学者を対象とした、明確な最初のステップを備えた思考のための具体的な推奨事項や挑発に翻訳することです。
「LLM 倫理白書」では、徹底的な文献レビューを明確な「すべきこと」と「してはいけないこと」にまとめており、この文書でもそれを紹介します。
同様に、倫理的な取り組みをサポートする便利なツールキットも特定します。
興味のある読者には LLM 倫理白書全文を参照していただくようご案内します。この白書では、プロジェクトのライフサイクルの各段階における倫理的考慮事項についての簡潔な説明と、推奨事項の元になった数百の論文の引用が提供されています。
この文書は、LLM を使用して倫理研究を実施するためのポケット ガイドと考えることができます。

要約(オリジナル)

There is a significant body of work looking at the ethical considerations of large language models (LLMs): critiquing tools to measure performance and harms; proposing toolkits to aid in ideation; discussing the risks to workers; considering legislation around privacy and security etc. As yet there is no work that integrates these resources into a single practical guide that focuses on LLMs; we attempt this ambitious goal. We introduce ‘LLM Ethics Whitepaper’, which we provide as an open and living resource for NLP practitioners, and those tasked with evaluating the ethical implications of others’ work. Our goal is to translate ethics literature into concrete recommendations and provocations for thinking with clear first steps, aimed at computer scientists. ‘LLM Ethics Whitepaper’ distils a thorough literature review into clear Do’s and Don’ts, which we present also in this paper. We likewise identify useful toolkits to support ethical work. We refer the interested reader to the full LLM Ethics Whitepaper, which provides a succinct discussion of ethical considerations at each stage in a project lifecycle, as well as citations for the hundreds of papers from which we drew our recommendations. The present paper can be thought of as a pocket guide to conducting ethical research with LLMs.

arxiv情報

著者 Eddie L. Ungless,Nikolas Vitsakis,Zeerak Talat,James Garforth,Björn Ross,Arno Onken,Atoosa Kasirzadeh,Alexandra Birch
発行日 2024-12-20 16:14:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク