Implicit Personalization in Language Models: A Systematic Study

要約

暗黙的なパーソナライゼーション (IP) は、言語モデルが入力プロンプト内の暗黙的な手がかりからユーザーの背景を推測し、この推論に基づいて応答を調整する現象です。
これまでの研究ではこの問題のさまざまな事例に触れてきましたが、この動作を研究するための統一されたフレームワークがありません。
この研究では、厳密な数学的定式化、多視点の道徳推論フレームワーク、および一連のケーススタディを通じて知財を体系的に研究しています。
IP の理論的基礎は構造的因果モデルに依存しており、直接介入できないメディエーター変数の因果効果を推定するための新しい方法である間接介入を導入しています。
技術的なアプローチを超えて、知財が倫理的に適切かどうかを検討するために、道徳哲学の 3 つの学派に基づいた一連の道徳的推論原則も紹介します。
数学的および倫理的洞察の両方を備えた私たちは、知財問題のさまざまな性質を示す 3 つの多様なケーススタディを紹介し、将来の研究への推奨事項を提供します。
私たちのコードとデータは https://github.com/jiarui-liu/IP にあります。

要約(オリジナル)

Implicit Personalization (IP) is a phenomenon of language models inferring a user’s background from the implicit cues in the input prompts and tailoring the response based on this inference. While previous work has touched upon various instances of this problem, there lacks a unified framework to study this behavior. This work systematically studies IP through a rigorous mathematical formulation, a multi-perspective moral reasoning framework, and a set of case studies. Our theoretical foundation for IP relies on a structural causal model and introduces a novel method, indirect intervention, to estimate the causal effect of a mediator variable that cannot be directly intervened upon. Beyond the technical approach, we also introduce a set of moral reasoning principles based on three schools of moral philosophy to study when IP may or may not be ethically appropriate. Equipped with both mathematical and ethical insights, we present three diverse case studies illustrating the varied nature of the IP problem and offer recommendations for future research. Our code and data are at https://github.com/jiarui-liu/IP.

arxiv情報

著者 Zhijing Jin,Nils Heil,Jiarui Liu,Shehzaad Dhuliawala,Yahang Qi,Bernhard Schölkopf,Rada Mihalcea,Mrinmaya Sachan
発行日 2024-05-23 17:18:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG パーマリンク