Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering

要約

著者プロファイリングは、個人が共有するコンテンツを分析することによって、個人の特徴を推測するタスクです。
自然言語理解タスクに対処するために大規模な言語モデルを促すことが普及しているにもかかわらず、教師あり機械学習は依然としてこのタスクを実行する自動システムの主流を占めています。
理由の 1 つは、分類インスタンスが大量の投稿 (潜在的にユーザー プロファイル全体) で構成されており、Transformer の入力長を超える可能性があるためです。
モデルが大きなコンテキスト ウィンドウを使用できる場合でも、ポスト全体により、API アクセスのブラック ボックス システムのアプリケーションはコストがかかり、遅くなり、そのような「干し草の中の針」タスクに伴う問題も発生します。
この制限を軽減するために、最初に関連コンテンツと無関係なコンテンツを区別し、次に関連データのみを使用して実際のユーザー プロファイリングを行うことを目的とした、作成者プロファイリングの新しい方法を提案します。
関連性の注釈が付けられたデータの必要性を回避するために、大規模な言語モデルのゼロショット機能を利用する報酬関数を使用した強化学習によって、この関連性フィルターを最適化します。
2 つの Twitter コーパスでビッグ 5 性格特性を予測する方法を評価します。
偏ったラベル分布を持つ公開されている実世界のデータでは、私たちの方法は、ユーザー プロファイル内のすべての投稿を使用する場合と同様の有効性を示しますが、コンテキストは大幅に短くなります。
これらのデータを人工的な投稿とバランスをとったバージョンで評価すると、関連する投稿をフィルタリングすることで予測の精度が大幅に向上することがわかります。

要約(オリジナル)

Author profiling is the task of inferring characteristics about individuals by analyzing content they share. Supervised machine learning still dominates automatic systems that perform this task, despite the popularity of prompting large language models to address natural language understanding tasks. One reason is that the classification instances consist of large amounts of posts, potentially a whole user profile, which may exceed the input length of Transformers. Even if a model can use a large context window, the entirety of posts makes the application of API-accessed black box systems costly and slow, next to issues which come with such ‘needle-in-the-haystack’ tasks. To mitigate this limitation, we propose a new method for author profiling which aims at distinguishing relevant from irrelevant content first, followed by the actual user profiling only with relevant data. To circumvent the need for relevance-annotated data, we optimize this relevance filter via reinforcement learning with a reward function that utilizes the zero-shot capabilities of large language models. We evaluate our method for Big Five personality trait prediction on two Twitter corpora. On publicly available real-world data with a skewed label distribution, our method shows similar efficacy to using all posts in a user profile, but with a substantially shorter context. An evaluation on a version of these data balanced with artificial posts shows that the filtering to relevant posts leads to a significantly improved accuracy of the predictions.

arxiv情報

著者 Jan Hofmann,Cornelia Sindermann,Roman Klinger
発行日 2024-09-06 08:43:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク