要約
大規模な言語モデル(LLM)には自然言語処理が大幅に進歩していますが、それらを人間の好みに合わせて調整することは依然としてオープンな課題です。
現在のアラインメント方法は主に明示的なフィードバックに依存していますが、アイトラッキング(ET)データは、読書中のリアルタイムの認知処理に関する洞察を提供します。
このホワイトペーパーでは、OASST1データセットからのLLM生成された応答を評価しながら、24人の参加者から読み取りパターンをキャプチャする新しい目追跡コーパスであるOasst-ETCを紹介します。
私たちの分析では、優先される応答と非優先応答の間の明確な読み取りパターンが明らかになり、合成の視線追跡データと比較されます。
さらに、さまざまな変圧器ベースのモデルからの人間の読解尺度と注意パターンとの相関関係を調べ、好みの応答のより強い相関を発見します。
この作業は、LLM評価で人間の認知処理を研究するためのユニークなリソースを導入し、目を見張るようなデータを調整方法に組み込むための有望な方向を示唆しています。
データセットと分析コードは公開されています。
要約(オリジナル)
While Large Language Models (LLMs) have significantly advanced natural language processing, aligning them with human preferences remains an open challenge. Although current alignment methods rely primarily on explicit feedback, eye-tracking (ET) data offers insights into real-time cognitive processing during reading. In this paper, we present OASST-ETC, a novel eye-tracking corpus capturing reading patterns from 24 participants, while evaluating LLM-generated responses from the OASST1 dataset. Our analysis reveals distinct reading patterns between preferred and non-preferred responses, which we compare with synthetic eye-tracking data. Furthermore, we examine the correlation between human reading measures and attention patterns from various transformer-based models, discovering stronger correlations in preferred responses. This work introduces a unique resource for studying human cognitive processing in LLM evaluation and suggests promising directions for incorporating eye-tracking data into alignment methods. The dataset and analysis code are publicly available.
arxiv情報
著者 | Angela Lopez-Cardona,Sebastian Idesis,Miguel Barreda-Ángeles,Sergi Abadal,Ioannis Arapakis |
発行日 | 2025-03-26 13:24:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google