要約
効果的な言語使用の特徴は一貫性にあります – 同様の文脈で同様の意味を表現し、矛盾を回避します。
人間のコミュニケーションは自然にこの原則を示していますが、最先端の言語モデルは、さまざまなシナリオにわたって信頼できる一貫性を維持するのに苦労しています。
このペーパーでは、AI言語システムにおける一貫性研究の状況を調べ、正式な一貫性(論理ルールの順守を含む)と非公式の一貫性(道徳的および事実の一貫性など)の両方を調査します。
一貫性の側面を測定するための現在のアプローチを分析し、定義の標準化、多言語評価、および一貫性を改善する方法の重要な研究ギャップを特定します。
私たちの調査結果は、ユーティリティと適応性を維持しながら、ドメイン固有のタスクでの言語モデルの適用の一貫性を確保するために、学際的なアプローチを測定して学際的なアプローチを測定するための緊急の必要性を指摘しています。
要約(オリジナル)
The hallmark of effective language use lies in consistency — expressing similar meanings in similar contexts and avoiding contradictions. While human communication naturally demonstrates this principle, state-of-the-art language models struggle to maintain reliable consistency across different scenarios. This paper examines the landscape of consistency research in AI language systems, exploring both formal consistency (including logical rule adherence) and informal consistency (such as moral and factual coherence). We analyze current approaches to measure aspects of consistency, identify critical research gaps in standardization of definitions, multilingual assessment, and methods to improve consistency. Our findings point to an urgent need for robust benchmarks to measure and interdisciplinary approaches to ensure consistency in the application of language models on domain-specific tasks while preserving the utility and adaptability.
arxiv情報
著者 | Jekaterina Novikova,Carol Anderson,Borhane Blili-Hamelin,Subhabrata Majumdar |
発行日 | 2025-05-01 03:25:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google