要約
言語は思考を伝達する手段として機能し、個人間のコミュニケーションを可能にします。
多様な概念を区別し、公平性と不正義を識別し、さまざまな法的概念を理解する能力は、基本的に論理的推論に依存しています。
大規模言語モデル (LLM) は人間の言語の理解と生成をエミュレートしようとしますが、論理的推論における能力は依然として限定的です。
この論文は、言語と論理の複雑な関係についての深い理解を維持しながら、LLM に論理的推論を効果的に教えるにはどうすればよいかという哲学的な問題に対処することを目指しています。
私たちは、論理的推論における LLM の能力の強化に焦点を当てることで、法律やその他の論理集約的な分野における LLM の適用可能性を拡大することを目指しています。
この目的を達成するために、我々は、LLM の推論能力を向上させるための潜在的なフレームワークとして機能する、論理フィードバックからの強化学習 (RLLF) アプローチを提案します。
RLLF と改訂された評価方法論を通じて、私たちはこの分野の研究の新しい道を模索し、言語と論理の基本的な関係を認識しながら、複雑な法的推論タスクを処理できる LLM の開発に貢献します。
要約(オリジナル)
Language serves as a vehicle for conveying thought, enabling communication among individuals. The ability to distinguish between diverse concepts, identify fairness and injustice, and comprehend a range of legal notions fundamentally relies on logical reasoning. Large Language Models (LLMs) attempt to emulate human language understanding and generation, but their competency in logical reasoning remains limited. This paper seeks to address the philosophical question: How can we effectively teach logical reasoning to LLMs while maintaining a deep understanding of the intricate relationship between language and logic? By focusing on bolstering LLMs’ capabilities in logical reasoning, we aim to expand their applicability in law and other logic-intensive disciplines. To this end, we propose a Reinforcement Learning from Logical Feedback (RLLF) approach, which serves as a potential framework for refining LLMs’ reasoning capacities. Through RLLF and a revised evaluation methodology, we explore new avenues for research in this domain and contribute to the development of LLMs capable of handling complex legal reasoning tasks while acknowledging the fundamental connection between language and logic.
arxiv情報
著者 | Ha-Thanh Nguyen,Wachara Fungwacharakorn,Ken Satoh |
発行日 | 2023-11-22 01:51:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google