近年、ラージ言語モデル (LLM) は人工知能 (AI) の革新的な開発として登場し、産業界と学術界から大きな注目を集めています。
膨大なデータセットでトレーニングされたこれらの洗練された AI システムは、優れた自然言語処理機能とコンテンツ生成機能を発揮します。
このペーパーでは、米国に焦点を当てて、個人金融における主要な課題に対処するための LLM の可能性を探ります。
OpenAI の ChatGPT、Google の Gemini、Anthropic の Claude、Meta の Llama など、いくつかの主要な LLM を評価して、住宅ローン、税金、ローン、投資などのトピックに関する正確な財務アドバイスを提供する際の有効性を評価します。
私たちの調査結果によると、これらのモデルは平均約 70% の精度を達成していますが、特定の領域では顕著な制限も示しています。
具体的には、LLM は複雑な財務クエリに対して正確な応答を提供するのに苦労しており、パフォーマンスはトピックごとに大きく異なります。
これらの AI システムが進化し続けるにつれて、個人金融における AI 主導のアプリケーションを進歩させる可能性がますます期待できます。
In recent years, Large Language Models (LLMs) have emerged as a transformative development in artificial intelligence (AI), drawing significant attention from industry and academia. Trained on vast datasets, these sophisticated AI systems exhibit impressive natural language processing and content generation capabilities. This paper explores the potential of LLMs to address key challenges in personal finance, focusing on the United States. We evaluate several leading LLMs, including OpenAI’s ChatGPT, Google’s Gemini, Anthropic’s Claude, and Meta’s Llama, to assess their effectiveness in providing accurate financial advice on topics such as mortgages, taxes, loans, and investments. Our findings show that while these models achieve an average accuracy rate of approximately 70%, they also display notable limitations in certain areas. Specifically, LLMs struggle to provide accurate responses for complex financial queries, with performance varying significantly across different topics. Despite these limitations, the analysis reveals notable improvements in newer versions of these models, highlighting their growing utility for individuals and financial advisors. As these AI systems continue to evolve, their potential for advancing AI-driven applications in personal finance becomes increasingly promising.
著者 | Oudom Hean,Utsha Saha,Binita Saha |
発行日 | 2024-12-27 18:25:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google