要約
予測は、多くのドメインにわたる意思決定における重要なタスクです。
履歴数値データは開始を提供しますが、信頼できる正確な予測の完全なコンテキストを伝えることができません。
人間の予測者は、自然言語を通じて効率的に伝達できる背景知識や制約などの追加情報に頻繁に依存しています。
ただし、LLMベースの予測者との最近の進歩にもかかわらず、このテキスト情報を効果的に統合する能力は未解決の問題のままです。
これに対処するために、「コンテキストはキー」(CIK)を紹介します。これは、数値データを多様なタイプの慎重に作成したテキストコンテキストとペアにする時系列予測ベンチマークであり、モデルが両方のモダリティを統合する必要があります。
重要なことに、CIKのすべてのタスクは、テキストコンテキストを正常に解決するために理解する必要があります。
統計モデル、時系列基礎モデル、LLMベースの予測者など、さまざまなアプローチを評価し、ベンチマークで他のすべてのテストされた方法を上回るシンプルで効果的なLLMプロンプト方法を提案します。
私たちの実験は、コンテキスト情報を組み込むことの重要性を強調し、LLMベースの予測モデルを使用する際の驚くべきパフォーマンスを示し、それらの重要な欠点のいくつかを明らかにします。
このベンチマークは、さまざまな技術的専門知識を持つ意思決定者が正確でアクセスしやすいモデルを促進することにより、マルチモーダル予測を進めることを目的としています。
ベンチマークは、https://servicenow.github.io/context-is-key-forecasting/v0/で視覚化できます。
要約(オリジナル)
Forecasting is a critical task in decision-making across numerous domains. While historical numerical data provide a start, they fail to convey the complete context for reliable and accurate predictions. Human forecasters frequently rely on additional information, such as background knowledge and constraints, which can efficiently be communicated through natural language. However, in spite of recent progress with LLM-based forecasters, their ability to effectively integrate this textual information remains an open question. To address this, we introduce ‘Context is Key’ (CiK), a time-series forecasting benchmark that pairs numerical data with diverse types of carefully crafted textual context, requiring models to integrate both modalities; crucially, every task in CiK requires understanding textual context to be solved successfully. We evaluate a range of approaches, including statistical models, time series foundation models, and LLM-based forecasters, and propose a simple yet effective LLM prompting method that outperforms all other tested methods on our benchmark. Our experiments highlight the importance of incorporating contextual information, demonstrate surprising performance when using LLM-based forecasting models, and also reveal some of their critical shortcomings. This benchmark aims to advance multimodal forecasting by promoting models that are both accurate and accessible to decision-makers with varied technical expertise. The benchmark can be visualized at https://servicenow.github.io/context-is-key-forecasting/v0/.
arxiv情報
著者 | Andrew Robert Williams,Arjun Ashok,Étienne Marcotte,Valentina Zantedeschi,Jithendaraa Subramanian,Roland Riachi,James Requeima,Alexandre Lacoste,Irina Rish,Nicolas Chapados,Alexandre Drouin |
発行日 | 2025-06-05 17:25:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google