Chronocept: Instilling a Sense of Time in Machines

要約

人間の認知は、クロノ受容として知られる時間感と深く絡み合っています。
この感覚により、事実がどのくらいの期間有効であり、知識が時代遅れになったかを判断することができます。
視覚、言語、運動制御の進歩にもかかわらず、AIは依然として時間的妥当性について推論するのに苦労しています。
Chronoceptを紹介します。Chronoceptは、時間の経過に伴う連続確率分布として時間的妥当性をモデル化する最初のベンチマークです。
半分に分解された側頭軸に沿って取り付けられたスキューノーマル曲線を使用して、Chronoceptは出現、崩壊、およびピークの関連性の微妙なパターンをキャプチャします。
ベンチマークI(アトミックファクト)とベンチマークII(マルチセンテンスパッセージ)の2つのデータセットが含まれています。
注釈は、強力なアノテーター間協定を示しています(84%および89%)。
私たちのベースラインは、曲線パラメーターを予測します – 場所、スケール、歪度 – 解釈可能で一般化可能な学習とアウトパフォーマンスの分類ベースのアプローチを可能にします。
Chronoceptは、AIの時間的推論の基礎的ギャップを埋め、知識の基礎、事実確認、検索された生成(RAG)、および積極的なエージェントのアプリケーションをサポートします。
コードとデータは公開されています。

要約(オリジナル)

Human cognition is deeply intertwined with a sense of time, known as Chronoception. This sense allows us to judge how long facts remain valid and when knowledge becomes outdated. Despite progress in vision, language, and motor control, AI still struggles to reason about temporal validity. We introduce Chronocept, the first benchmark to model temporal validity as a continuous probability distribution over time. Using skew-normal curves fitted along semantically decomposed temporal axes, Chronocept captures nuanced patterns of emergence, decay, and peak relevance. It includes two datasets: Benchmark I (atomic facts) and Benchmark II (multi-sentence passages). Annotations show strong inter-annotator agreement (84% and 89%). Our baselines predict curve parameters – location, scale, and skewness – enabling interpretable, generalizable learning and outperforming classification-based approaches. Chronocept fills a foundational gap in AI’s temporal reasoning, supporting applications in knowledge grounding, fact-checking, retrieval-augmented generation (RAG), and proactive agents. Code and data are publicly available.

arxiv情報

著者 Krish Goel,Sanskar Pandey,KS Mahadevan,Harsh Kumar,Vishesh Khadaria
発行日 2025-05-12 15:07:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク