要約
視覚データは、リモートセンシングから生態学まで、さまざまな科学的ワークフローで使用されています。
観測データの量が増加するにつれて、課題は正確な予測を行うだけでなく、それらの予測の根本的なメカニズムを理解することでもあります。
科学的ワークフローでは、データの洞察を提供することでより良い意思決定を可能にするため、優れた解釈が重要です。
このペーパーでは、ニューラルネットワークをインターリーブするプログラムを学習することにより、このような解釈可能な設計モデルを取得する自動方法を紹介します。
LLMSと進化を使用して科学プログラムを発見する)を提案します。これは、大規模な言語モデル(LLM)の常識と事前知識を活用して視覚データを説明するPythonプログラムを作成する進化的アルゴリズムを提案します。
さらに、2つの改善を提案します。プログラム批評家とプログラムの単純化により、優れたプログラムを統合するための方法をさらに改善します。
3つの異なる現実世界の問題について、弟子は以前の文献のない新しいタスクに関する最先端のプログラムを学びます。
たとえば、人口密度の推定に最も近い不安定なベースラインよりも35%低い誤差でプログラムを学ぶことができます。
要約(オリジナル)
Visual data is used in numerous different scientific workflows ranging from remote sensing to ecology. As the amount of observation data increases, the challenge is not just to make accurate predictions but also to understand the underlying mechanisms for those predictions. Good interpretation is important in scientific workflows, as it allows for better decision-making by providing insights into the data. This paper introduces an automatic way of obtaining such interpretable-by-design models, by learning programs that interleave neural networks. We propose DiSciPLE (Discovering Scientific Programs using LLMs and Evolution) an evolutionary algorithm that leverages common sense and prior knowledge of large language models (LLMs) to create Python programs explaining visual data. Additionally, we propose two improvements: a program critic and a program simplifier to improve our method further to synthesize good programs. On three different real-world problems, DiSciPLE learns state-of-the-art programs on novel tasks with no prior literature. For example, we can learn programs with 35% lower error than the closest non-interpretable baseline for population density estimation.
arxiv情報
著者 | Utkarsh Mall,Cheng Perng Phoo,Mia Chiquier,Bharath Hariharan,Kavita Bala,Carl Vondrick |
発行日 | 2025-02-14 10:26:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google