要約
私たちは、ドメインスペシャリストへの科学アシスタントとして機能する可能性のあるソフトウェアの構築に興味があります。
緊急のソリューションを必要とする複雑な問題に対処する方法の特定を加速するために、そのようなアシスタントが必要になると予想されます。
この論文では、私たちの焦点は特定の科学的問題ではなく、そのような「科学アクセラレータ」のソフトウェアエンジニアリングにあります。
「コードなし」のテクニックの最近の開発は、科学者が単に大規模な言語モデル(LLM)と会話するだけでソリューションを単純に仮定できることを示唆しているように思われます。
ただし、複雑な科学的問題については、LLMテクノロジーの現在の状態を考えると、これはありそうにないようです。
実行可能と思われるのは、ソフトウェアエンジニアがLLMSを使用して、自然言語で表明された専門家の要件を含む、ドメイン専門家が使用するプログラムを迅速に構築できることです。
ソフトウェアエンジニアとLLMが科学データ分析のために「アシスタント」を協力して構築する「構造化された」誘導プログラミングのインタラクティブな形式の設計を提案します。
このペーパーでは、ソフトウェアエンジニアとLLMの間の相互作用を実装するために「2ウェイイテラスビリティ」プロトコルを適応させるIstrucindと呼ばれる簡単な実装について説明しています。
2つの異なる非自明の科学データ分析タスクでツールをテストします。
具体的には、ISTrucindによって構築されたシステムを、手動で構築されたシステムと、次の寸法に沿った低コード/コードなしのメソッドによって構築されたシステムを比較します。(a)プログラムパフォーマンス。
(b)プログラムの品質。
(c)プログラミングの取り組み。
結果は、ISTRUCINDにより、ソフトウェアエンジニアがより良いプログラムを開発できるようになり、インタラクティブな構造化された誘導が科学アシスタントの迅速な構築に有用な役割を果たすことを示唆しています。
要約(オリジナル)
We are interested in the construction of software that can act as scientific assistants to domain specialists. It is expected that such assistants will be needed to accelerate the identification of ways to address complex problems requiring urgent solutions. In this paper, our focus is not on a specific scientific problem, but on the software-engineering of such ‘science accelerators’. Recent developments in ‘No Code’ techniques would seem to suggest that scientist can simply hypothesise solutions simply by conversing with a large language model (LLM). However, for complex scientific problems, this seems unlikely given the current state of LLM technology. What does appear feasible is that a software engineer can use LLMs to rapidly construct programs for use by a domain-specialist, including the specialist’s requirements expressed in natural language. We propose the design of an interactive form of ‘structured’ inductive programming in which a software-engineer and an LLM collaboratively construct an ‘assistant’ for a scientific data analysis. The paper describes a simple implementation called iStrucInd that adapts a ‘2-way Intelligibility’ protocol to implement the interaction between the software engineer and the LLM. We test the tool on two different non-trivial scientific data analysis tasks. Specifically, we compare the system constructed by iStrucInd against systems constructed manually and by Low Code/No Code methods along dimensions of: (a) program performance; (b) program quality; and (c) programming effort. The results show iStrucInd allows a software engineer to develop better programs faster suggesting interactive structured induction can play a useful role in the rapid construction of scientific assistants.
arxiv情報
著者 | Shraddha Surana,Ashwin Srinivasan |
発行日 | 2025-03-18 17:57:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google