Galactic ChitChat: Using Large Language Models to Converse with Astronomy Literature


私たちは、最先端の OpenAI GPT-4 大規模言語モデルが、コンテキスト内プロンプトを使用して天文学論文と有意義な対話を行う可能性を実証します。
効率を最適化するために、段落構造と全体的な意味上の整合性を維持しながら、元の入力用紙のサイズを効果的に 50\% 縮小する蒸留技術を採用しています。
次に、マルチドキュメント コンテキスト (抽出された 10 個のドキュメント) を使用してモデルの応答を調査します。
私たちの調査結果は、GPT-4 がマルチドキュメント領域で優れており、関連する研究結果の枠組みの中で文脈に沿った詳細な回答を提供することを示しています。


We demonstrate the potential of the state-of-the-art OpenAI GPT-4 large language model to engage in meaningful interactions with Astronomy papers using in-context prompting. To optimize for efficiency, we employ a distillation technique that effectively reduces the size of the original input paper by 50\%, while maintaining the paragraph structure and overall semantic integrity. We then explore the model’s responses using a multi-document context (ten distilled documents). Our findings indicate that GPT-4 excels in the multi-document domain, providing detailed answers contextualized within the framework of related research findings. Our results showcase the potential of large language models for the astronomical community, offering a promising avenue for further exploration, particularly the possibility of utilizing the models for hypothesis generation.


著者 Ioana Ciucă,Yuan-Sen Ting
発行日 2023-09-12 00:42:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: astro-ph.GA, astro-ph.IM, cs.CL パーマリンク