要約
人間の革新の特徴は、組換えのプロセスです。既存のメカニズムと概念の要素を統合することにより、オリジナルのアイデアを作成します。
この作業では、科学文献を自動的にマイニングし、キメラを構築します。再結合の例の大規模な知識ベース(KB)です。
キメラは、科学者がどのように概念を再結合し、さまざまな分野からインスピレーションを得るかを経験的に調査するために、または新しい創造的なクロスドメインの方向を予測することを学ぶ監督された機械学習モデルを訓練するために使用できます。
このKBを構築するために、科学論文の要約から組換えを抽出するという新しい情報抽出タスクを提示し、数百の手動で発表されたアブストラクトの高品質のコーパスを収集し、LLMベースの抽出モデルを訓練するためにそれを使用します。
このモデルは、AIドメイン内の大規模な紙のコーパスに適用され、28kを超える組換え例のKBが得られます。
キメラを分析して、AIの異なるサブレアの組換えの特性を探索します。
最後に、KBを使用して科学的仮説生成モデルを訓練します。これは、現実世界の研究者がインスピレーションを感じる新しい組換え方向を予測します。
データとコードは、https://github.com/noy-sternlicht/chimera-kbで入手できます
要約(オリジナル)
A hallmark of human innovation is the process of recombination — creating original ideas by integrating elements of existing mechanisms and concepts. In this work, we automatically mine the scientific literature and build CHIMERA: a large-scale knowledge base (KB) of recombination examples. CHIMERA can be used to empirically explore at scale how scientists recombine concepts and take inspiration from different areas, or to train supervised machine learning models that learn to predict new creative cross-domain directions. To build this KB, we present a novel information extraction task of extracting recombination from scientific paper abstracts, collect a high-quality corpus of hundreds of manually annotated abstracts, and use it to train an LLM-based extraction model. The model is applied to a large corpus of papers in the AI domain, yielding a KB of over 28K recombination examples. We analyze CHIMERA to explore the properties of recombination in different subareas of AI. Finally, we train a scientific hypothesis generation model using the KB, which predicts new recombination directions that real-world researchers find inspiring. Our data and code are available at https://github.com/noy-sternlicht/CHIMERA-KB
arxiv情報
| 著者 | Noy Sternlicht,Tom Hope |
| 発行日 | 2025-06-05 15:20:59+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google