Structural Embeddings of Tools for Large Language Models

要約

大規模言語モデル (LLM) の現状では、外部ツールの組み込みが必要であることは明らかです。
単純な代数的および論理的推論が欠けていることは十分に文書化されており、研究者は LLM が外部ツールを介して動作できるようにするフレームワークを開発するようになりました。
特定のタスクに対するツール利用のオントロジー的性質は、有向非巡回グラフ (DAG) を使用して適切に定式化できます。
この論文の主な目的は、近い将来の LLM ツールの相互作用に対するグラフベースのアプローチの重要性を強調することです。
我々は、LLM を使用して指数関数的に増加する外部ツールのオーケストレーションをガイドするための例示的なフレームワークを提案します。ここでは、ツールの目的と機能が階層的にグラフ化されています。
ここで定義されているように、思考連鎖 (CoT) のテキスト セグメントがツールとして想像できると仮定すると、グラフ ベースのフレームワークは、その特定の方向に新しい道を開くこともできます。

要約(オリジナル)

It is evident that the current state of Large Language Models (LLMs) necessitates the incorporation of external tools. The lack of straightforward algebraic and logical reasoning is well documented and prompted researchers to develop frameworks which allow LLMs to operate via external tools. The ontological nature of tool utilization for a specific task can be well formulated with a Directed Acyclic Graph (DAG). The central aim of the paper is to highlight the importance of graph based approaches to LLM-tool interaction in near future. We propose an exemplary framework to guide the orchestration of exponentially increasing numbers of external tools with LLMs,where objectives and functionalities of tools are graph encoded hierarchically. Assuming that textual segments of a Chain-of-Thought (CoT) can be imagined as a tool as defined here, the graph based framework can pave new avenues in that particular direction as well.

arxiv情報

著者 Eren Unlu
発行日 2023-08-01 10:46:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク