Fine-tuning LLMs for Autonomous Spacecraft Control: A Case Study Using Kerbal Space Program

要約

最近のトレンドは、ユーザーのテキスト プロンプトの内容に基づいてアクションを実行する自律エージェントとして大規模言語モデル (LLM) を使用することです。
この研究では、Kerbal Space Program Differential Games suite (KSPDG) をテスト環境として使用し、自律宇宙船制御のための微調整された Large Language Model (LLM) の使用を検討します。
従来の強化学習 (RL) アプローチは、シミュレーション機能とデータが不十分であるため、この領域では限界に直面しています。
LLM、特に GPT-3.5 や LLaMA などの微調整モデルを活用することで、これらのモデルが言語ベースの入出力を使用して宇宙船を効果的に制御できる方法を実証します。
私たちのアプローチでは、リアルタイムのミッション テレメトリーを LLM によって処理されるテキスト プロンプトに統合し、エージェントを介して制御アクションを生成します。
この結果は、LLM がテキスト関連のタスクでの名目上の用途を超えて宇宙操作に使用できる可能性についての議論のきっかけとなります。
今後の作業は、この方法論を他の空間制御タスクに拡張し、さまざまな LLM ファミリのパフォーマンスを評価することを目的としています。
コードは次の URL で入手できます: \texttt{https://github.com/ARCLab-MIT/kspdg}。

要約(オリジナル)

Recent trends are emerging in the use of Large Language Models (LLMs) as autonomous agents that take actions based on the content of the user text prompt. This study explores the use of fine-tuned Large Language Models (LLMs) for autonomous spacecraft control, using the Kerbal Space Program Differential Games suite (KSPDG) as a testing environment. Traditional Reinforcement Learning (RL) approaches face limitations in this domain due to insufficient simulation capabilities and data. By leveraging LLMs, specifically fine-tuning models like GPT-3.5 and LLaMA, we demonstrate how these models can effectively control spacecraft using language-based inputs and outputs. Our approach integrates real-time mission telemetry into textual prompts processed by the LLM, which then generate control actions via an agent. The results open a discussion about the potential of LLMs for space operations beyond their nominal use for text-related tasks. Future work aims to expand this methodology to other space control tasks and evaluate the performance of different LLM families. The code is available at this URL: \texttt{https://github.com/ARCLab-MIT/kspdg}.

arxiv情報

著者 Alejandro Carrasco,Victor Rodriguez-Fernandez,Richard Linares
発行日 2024-08-16 11:43:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: astro-ph.IM, cs.AI パーマリンク