要約
馴染みのないシナリオでのヒューマノイドロボットの静的な事前セットの「思考計画アクション」と、自律コーディング機能がないために高度にプログラムされた「コールツールリターン結果」の間のギャップに対処するために、この作業は連続思考マシン(CTM)とモデルコンテキストプロトコル(MCP)を接続する動的アーキテクチャを設計します。
Tick-Slabを介した理論的並列ソリューションを提案し、ランク圧縮を使用してパラメーター抑制を実現し、自律的なコーディングのために自律的なアクションを達成するためのソリューションを提供します。
研究者は、OpenAIのO4-Mini-Highを使用して実験環境を構築するツールとして使用してシミュレーションベースの実験を使用し、拡張SayCanデータセットを導入して9つのエポックの実験を実施しました。
実験結果は、CTM-MCPアーキテクチャが7つのメトリックのデータ結果(TSR)、実行成功率(ESR)、平均エピソード長(AEL)、ROSCOE、公開、習熟度自己評価(PSA)、タスク効果(TE)のデータ結果を通じて実行可能かつ効果的であることを示しています。
実際には、人間のような自律行動を達成するための継続的な思考に基づいて、ヒューマノイドロボットの自律的な動的コーディングを探索するための参照エクスペリエンスを提供します。
要約(オリジナル)
To address the gaps between the static pre-set ‘thinking-planning-action’ of humanoid robots in unfamiliar scenarios and the highly programmed ‘call tool-return result’ due to the lack of autonomous coding capabilities, this work designs a dynamic architecture connecting continuous thought machines (CTM) and model context protocol (MCP). It proposes a theoretical parallel solution through tick-slab and uses rank compression to achieve parameter suppression to provide a solution for achieving autonomous actions due to autonomous coding. The researcher used a simulation-based experiment using OpenAI’s o4-mini-high as a tool to build the experimental environment, and introduced the extended SayCan dataset to conduct nine epochs of experiments. The experimental results show that the CTM-MCP architecture is feasible and effective through the data results of seven metrics: task success rate (TSR), execution success rate (ESR), average episode length (AEL), ROSCOE, REVEAL, proficiency self-assessment (PSA), task effectiveness (TE). In practice, it provides a reference experience for exploring the autonomous dynamic coding of humanoid robots based on continuous thinking to achieve human-like autonomous actions.
arxiv情報
著者 | Libo Wang |
発行日 | 2025-05-25 22:12:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google