Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks

要約

大規模な言語モデル(LLM)は、マルチステップタスクの自律エージェントとしてますます使用されています。
ただし、ほとんどの既存のフレームワークは、タスク状態の構造化された理解を維持することができず、多くの場合、線形プロンプトの連結または浅いメモリバッファに依存しています。
これは、脆い性能、頻繁な幻覚、および長距離の依存性の低さにつながります。
この作業では、階層タスクメモリツリー(TMT)を使用してタスクの実行を追跡する軽量で構造化されたメモリモジュールであるタスクメモリエンジン(TME)を提案します。
ツリー内の各ノードはタスクステップに対応し、関連する入力、出力、ステータス、およびサブタスクの関係を保存します。
アクティブなノードパスに基づいてLLMプロンプトを動的に生成するプロンプト合成方法を導入し、実行の一貫性とコンテキスト接地を大幅に改善します。
マルチステップエージェントタスクに関するケーススタディと比較実験を通じて、TMEが最小限の実装のオーバーヘッドでより良いタスク完了精度とより解釈可能な動作につながることを実証します。
コアTMEコンポーネントの参照実装は、https://github.com/biubiutomato/tme-agentで入手できます。これには、基本的な例と構造化されたメモリ統合が含まれます。
現在の実装ではツリーベースの構造を使用していますが、TMEはグラフ認識として設計されており、再利用可能なサブセンプ、収束タスクパス、共有依存関係をサポートしています。
これは、将来のDAGベースのメモリアーキテクチャの基礎となります。

要約(オリジナル)

Large Language Models (LLMs) are increasingly used as autonomous agents for multi-step tasks. However, most existing frameworks fail to maintain a structured understanding of the task state, often relying on linear prompt concatenation or shallow memory buffers. This leads to brittle performance, frequent hallucinations, and poor long-range coherence. In this work, we propose the Task Memory Engine (TME), a lightweight and structured memory module that tracks task execution using a hierarchical Task Memory Tree (TMT). Each node in the tree corresponds to a task step, storing relevant input, output, status, and sub-task relationships. We introduce a prompt synthesis method that dynamically generates LLM prompts based on the active node path, significantly improving execution consistency and contextual grounding. Through case studies and comparative experiments on multi-step agent tasks, we demonstrate that TME leads to better task completion accuracy and more interpretable behavior with minimal implementation overhead. A reference implementation of the core TME components is available at https://github.com/biubiutomato/TME-Agent, including basic examples and structured memory integration. While the current implementation uses a tree-based structure, TME is designed to be graph-aware, supporting reusable substeps, converging task paths, and shared dependencies. This lays the groundwork for future DAG-based memory architectures.

arxiv情報

著者 Ye Ye
発行日 2025-04-14 09:38:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T05, cs.AI, cs.CL, H.3.3 | Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks はコメントを受け付けていません

Hands-On: Segmenting Individual Signs from Continuous Sequences

要約

この作業は、手話の翻訳とデータ注釈に大きな影響を与える重要なタスクである、継続的な手話セグメンテーションの課題に取り組んでいます。
SigningおよびFramesセグメンテーションの時間的ダイナミクスをモデル化し、Begin-In-Out(Bio)タグ付けスキームを使用したシーケンスラベル付けの問題としてモデル化するトランスベースのアーキテクチャを提案します。
私たちの方法は、Hamer Handの特徴を活用し、3D角度で補完されます。
広範な実験では、モデルがDGSコーパスで最先端の結果を達成し、BSLCorpusの以前のベンチマークを上回る機能を示しています。

要約(オリジナル)

This work tackles the challenge of continuous sign language segmentation, a key task with huge implications for sign language translation and data annotation. We propose a transformer-based architecture that models the temporal dynamics of signing and frames segmentation as a sequence labeling problem using the Begin-In-Out (BIO) tagging scheme. Our method leverages the HaMeR hand features, and is complemented with 3D Angles. Extensive experiments show that our model achieves state-of-the-art results on the DGS Corpus, while our features surpass prior benchmarks on BSLCorpus.

arxiv情報

著者 Low Jian He,Harry Walsh,Ozge Mercanoglu Sincan,Richard Bowden
発行日 2025-04-14 08:07:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV | Hands-On: Segmenting Individual Signs from Continuous Sequences はコメントを受け付けていません

Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments

要約

ゼロショット設定の下で、連続環境(VLN-CE)におけるビジョン言語ナビゲーションのタスクに対処します。
ゼロショットVLN-CEは、ガイドナビゲーションの前にトレーニングのための専門家のデモがなく、環境構造を最小限に抑えているため、特に困難です。
これらの課題に立ち向かうために、ゼロショットVLN-CEを連続的な制約対応のサブインストラクション完了プロセスとして再構成する制約対応ナビゲーター(CA-NAV)を提案します。
CA-NAVは、2つのコアモジュールを使用して、サブインストラクションをナビゲーションプランに継続的に変換します:制約アウェアサブインストラクションマネージャー(CSM)と制約対応値マッパー(CVM)。
CSMは、分解されたサブインストラクションの完了基準を制約として定義し、サブインストラクションを制約対応方法で切り替えることにより、ナビゲーションの進行を追跡します。
CSMの制約に導かれたCVMは、その場でバリューマップを生成し、スーパーピクセルのクラスタリングを使用してナビゲーションの安定性を向上させます。
CA-NAVは、2つのVLN-CEベンチマークで最先端のパフォーマンスを達成し、それぞれR2R-CEとRXR-CEの検証が見えない分割の成功率が12%および13%を超えています。
さらに、Ca-Navは、さまざまな屋内シーンや指示にわたる実際のロボットの展開における有効性を示しています。

要約(オリジナル)

We address the task of Vision-Language Navigation in Continuous Environments (VLN-CE) under the zero-shot setting. Zero-shot VLN-CE is particularly challenging due to the absence of expert demonstrations for training and minimal environment structural prior to guide navigation. To confront these challenges, we propose a Constraint-Aware Navigator (CA-Nav), which reframes zero-shot VLN-CE as a sequential, constraint-aware sub-instruction completion process. CA-Nav continuously translates sub-instructions into navigation plans using two core modules: the Constraint-Aware Sub-instruction Manager (CSM) and the Constraint-Aware Value Mapper (CVM). CSM defines the completion criteria for decomposed sub-instructions as constraints and tracks navigation progress by switching sub-instructions in a constraint-aware manner. CVM, guided by CSM’s constraints, generates a value map on the fly and refines it using superpixel clustering to improve navigation stability. CA-Nav achieves the state-of-the-art performance on two VLN-CE benchmarks, surpassing the previous best method by 12 percent and 13 percent in Success Rate on the validation unseen splits of R2R-CE and RxR-CE, respectively. Moreover, CA-Nav demonstrates its effectiveness in real-world robot deployments across various indoor scenes and instructions.

arxiv情報

著者 Kehan Chen,Dong An,Yan Huang,Rongtao Xu,Yifei Su,Yonggen Ling,Ian Reid,Liang Wang
発行日 2025-04-14 02:05:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments はコメントを受け付けていません

Large language models could be rote learners

要約

複数選択の質問(MCQ)ベンチマークは、大規模な言語モデル(LLM)の評価に広く使用されていますが、その信頼性はベンチマークの汚染によって損なわれています。
この研究では、汚染を学習の固有の側面として再構成し、LLM評価における表面的な記憶から本物の能力の獲得を解き放つよう努めています。
第一に、さまざまな記憶条件下でモデルのパフォーマンスを分析することにより、直感に反する傾向を明らかにします。LLMは、記憶されていないMCQよりも記憶されたMCQよりも悪化し、2つの異なる学習現象の共存、つまり暗記と本物の能力学習を示しています。
それらを解くために、MCQを代替のTrinity形式に再フォーマルする新しい評価フレームワークであるTrinevalを提案し、知識評価を維持しながら暗記を減らします。
実験は、再生におけるTrinevalの有効性を検証し、その評価は、一般的なLLMが知識ポイントの20.5%(平均してMMLU)によって記憶する可能性があることを明らかにしています。

要約(オリジナル)

Multiple-choice question (MCQ) benchmarks are widely used for evaluating Large Language Models (LLMs), yet their reliability is undermined by benchmark contamination. In this study, we reframe contamination as an inherent aspect of learning and seek to disentangle genuine capability acquisition from superficial memorization in LLM evaluation. First, by analyzing model performance under different memorization conditions, we uncover a counterintuitive trend: LLMs perform worse on memorized MCQs than on non-memorized ones, indicating the coexistence of two distinct learning phenomena, i.e., rote memorization and genuine capability learning. To disentangle them, we propose TrinEval, a novel evaluation framework that reformulates MCQs into an alternative trinity format, reducing memorization while preserving knowledge assessment. Experiments validate TrinEval’s effectiveness in reformulation, and its evaluation reveals that common LLMs may memorize by rote 20.5% of knowledge points (in MMLU on average).

arxiv情報

著者 Yuyang Xu,Renjun Hu,Haochao Ying,Jian Wu,Xing Shi,Wei Lin
発行日 2025-04-14 02:27:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Large language models could be rote learners はコメントを受け付けていません

Vector Quantized-Elites: Unsupervised and Problem-Agnostic Quality-Diversity Optimization

要約

Quality-Diversityアルゴリズムは、単一の最適な結果にわたって多様で高性能のソリューションの発見を優先することにより、最適化を変革しました。
ただし、MAP-ELITEなどの従来の品質双方向の方法は、事前定義された行動記述子とタスクの完全な事前知識に大きく依存して、行動空間グリッドを定義し、柔軟性と適用性を制限します。
この作業では、ベクトルQuantized-Elites(VQ-Elites)を導入します。これは、監視されていない学習を使用して構造化された行動空間グリッドを自律的に構築し、以前のタスク固有の知識の必要性を排除する新しい品質 – 多様性アルゴリズムです。
VQ-ELITEの中核は、ベクター量子化された変動自動エンコーダーの統合であり、行動記述子の動的学習と、構造化されていない行動空間グリッドの生成を可能にします。
この設計は、VQ-Elitesを柔軟で堅牢でタスクに依存しない最適化フレームワークとして確立します。
監視されていない品質 – ダイバーシティアルゴリズムのパフォーマンスをさらに向上させるために、2つの重要なコンポーネントを紹介します。行動空間の境界と協力メカニズムで、収束とパフォーマンスを大幅に改善します。
ロボットアームのポーズリーチングおよびモバイルロボットスペースカバータスクのVQ-Elitesを検証します。
この結果は、多様で高品質のソリューションを効率的に生成する能力を示しており、その適応性、スケーラビリティ、ハイパーパラメーターへの堅牢性、および品質ダイバーシティの最適化を複雑で以前はアクセスできないドメインに拡張する可能性を示しています。

要約(オリジナル)

Quality-Diversity algorithms have transformed optimization by prioritizing the discovery of diverse, high-performing solutions over a single optimal result. However, traditional Quality-Diversity methods, such as MAP-Elites, rely heavily on predefined behavioral descriptors and complete prior knowledge of the task to define the behavioral space grid, limiting their flexibility and applicability. In this work, we introduce Vector Quantized-Elites (VQ-Elites), a novel Quality-Diversity algorithm that autonomously constructs a structured behavioral space grid using unsupervised learning, eliminating the need for prior task-specific knowledge. At the core of VQ-Elites is the integration of Vector Quantized Variational Autoencoders, which enables the dynamic learning of behavioral descriptors and the generation of a structured, rather than unstructured, behavioral space grid – a significant advancement over existing unsupervised Quality-Diversity approaches. This design establishes VQ-Elites as a flexible, robust, and task-agnostic optimization framework. To further enhance the performance of unsupervised Quality-Diversity algorithms, we introduce two key components: behavioral space bounding and cooperation mechanisms, which significantly improve convergence and performance. We validate VQ-Elites on robotic arm pose-reaching and mobile robot space-covering tasks. The results demonstrate its ability to efficiently generate diverse, high-quality solutions, emphasizing its adaptability, scalability, robustness to hyperparameters, and potential to extend Quality-Diversity optimization to complex, previously inaccessible domains.

arxiv情報

著者 Constantinos Tsakonas,Konstantinos Chatzilygeroudis
発行日 2025-04-10 18:23:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO | Vector Quantized-Elites: Unsupervised and Problem-Agnostic Quality-Diversity Optimization はコメントを受け付けていません

Generalized Multi-Speed Dubins Motion Model

要約

このペーパーは、複数の速度を考慮してデュビンモデルを拡張する一般化されたマルチスピードデュビンモーションモデル(GMDM)と呼ばれる新しいモーションモデルを開発します。
Dubinsモデルは、一定の速度制約の下で時間最適な経路を生成しますが、この制約が緩和されて複数の速度を含めると、これらのパスは最適ではない可能性があります。
これは、一定の速度が最小ターニング半径が大きくなるため、より長い操縦と移動時間が大きい経路を生成するためです。
対照的に、マルチスピードリラクゼーションにより、速度が遅いターンが遅くなるため、より短い操縦と移動時間が短くなると、より直接的な経路が生成されます。
さらに、Dubinsモデルが速度を低下させることができないと、障害物の近くで速い操縦が生じる可能性があり、衝突リスクが高いパスを生成します。
この点で、GMDMはモーションプランナーに、パスに沿った速度の変化を許可することにより、時間とリスクを共同で最適化する機能を提供します。
GMDMは、パスセグメントの速度の変化を考慮して、6つのDubinsパスタイプの上に構築されます。
GMDMが速度選択のために構成スペースの完全な到達可能性を提供することが理論的に確立されています。
さらに、Dubinsモデルは、一定速度のGMDMの特定のケースであることが示されています。
GMDMのソリューションは分析的であり、リアルタイムアプリケーションに適しています。
ソリューション品質(つまり、時間/タイムリスクコスト)と計算時間の観点からGMDMのパフォーマンスは、障害物のない環境と障害物が豊富な環境で既存のモーションモデルに対して比較的評価されます。
結果は、障害物のない環境では、GMDMは、同様の計算時間を持っている間、Dubinsモデルよりも大幅に低い移動時間を持つ非常に近い最適パスを生成することを示しています。
障害物が豊富な環境では、GMDMは衝突リスクが大幅に低いタイムリスク最適化されたパスを生成します。

要約(オリジナル)

The paper develops a novel motion model, called Generalized Multi-Speed Dubins Motion Model (GMDM), which extends the Dubins model by considering multiple speeds. While the Dubins model produces time-optimal paths under a constant speed constraint, these paths could be suboptimal if this constraint is relaxed to include multiple speeds. This is because a constant speed results in a large minimum turning radius, thus producing paths with longer maneuvers and larger travel times. In contrast, multi-speed relaxation allows for slower speed sharp turns, thus producing more direct paths with shorter maneuvers and smaller travel times. Furthermore, the inability of the Dubins model to reduce speed could result in fast maneuvers near obstacles, thus producing paths with high collision risks. In this regard, GMDM provides the motion planners the ability to jointly optimize time and risk by allowing the change of speed along the path. GMDM is built upon the six Dubins path types considering the change of speed on path segments. It is theoretically established that GMDM provides full reachability of the configuration space for any speed selections. Furthermore, it is shown that the Dubins model is a specific case of GMDM for constant speeds. The solutions of GMDM are analytical and suitable for real-time applications. The performance of GMDM in terms of solution quality (i.e., time/time-risk cost) and computation time is comparatively evaluated against the existing motion models in obstacle-free as well as obstacle-rich environments via extensive Monte Carlo simulations. The results show that in obstacle-free environments, GMDM produces near time-optimal paths with significantly lower travel times than the Dubins model while having similar computation times. In obstacle-rich environments, GMDM produces time-risk optimized paths with substantially lower collision risks.

arxiv情報

著者 James P. Wilson,Shalabh Gupta,Thomas A. Wettergren
発行日 2025-04-10 19:20:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Generalized Multi-Speed Dubins Motion Model はコメントを受け付けていません

Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion

要約

このペーパーは、拡張可能な長期の長期計画対象のエージェントである新しい問題に取り組んでおり、エラーを複利なしでトレーニングデータの軌跡よりも長く計画しています。
これに取り組むために、短いものを縫うことでより長い軌道を繰り返し生成する増強方法である階層的マルチスケールディフューザー(HMディフューザー)とプログレッシブ軌道拡張(PTE)を提案します。
HM-Diffuserは、階層構造を使用してこれらの拡張された軌跡を訓練し、複数の時間スケールでタスクを効率的に処理します。
さらに、階層層を単一のモデルに統合して時間的スケールを再帰的に処理する適応計画と再帰的なHMディフューザーを導入します。
実験結果は、私たちのアプローチの有効性を示しており、スケーラブルな長期計画のために拡散ベースのプランナーを進めています。

要約(オリジナル)

This paper tackles a novel problem, extendable long-horizon planning-enabling agents to plan trajectories longer than those in training data without compounding errors. To tackle this, we propose the Hierarchical Multiscale Diffuser (HM-Diffuser) and Progressive Trajectory Extension (PTE), an augmentation method that iteratively generates longer trajectories by stitching shorter ones. HM-Diffuser trains on these extended trajectories using a hierarchical structure, efficiently handling tasks across multiple temporal scales. Additionally, we introduce Adaptive Plan Pondering and the Recursive HM-Diffuser, which consolidate hierarchical layers into a single model to process temporal scales recursively. Experimental results demonstrate the effectiveness of our approach, advancing diffusion-based planners for scalable long-horizon planning.

arxiv情報

著者 Chang Chen,Hany Hamed,Doojin Baek,Taegu Kang,Yoshua Bengio,Sungjin Ahn
発行日 2025-04-10 19:53:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion はコメントを受け付けていません

RL-based Control of UAS Subject to Significant Disturbance

要約

このペーパーでは、不確実なトリガー信号に関連する可能性のある重大な妨害を受ける無人航空システム(UAS)の位置と態度制御のための強化学習(RL)ベースの制御フレームワークを提案します。
提案された方法は、トリガー信号と妨害力の関係を学習し、システムが発生する前に差し迫った妨害を予測し、打ち消すことを可能にします。
3つのポリシーを訓練および評価します。妨害にさらされることなく訓練されたベースラインポリシー、妨害で訓練されたがトリガー信号なしで訓練された反応的ポリシー、およびトリガー信号を観察として組み込み、トレーニング中に妨害にさらされる予測ポリシー。
シミュレーション結果は、予測ポリシーが、プロアクティブな修正操作を介して位置逸脱を最小限に抑えることにより、他のポリシーを上回ることを示しています。
この作業は、UASパフォーマンスを改善するために、予測キューをRLフレームワークに統合する可能性を強調しています。

要約(オリジナル)

This paper proposes a Reinforcement Learning (RL)-based control framework for position and attitude control of an Unmanned Aerial System (UAS) subjected to significant disturbance that can be associated with an uncertain trigger signal. The proposed method learns the relationship between the trigger signal and disturbance force, enabling the system to anticipate and counteract the impending disturbances before they occur. We train and evaluate three policies: a baseline policy trained without exposure to the disturbance, a reactive policy trained with the disturbance but without the trigger signal, and a predictive policy that incorporates the trigger signal as an observation and is exposed to the disturbance during training. Our simulation results show that the predictive policy outperforms the other policies by minimizing position deviations through a proactive correction maneuver. This work highlights the potential of integrating predictive cues into RL frameworks to improve UAS performance.

arxiv情報

著者 Kousheek Chakraborty,Thijs Hof,Ayham Alharbat,Abeje Mersha
発行日 2025-04-10 20:25:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY | RL-based Control of UAS Subject to Significant Disturbance はコメントを受け付けていません

Design Activity for Robot Faces: Evaluating Child Responses To Expressive Faces

要約

顔の表現力は、子供たちと交流して対話するロボットの能力において重要な役割を果たします。
以前の研究では、表現力豊かなロボットが人間とロボットの相互作用中に子供の関与を強化できることが示されています。
ただし、治療環境で使用される多くのロボットは、従来の顔の特徴の考慮事項で設計された非個人化された静的な顔を特徴としており、相互作用や感情的なつながりの深さを制限できます。
デジタルフェイスはパーソナライズの機会を提供しますが、ロボットフェイスデザインの現在のランドスケープには、ダイナミックでユーザー中心のアプローチがありません。
具体的には、子どもの好みに基づいてロボットの顔を設計することには重要な研究ギャップがあります。
代わりに、小児中心の療法スペースのほとんどのロボットは、成人中心の観点から開発されています。
子どもとロボットの相互作用における子供が描くデジタル顔の影響を調査する新しい研究を提示します。
このアプローチは、子供たちが独自のカスタムロボットの顔を描くように指示されたデザインアクティビティに焦点を当てています。
2つの実装のソーシャルインテリジェンス(PSI)の認識を比較します。一般的なデジタルフェイスとロボットフェイスは、ユーザーの描画ロボット面を使用してパーソナライズされています。
この研究の結果は、児童描画ロボットの認識された社会的知性が、一般的な顔と比較して有意に高いことを示しています。

要約(オリジナル)

Facial expressiveness plays a crucial role in a robot’s ability to engage and interact with children. Prior research has shown that expressive robots can enhance child engagement during human-robot interactions. However, many robots used in therapy settings feature non-personalized, static faces designed with traditional facial feature considerations, which can limit the depth of interactions and emotional connections. Digital faces offer opportunities for personalization, yet the current landscape of robot face design lacks a dynamic, user-centered approach. Specifically, there is a significant research gap in designing robot faces based on child preferences. Instead, most robots in child-focused therapy spaces are developed from an adult-centric perspective. We present a novel study investigating the influence of child-drawn digital faces in child-robot interactions. This approach focuses on a design activity with children instructed to draw their own custom robot faces. We compare the perceptions of social intelligence (PSI) of two implementations: a generic digital face and a robot face, personalized using the user’s drawn robot faces. The results of this study show the perceived social intelligence of a child-drawn robot was significantly higher compared to a generic face.

arxiv情報

著者 Denielle Oliva,Joshua Knight,Tyler J Becker,Heather Amistani,Monica Nicolescu,David Feil-Seifer
発行日 2025-04-10 20:36:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Design Activity for Robot Faces: Evaluating Child Responses To Expressive Faces はコメントを受け付けていません

Threading the Needle: Test and Evaluation of Early Stage UAS Capabilities to Autonomously Navigate GPS-Denied Environments in the DARPA Fast Lightweight Autonomy (FLA) Program

要約

DARPA Fast Lightweight Autonomy(FLA)プログラム(2015-2018)は、特に未知のGPS除去された環境を介した自律的なナビゲーションのために、UASの開発において重要なマイルストーンとして機能しました。
3つのパフォーマンスチームが共通のハードウェアプラットフォームを使用してUASを開発し、自律アルゴリズムとセンシングに貢献しました。
屋内および屋外の環境にまたがるいくつかの実験が行われ、時間とともに複雑さが増加しました。
このペーパーでは、各チームのパフォーマンス、実施された各フェーズ1実験、およびフェーズ1の結果の要約をベンチマークして比較するために開発されたテスト方法をレビューします。

要約(オリジナル)

The DARPA Fast Lightweight Autonomy (FLA) program (2015 – 2018) served as a significant milestone in the development of UAS, particularly for autonomous navigation through unknown GPS-denied environments. Three performing teams developed UAS using a common hardware platform, focusing their contributions on autonomy algorithms and sensing. Several experiments were conducted that spanned indoor and outdoor environments, increasing in complexity over time. This paper reviews the testing methodology developed in order to benchmark and compare the performance of each team, each of the FLA Phase 1 experiments that were conducted, and a summary of the Phase 1 results.

arxiv情報

著者 Adam Norton,Holly Yanco
発行日 2025-04-10 20:46:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Threading the Needle: Test and Evaluation of Early Stage UAS Capabilities to Autonomously Navigate GPS-Denied Environments in the DARPA Fast Lightweight Autonomy (FLA) Program はコメントを受け付けていません