Data-driven Fuzzy Control for Time-Optimal Aggressive Trajectory Following

要約

動的システムでユーザー定義のコスト関数を最小限に抑える最適な軌跡には、2点境界値の問題の解決が必要です。
最適化プロセスは、初期条件とシステムパラメーターに依存する最適な制御シーケンスを生成します。
ただし、システムの初期条件とパラメーターが誤っている場合、最適なシーケンスは望ましくない動作をもたらす可能性があります。
この作業は、マルチコプター追跡の問題のための時間最適な軌跡によって導かれるデータ駆動型ファジーコントローラー合成フレームワークを提示します。
特に、2点境界値の問題を数値的に解くことにより、空中のフリップで構成される積極的な操作を検討し、時間最適な軌跡を生成します。
ホバー条件に近い安定化コントローラーと、時間最適な攻撃的な軌跡を模倣するように訓練された自己回帰移動平均(ARMA)コントローラーで構成されるファジーコントローラーは、タカギゼノファジーフレームワークを使用して構築されます。

要約(オリジナル)

Optimal trajectories that minimize a user-defined cost function in dynamic systems require the solution of a two-point boundary value problem. The optimization process yields an optimal control sequence that depends on the initial conditions and system parameters. However, the optimal sequence may result in undesirable behavior if the system’s initial conditions and parameters are erroneous. This work presents a data-driven fuzzy controller synthesis framework that is guided by a time-optimal trajectory for multicopter tracking problems. In particular, we consider an aggressive maneuver consisting of a mid-air flip and generate a time-optimal trajectory by numerically solving the two-point boundary value problem. A fuzzy controller consisting of a stabilizing controller near hover conditions and an autoregressive moving average (ARMA) controller, trained to mimic the time-optimal aggressive trajectory, is constructed using the Takagi-Sugeno fuzzy framework.

arxiv情報

著者 August Phelps,Juan Augusto Paredes Salazar,Ankit Goel
発行日 2025-04-09 00:06:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Data-driven Fuzzy Control for Time-Optimal Aggressive Trajectory Following はコメントを受け付けていません

Safe Navigation in Uncertain Crowded Environments Using Risk Adaptive CVaR Barrier Functions

要約

動的で混雑した環境でのロボットナビゲーションは、障害物モデルに固有の不確実性のために大きな課題をもたらします。
この作業では、リスクレベルが自動的に必要なリスクを受け入れるように自動的に調整され、不確実性の下での安全性と最適化の実現可能性の観点から適切なパフォーマンスを達成するために、リスクアットリスクバリア関数(CVAR-BF)に基づいてリスク適応アプローチを提案します。
さらに、ロボットと障害物の間の相対状態を評価することにより、衝突の尤度を特徴付ける動的ゾーンベースのバリア関数を導入します。
リスク適応をこの新しい機能と統合することにより、当社のアプローチは安全マージンを適応的に拡大し、ロボットが非常に動的な環境で障害を積極的に回避できるようにします。
比較とアブレーション研究は、私たちの方法が既存のソーシャルナビゲーションアプローチよりも優れていることを示しており、提案されたフレームワークの有効性を検証します。

要約(オリジナル)

Robot navigation in dynamic, crowded environments poses a significant challenge due to the inherent uncertainties in the obstacle model. In this work, we propose a risk-adaptive approach based on the Conditional Value-at-Risk Barrier Function (CVaR-BF), where the risk level is automatically adjusted to accept the minimum necessary risk, achieving a good performance in terms of safety and optimization feasibility under uncertainty. Additionally, we introduce a dynamic zone-based barrier function which characterizes the collision likelihood by evaluating the relative state between the robot and the obstacle. By integrating risk adaptation with this new function, our approach adaptively expands the safety margin, enabling the robot to proactively avoid obstacles in highly dynamic environments. Comparisons and ablation studies demonstrate that our method outperforms existing social navigation approaches, and validate the effectiveness of our proposed framework.

arxiv情報

著者 Xinyi Wang,Taekyung Kim,Bardh Hoxha,Georgios Fainekos,Dimitra Panagou
発行日 2025-04-09 01:23:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Safe Navigation in Uncertain Crowded Environments Using Risk Adaptive CVaR Barrier Functions はコメントを受け付けていません

Controller Distillation Reduces Fragile Brain-Body Co-Adaptation and Enables Migrations in MAP-Elites

要約

脳体共同最適化は、脳が特定の身体に対して過剰に専門化され、他の人にうまく移動する能力を妨げる壊れやすい共染色に苦しんでいます。
進化的アルゴリズムは、このような低いパフォーマンスのソリューションを破棄する傾向があり、有望な形態を排除します。
ニッチな記述子が形態学的特徴に基づいているMAP-ELITEを適用することを検討した以前の研究は、形態学的空間をよりよく検索することを促進しました。
この作業では、このアプローチは依然として壊れやすい共適応に苦しんでいることを示しています。マップエリートのコアメカニズムが、あるニッチから別のニッチに移動するソリューションを通して踏み石を作成することが混乱していることを示します。
この混乱は、子孫を新しい形態学的ニッチに移動させる身体変異がロボットの脆弱な脳体の共適応を破壊し、したがってそれらの潜在的なソリューションのパフォーマンスを大幅に減少させ、その新しいニッチで既存のエリートを補償する可能性を低下させるために発生することを示唆しています。
私たちは、特定のソリューションのコントローラーを蒸留コントローラーに定期的に置き換えて、形態を越えてより良い一般化を行い、壊れやすい脳体の共適応を減らし、したがってMAP-ELITESの移動を促進するテクニックを利用して、受粉と呼びます。
受粉は、身体変異の成功と移動の数を増加させ、品質二流の指標を改善します。
Map-Elitesが使用されている他のドメインに適用できる重要な洞察を開発すると考えています。

要約(オリジナル)

Brain-body co-optimization suffers from fragile co-adaptation where brains become over-specialized for particular bodies, hindering their ability to transfer well to others. Evolutionary algorithms tend to discard such low-performing solutions, eliminating promising morphologies. Previous work considered applying MAP-Elites, where niche descriptors are based on morphological features, to promote better search over morphology space. In this work, we show that this approach still suffers from fragile co-adaptation: where a core mechanism of MAP-Elites, creating stepping stones through solutions that migrate from one niche to another, is disrupted. We suggest that this disruption occurs because the body mutations that move an offspring to a new morphological niche break the robots’ fragile brain-body co-adaptation and thus significantly decrease the performance of those potential solutions — reducing their likelihood of outcompeting an existing elite in that new niche. We utilize a technique, we call Pollination, that periodically replaces the controllers of certain solutions with a distilled controller with better generalization across morphologies to reduce fragile brain-body co-adaptation and thus promote MAP-Elites migrations. Pollination increases the success of body mutations and the number of migrations, resulting in better quality-diversity metrics. We believe we develop important insights that could apply to other domains where MAP-Elites is used.

arxiv情報

著者 Alican Mertan,Nick Cheney
発行日 2025-04-09 01:45:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NE, cs.RO | Controller Distillation Reduces Fragile Brain-Body Co-Adaptation and Enables Migrations in MAP-Elites はコメントを受け付けていません

OPAL: Encoding Causal Understanding of Physical Systems for Robot Learning

要約

ロボット制御のためのフローマッチングにトポロジカル制約を導入する新しいビジョン言語アクションアーキテクチャであるOpal(Operant Physical Agent with Language)を提示します。
そうするために、さらにトポロジカルな注意を紹介します。
私たちのアプローチは、非自明の制約を伴うトポロジー的に構造化された表現としてのアクションシーケンスをモデル化します。
10の複雑な操作タスクにわたる実験結果は、Octo、OpenVLA、$ {\ pi} $ 0などの以前のアプローチと比較して、Opalの優れたパフォーマンスを示しています。
当社のアーキテクチャは、タスク固有の微調整を必要とせずに、ゼロショットパフォーマンスの大幅な改善を達成し、推論計算要件を42%削減します。
私たちのトポロジー的アプローチによって提供される理論的保証は、より首尾一貫した長期作用シーケンスをもたらします。
私たちの結果は、基本的な物理的法則から派生することにより、ロボット工学の学習問題の検索空間を制約する可能性と、トポロジーの注意を使用して因果的理解を変圧器アーキテクチャに埋め込む可能性を強調しています。

要約(オリジナル)

We present OPAL (Operant Physical Agent with Language), a novel vision-language-action architecture that introduces topological constraints to flow matching for robotic control. To do so, we further introduce topological attention. Our approach models action sequences as topologically-structured representations with non-trivial constraints. Experimental results across 10 complex manipulation tasks demonstrate OPAL’s superior performance compared to previous approaches, including Octo, OpenVLA, and ${\pi}$0. Our architecture achieves significant improvements in zero-shot performance without requiring task-specific fine-tuning, while reducing inference computational requirements by 42%. The theoretical guarantees provided by our topological approach result in more coherent long-horizon action sequences. Our results highlight the potential of constraining the search space of learning problems in robotics by deriving from fundamental physical laws, and the possibility of using topological attention to embed causal understanding into transformer architectures.

arxiv情報

著者 Daniel Tcheurekdjian,Joshua Klasmeier,Tom Cooney,Christopher McCann,Tyler Fenstermaker
発行日 2025-04-09 02:29:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | OPAL: Encoding Causal Understanding of Physical Systems for Robot Learning はコメントを受け付けていません

ASHiTA: Automatic Scene-grounded HIerarchical Task Analysis

要約

シーンの再構築と理解の最近の作業は、物理的な3D環境に自然言語を接地することで進歩しましたが、3Dシーンへの抽象的な高レベルの指示を接地することは依然として困難です。
高レベルの命令は、シーン内のセマンティック要素を明示的に呼び出さない場合があり、高レベルのタスクをより具体的なサブタスクのセットに分割するプロセスでさえ、階層タスク分析と呼ばれるプロセスが環境に依存します。
この作業では、高レベルのタスクを接地されたサブタスクに分解することにより、3Dシーングラフに接地されたタスク階層を生成する最初のフレームワークであるAshitaを提案します。
ASHITAは、LLM支援の階層タスク分析を交互にして、タスク駆動型の3Dシーングラフ構造を使用して、環境の適切な表現を生成します。
私たちの実験は、AshitaがLLMベースラインよりも高レベルのタスクを環境依存のサブタスクに分解する際に大幅に優れていることを示しており、さらに最先端の方法に匹敵する接地性能を達成できることが示されています。

要約(オリジナル)

While recent work in scene reconstruction and understanding has made strides in grounding natural language to physical 3D environments, it is still challenging to ground abstract, high-level instructions to a 3D scene. High-level instructions might not explicitly invoke semantic elements in the scene, and even the process of breaking a high-level task into a set of more concrete subtasks, a process called hierarchical task analysis, is environment-dependent. In this work, we propose ASHiTA, the first framework that generates a task hierarchy grounded to a 3D scene graph by breaking down high-level tasks into grounded subtasks. ASHiTA alternates LLM-assisted hierarchical task analysis, to generate the task breakdown, with task-driven 3D scene graph construction to generate a suitable representation of the environment. Our experiments show that ASHiTA performs significantly better than LLM baselines in breaking down high-level tasks into environment-dependent subtasks and is additionally able to achieve grounding performance comparable to state-of-the-art methods.

arxiv情報

著者 Yun Chang,Leonor Fermoselle,Duy Ta,Bernadette Bucher,Luca Carlone,Jiuguang Wang
発行日 2025-04-09 03:22:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | ASHiTA: Automatic Scene-grounded HIerarchical Task Analysis はコメントを受け付けていません

CAFE-AD: Cross-Scenario Adaptive Feature Enhancement for Trajectory Planning in Autonomous Driving

要約

Nuplanデータセットの模倣学習ベースの計画タスクは、人間のような運転行動を生成する可能性のために大きな関心を集めています。
ただし、Nuplanデータセットでのオープンループトレーニングは、閉ループテスト中に因果的混乱を引き起こす傾向があり、データセットはシナリオの長期尾の分布も提示します。
これらの問題は、模倣学習の課題をもたらします。
これらの問題に取り組むために、さまざまなシナリオタイプにわたって特徴表現を強化するために設計された、自律運転方法における軌跡計画のためのクロスセナリオ適応機能の強化であるCafe-Adを紹介します。
トレーニング中にノイズの多い情報の干渉を減らしながら、最も関連性の高い情報をキャプチャする機能の重要性をランク付けする適応機能の剪定モジュールを開発します。
さらに、シナリオ情報を強化して多様性を導入し、ネットワークが支配的なシナリオで過剰に適合を緩和できるようにするクロスセナリオ機能補間モジュールを提案します。
挑戦的なパブリックNuplan Test14ハードの閉ループシミュレーションベンチマークでCAFE-ADを評価します。
結果は、CAFE-ADがルールベースのプランナーやハイブリッドプランナーを含む最先端の方法を上回り、データセット内のロングテール分布の影響を緩和する可能性を示すことを示しています。
さらに、実際の環境におけるその有効性をさらに検証します。
コードとモデルはhttps://github.com/alniyatrui/cafe-adで利用可能になります。

要約(オリジナル)

Imitation learning based planning tasks on the nuPlan dataset have gained great interest due to their potential to generate human-like driving behaviors. However, open-loop training on the nuPlan dataset tends to cause causal confusion during closed-loop testing, and the dataset also presents a long-tail distribution of scenarios. These issues introduce challenges for imitation learning. To tackle these problems, we introduce CAFE-AD, a Cross-Scenario Adaptive Feature Enhancement for Trajectory Planning in Autonomous Driving method, designed to enhance feature representation across various scenario types. We develop an adaptive feature pruning module that ranks feature importance to capture the most relevant information while reducing the interference of noisy information during training. Moreover, we propose a cross-scenario feature interpolation module that enhances scenario information to introduce diversity, enabling the network to alleviate over-fitting in dominant scenarios. We evaluate our method CAFE-AD on the challenging public nuPlan Test14-Hard closed-loop simulation benchmark. The results demonstrate that CAFE-AD outperforms state-of-the-art methods including rule-based and hybrid planners, and exhibits the potential in mitigating the impact of long-tail distribution within the dataset. Additionally, we further validate its effectiveness in real-world environments. The code and models will be made available at https://github.com/AlniyatRui/CAFE-AD.

arxiv情報

著者 Junrui Zhang,Chenjie Wang,Jie Peng,Haoyu Li,Jianmin Ji,Yu Zhang,Yanyong Zhang
発行日 2025-04-09 05:16:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | CAFE-AD: Cross-Scenario Adaptive Feature Enhancement for Trajectory Planning in Autonomous Driving はコメントを受け付けていません

Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection

要約

このペーパーでは、シミュレートされた経験で制御ポリシーをトレーニングするための既存のSIMからリアルの方法に代わる新しい代替案を提案します。
足のロボットの以前のSIM-REALメソッドは、主にドメインランダム化アプローチに依存しています。このシミュレーションパラメーターの固定有限セットは、トレーニング中にランダム化されます。
代わりに、私たちの方法は、トレーニングフェーズ中のフォワードシミュレーションに使用される入力ジョイントトルクに状態依存の摂動を追加します。
これらの状態依存の摂動は、シミュレーションパラメーターの固定セットをランダム化することによってキャプチャされたものよりも広範な範囲の現実ギャップをシミュレートするように設計されています。
実験結果は、私たちの方法が、トレーニングドメインで目にされていない複雑な現実のギャップに対してより大きな堅牢性を達成するヒューマノイド運動ポリシーを可能にすることを示しています。

要約(オリジナル)

This paper proposes a novel alternative to existing sim-to-real methods for training control policies with simulated experiences. Prior sim-to-real methods for legged robots mostly rely on the domain randomization approach, where a fixed finite set of simulation parameters is randomized during training. Instead, our method adds state-dependent perturbations to the input joint torque used for forward simulation during the training phase. These state-dependent perturbations are designed to simulate a broader range of reality gaps than those captured by randomizing a fixed set of simulation parameters. Experimental results show that our method enables humanoid locomotion policies that achieve greater robustness against complex reality gaps unseen in the training domain.

arxiv情報

著者 Woohyun Cha,Junhyeok Cha,Jaeyong Shin,Donghyeon Kim,Jaeheung Park
発行日 2025-04-09 05:25:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection はコメントを受け付けていません

Optimal Sensor Placement Using Combinations of Hybrid Measurements for Source Localization

要約

このホワイトペーパーでは、到着時間差(TDOA)、受信した副強度(RSS)、到着角(AOA)、および到着時間(TOA)測定など、測定のさまざまな組み合わせを使用した静的ソースのローカリゼーションに焦点を当てています。
センサーソースのジオメトリはローカリゼーションの精度に大きく影響するため、最適なセンサー配置の戦略は、ハイブリッド測定の組み合わせを使用して体系的に提案されます。
第一に、センサーの配置とソースの推定精度との関係は、導出されたcram \ ‘er-raoバウンド(CRB)によって策定されます。
第二に、a-optimality基準、つまりCRBのトレースを最小化することが選択され、統一された方法で最小の到達可能な推定平均二乗エラー(MSE)を計算します。
第三に、最適なセンサー配置戦略が開発され、最適な推定バウンドを実現します。
具体的には、特定の測定、つまりTDOA、AOA、RSS、およびTOAによって推定される最適な形状の特定の制約が見つかり、理論的に議論されます。
最後に、新しい調査結果はシミュレーション研究によって検証されます。

要約(オリジナル)

This paper focuses on static source localization employing different combinations of measurements, including time-difference-of-arrival (TDOA), received-signal-strength (RSS), angle-of-arrival (AOA), and time-of-arrival (TOA) measurements. Since sensor-source geometry significantly impacts localization accuracy, the strategies of optimal sensor placement are proposed systematically using combinations of hybrid measurements. Firstly, the relationship between sensor placement and source estimation accuracy is formulated by a derived Cram\’er-Rao bound (CRB). Secondly, the A-optimality criterion, i.e., minimizing the trace of the CRB, is selected to calculate the smallest reachable estimation mean-squared-error (MSE) in a unified manner. Thirdly, the optimal sensor placement strategies are developed to achieve the optimal estimation bound. Specifically, the specific constraints of the optimal geometries deduced by specific measurement, i.e., TDOA, AOA, RSS, and TOA, are found and discussed theoretically. Finally, the new findings are verified by simulation studies.

arxiv情報

著者 Kang Tang,Sheng Xu,Yuqi Yang,He Kong,Yongsheng Ma
発行日 2025-04-09 05:41:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | Optimal Sensor Placement Using Combinations of Hybrid Measurements for Source Localization はコメントを受け付けていません

A Multi-Modal Interaction Framework for Efficient Human-Robot Collaborative Shelf Picking

要約

倉庫などの人間中心の環境でのサービスロボットの存在の増加には、シームレスで直感的な人間のロボットコラボレーションが必要です。
このペーパーでは、マルチモーダルの相互作用、物理ベースの推論、および強化された人間ロボットチームワークのためのタスク部門を組み合わせた共同シェルフピッキングフレームワークを提案します。
このフレームワークにより、ロボットは人間のポインティングジェスチャーを認識し、口頭の手がかりと音声コマンドを解釈し、視覚的および聴覚フィードバックを通じて通信できます。
さらに、それは、棚の散らかった箱のスタック、サブタスク生成の関係グラフ、抽出シーケンスの計画、意思決定のための、思考のチェーン(COT)と物理ベースのシミュレーションエンジンを利用する大規模な言語モデル(LLM)と物理ベースのシミュレーションエンジンを搭載しています。
さらに、1)ジェスチャー誘導ボックス抽出、2)共同棚のクリアリング、3)共同安定性支援などの実験的な実験を通じて、フレームワークを検証します。

要約(オリジナル)

The growing presence of service robots in human-centric environments, such as warehouses, demands seamless and intuitive human-robot collaboration. In this paper, we propose a collaborative shelf-picking framework that combines multimodal interaction, physics-based reasoning, and task division for enhanced human-robot teamwork. The framework enables the robot to recognize human pointing gestures, interpret verbal cues and voice commands, and communicate through visual and auditory feedback. Moreover, it is powered by a Large Language Model (LLM) which utilizes Chain of Thought (CoT) and a physics-based simulation engine for safely retrieving cluttered stacks of boxes on shelves, relationship graph for sub-task generation, extraction sequence planning and decision making. Furthermore, we validate the framework through real-world shelf picking experiments such as 1) Gesture-Guided Box Extraction, 2) Collaborative Shelf Clearing and 3) Collaborative Stability Assistance.

arxiv情報

著者 Abhinav Pathak,Kalaichelvi Venkatesan,Tarek Taha,Rajkumar Muthusamy
発行日 2025-04-09 05:42:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | A Multi-Modal Interaction Framework for Efficient Human-Robot Collaborative Shelf Picking はコメントを受け付けていません

Overcoming Dynamic Environments: A Hybrid Approach to Motion Planning for Manipulators

要約

動的で不確実な環境で動作するロボットマニピュレーターは、滑らかな軌跡を維持しながら障害物をナビゲートするために効率的なモーション計画を必要とします。
速度ポテンシャルフィールド(VPF)プランナーは、リアルタイムの適応性を提供しますが、複雑な制約と局所的な最小値と闘い、散らかったスペースで最適ではないパフォーマンスにつながります。
従来のアプローチは、事前に計画された軌跡に依存していますが、頻繁な再構成は計算的に高価です。
この研究では、改良されたVPFをサンプリングベースのモーションプランナー(SBMP)と統合するハイブリッドモーション計画アプローチを提案しています。
SBMPは最適なパス生成を保証し、VPFは動的障害物にリアルタイムの適応性を提供します。
この組み合わせは、運動計画の効率、安定性、および計算の実現可能性を高め、倉庫や外科ロボット工学などの不確実な環境で重要な課題に対処します。

要約(オリジナル)

Robotic manipulators operating in dynamic and uncertain environments require efficient motion planning to navigate obstacles while maintaining smooth trajectories. Velocity Potential Field (VPF) planners offer real-time adaptability but struggle with complex constraints and local minima, leading to suboptimal performance in cluttered spaces. Traditional approaches rely on pre-planned trajectories, but frequent recomputation is computationally expensive. This study proposes a hybrid motion planning approach, integrating an improved VPF with a Sampling-Based Motion Planner (SBMP). The SBMP ensures optimal path generation, while VPF provides real-time adaptability to dynamic obstacles. This combination enhances motion planning efficiency, stability, and computational feasibility, addressing key challenges in uncertain environments such as warehousing and surgical robotics.

arxiv情報

著者 Ho Minh Quang Ngo,Dac Dang Khoa Nguyen,Dinh Tung Le,Gavin Paul
発行日 2025-04-09 05:46:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Overcoming Dynamic Environments: A Hybrid Approach to Motion Planning for Manipulators はコメントを受け付けていません