LimSim Series: An Autonomous Driving Simulation Platform for Validation and Enhancement

要約

閉ループシミュレーション環境は、自律運転システム(ADS)の検証と強化において重要な役割を果たします。
ただし、シミュレーションの精度と期間のバランスをとること、機能性と実用性の調整、包括的な評価メカニズムの確立など、特定の課題は重要な注意を払う必要があります。
このペーパーでは、これらの課題に対処し、ADSの迅速な展開と効率的な反復をサポートするために設計された包括的なシミュレーションプラットフォームであるLimsimシリーズを導入します。
LIMSIMシリーズは、ロードネットワークからのマルチタイプ情報を統合し、バックグラウンド車両の人間のような意思決定と計画アルゴリズムを採用し、関心分野(AOI)の概念を導入して計算リソースを最適化します。
このプラットフォームは、さまざまなベースラインアルゴリズムとユーザーフレンドリーなインターフェイスを提供し、複数の技術パイプラインの柔軟な検証を促進します。
さらに、Limsimシリーズには多次元評価メトリックが組み込まれており、システムパフォーマンスに関する徹底的な洞察を提供するため、研究者はさらなる改善のために問題を迅速に特定できます。
実験は、Limsimシリーズがモジュラー、エンドツーエンド、およびVLMベースの知識駆動型システムと互換性があることを示しています。
さまざまなシナリオでパフォーマンスを評価することにより、広告の反復と更新を支援できます。
Limsimシリーズのコードは、https://github.com/pjlab-adg/limsimでリリースされます。

要約(オリジナル)

Closed-loop simulation environments play a crucial role in the validation and enhancement of autonomous driving systems (ADS). However, certain challenges warrant significant attention, including balancing simulation accuracy with duration, reconciling functionality with practicality, and establishing comprehensive evaluation mechanisms. This paper addresses these challenges by introducing the LimSim Series, a comprehensive simulation platform designed to support the rapid deployment and efficient iteration of ADS. The LimSim Series integrates multi-type information from road networks, employs human-like decision-making and planning algorithms for background vehicles, and introduces the concept of the Area of Interest (AoI) to optimize computational resources. The platform offers a variety of baseline algorithms and user-friendly interfaces, facilitating flexible validation of multiple technical pipelines. Additionally, the LimSim Series incorporates multi-dimensional evaluation metrics, delivering thorough insights into system performance, thus enabling researchers to promptly identify issues for further improvements. Experiments demonstrate that the LimSim Series is compatible with modular, end-to-end, and VLM-based knowledge-driven systems. It can assist in the iteration and updating of ADS by evaluating performance across various scenarios. The code of the LimSim Series is released at: https://github.com/PJLab-ADG/LimSim.

arxiv情報

著者 Daocheng Fu,Naiting Zhong,Xu Han,Pinlong Cai,Licheng Wen,Song Mao,Botian Shi,Yu Qiao
発行日 2025-02-13 10:53:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LimSim Series: An Autonomous Driving Simulation Platform for Validation and Enhancement はコメントを受け付けていません

Predicting Safety Misbehaviours in Autonomous Driving Systems using Uncertainty Quantification

要約

予期しない状況の自動リアルタイム認識は、特にサポートされていない予測不可能なシナリオで、自律車の安全性に重要な役割を果たします。
このペーパーでは、システムレベルのシミュレーションベースのテスト中に、安全性が批判的な不正行為の予測テストのために、ディープラーニングドメインからのさまざまなベイズの不確実性定量化方法を評価します。
具体的には、高い不確実性スコアは、故障を引き起こす運転行動と安全性を区別するために使用できるサポートされていないランタイム条件を示しているという直感に続いて、車両の実行時に不確実性スコアを計算します。
私たちの研究では、2つのベイジアンの不確実性定量化方法、つまりMc-Dropoutと深いアンサンブルに関連する有効性と計算オーバーヘッドの評価を実施しました。
全体として、突然変異テストを介して導入された分散療法と安全でない条件の両方を含むUdacityシミュレーターからの3つのベンチマークでは、両方の方法が、2つの状態を前払いし、数秒前に早期警告を提供する多数の方法を検出し、2つの状態を上回ることに成功しました。
有効性と効率性の観点から、自動エンコーダーと注意マップに基づくOF-The Artの不正行為予測方法。
特に、ディープアンサンブルは、誤報なしでほとんどの不正行為を検出し、比較的少数のモデルを使用しても、リアルタイム検出のために計算可能なモデルを使用してもそうしました。
我々の調査結果は、不確実性の定量化方法を組み込むことは、深いニューラルネットワークベースの自律車両にフェイルセーフメカニズムを構築するための実行可能なアプローチであることを示唆しています。

要約(オリジナル)

The automated real-time recognition of unexpected situations plays a crucial role in the safety of autonomous vehicles, especially in unsupported and unpredictable scenarios. This paper evaluates different Bayesian uncertainty quantification methods from the deep learning domain for the anticipatory testing of safety-critical misbehaviours during system-level simulation-based testing. Specifically, we compute uncertainty scores as the vehicle executes, following the intuition that high uncertainty scores are indicative of unsupported runtime conditions that can be used to distinguish safe from failure-inducing driving behaviors. In our study, we conducted an evaluation of the effectiveness and computational overhead associated with two Bayesian uncertainty quantification methods, namely MC- Dropout and Deep Ensembles, for misbehaviour avoidance. Overall, for three benchmarks from the Udacity simulator comprising both out-of-distribution and unsafe conditions introduced via mutation testing, both methods successfully detected a high number of out-of-bounds episodes providing early warnings several seconds in advance, outperforming two state-of-the-art misbehaviour prediction methods based on autoencoders and attention maps in terms of effectiveness and efficiency. Notably, Deep Ensembles detected most misbehaviours without any false alarms and did so even when employing a relatively small number of models, making them computationally feasible for real-time detection. Our findings suggest that incorporating uncertainty quantification methods is a viable approach for building fail-safe mechanisms in deep neural network-based autonomous vehicles.

arxiv情報

著者 Ruben Grewal,Paolo Tonella,Andrea Stocco
発行日 2025-02-13 11:09:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SE | Predicting Safety Misbehaviours in Autonomous Driving Systems using Uncertainty Quantification はコメントを受け付けていません

A Machine Learning Approach to Sensor Substitution for Non-Prehensile Manipulation

要約

モバイルマニピュレーターは、複雑な環境でますます展開されており、周囲との相互作用を認識して相互作用させるために多様なセンサーが必要です。
ただし、すべてのロボットに可能なあらゆるセンサーを装備することは、コストと物理的な制約のために非現実的であることがよくあります。
異なるセンサー機能を備えたロボットが同様のタスクをコラボレーションまたは実行する必要がある場合、重大な課題が生じます。
たとえば、高解像度の触覚皮膚を装備したモバイルマニピュレーターが、プッシュなどの非摂食操作タスクに熟練しているシナリオを考えてみましょう。
このロボットをそのような触覚センシングを欠くロボットに交換または拡張する必要がある場合、学習した操作ポリシーは適用できなくなります。
このペーパーでは、非摂食操作におけるセンサー置換の問題に対処します。
限られたセンサーセット(LIDARやRGB-Dカメラなど)を備えたロボットを可能にする新しい機械学習ベースのフレームワークを提案して、以前はより豊富なセンサースイート(触覚スキンなど)に依存していたタスクを効果的に実行できます。
私たちのアプローチは、利用可能なセンサーデータと、置換センサーによって提供される情報との間のマッピングを学び、欠落している感覚入力を効果的に合成します。
具体的には、モバイルマニピュレーターを使用して非摂取性プッシュのタスクに触覚皮膚データを置き換えるモデルをトレーニングすることにより、フレームワークの有効性を実証します。
LidarまたはRGB-Dのみを装備したマニピュレーターは、トレーニング後、直接的な触覚フィードバックを利用してモバイルベースのパフォーマンスを同等にし、時にはさらに良くプッシュすることができることを示します。

要約(オリジナル)

Mobile manipulators are increasingly deployed in complex environments, requiring diverse sensors to perceive and interact with their surroundings. However, equipping every robot with every possible sensor is often impractical due to cost and physical constraints. A critical challenge arises when robots with differing sensor capabilities need to collaborate or perform similar tasks. For example, consider a scenario where a mobile manipulator equipped with high-resolution tactile skin is skilled at non-prehensile manipulation tasks like pushing. If this robot needs to be replaced or augmented by a robot lacking such tactile sensing, the learned manipulation policies become inapplicable. This paper addresses the problem of sensor substitution in non-prehensile manipulation. We propose a novel machine learning-based framework that enables a robot with a limited sensor set (e.g., LiDAR or RGB-D camera) to effectively perform tasks previously reliant on a richer sensor suite (e.g., tactile skin). Our approach learns a mapping between the available sensor data and the information provided by the substituted sensor, effectively synthesizing the missing sensory input. Specifically, we demonstrate the efficacy of our framework by training a model to substitute tactile skin data for the task of non-prehensile pushing using a mobile manipulator. We show that a manipulator equipped only with LiDAR or RGB-D can, after training, achieve comparable and sometimes even better pushing performance to a mobile base utilizing direct tactile feedback.

arxiv情報

著者 Idil Ozdamar,Doganay Sirintuna,Arash Ajoudani
発行日 2025-02-13 11:15:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Machine Learning Approach to Sensor Substitution for Non-Prehensile Manipulation はコメントを受け付けていません

LCSim: A Large-Scale Controllable Traffic Simulator

要約

都市輸送の急速な成長と自律運転の継続的な進歩により、自律運転アルゴリズムの堅牢なベンチマークの需要が浮上し、多様な車両駆動スタイルを備えた大規模な都市交通シナリオの正確なモデリングを求めています。
SUMOなどの従来のトラフィックシミュレーターは、多くの場合、手作りのシナリオとルールベースのモデルに依存します。このモデルでは、車両のアクションが速度調整とレーンの変更に限定されているため、現実的な交通環境を作成することが困難です。
近年、現実世界のトラフィックシナリオデータセットが自律運転の進歩とともに開発され、データ駆動型シミュレーターと学習ベースのシミュレーション方法の台頭が促進されています。
ただし、現在のデータ駆動型シミュレーターは、依存しているデータセット内のトラフィックシナリオと運転スタイルの複製に制限されていることが多く、現実世界で観察されるマルチスタイルの運転行動をモデル化する能力を制限します。
大規模な制御可能なトラフィックシミュレーターである\ textit {lcsim}を提案します。
まず、トラフィックシナリオの統一データ形式を定義し、複数のデータソースからそれらを構築するツールを提供し、大規模なトラフィックシミュレーションを可能にします。
さらに、拡散ベースの車両モーションプランナーをLCSIMに統合して、現実的で多様な車両モデリングを促進します。
特定のガイダンスの下で、これにより、さまざまな運転スタイルを反映するトラフィックシナリオの作成が可能になります。
これらの機能を活用するLCSIMは、大規模で現実的で制御可能な仮想トラフィック環境を提供できます。
コードとデモはhttps://tsinghua-fib-lab.github.io/lcsimで入手できます。

要約(オリジナル)

With the rapid growth of urban transportation and the continuous progress in autonomous driving, a demand for robust benchmarking autonomous driving algorithms has emerged, calling for accurate modeling of large-scale urban traffic scenarios with diverse vehicle driving styles. Traditional traffic simulators, such as SUMO, often depend on hand-crafted scenarios and rule-based models, where vehicle actions are limited to speed adjustment and lane changes, making it difficult for them to create realistic traffic environments. In recent years, real-world traffic scenario datasets have been developed alongside advancements in autonomous driving, facilitating the rise of data-driven simulators and learning-based simulation methods. However, current data-driven simulators are often restricted to replicating the traffic scenarios and driving styles within the datasets they rely on, limiting their ability to model multi-style driving behaviors observed in the real world. We propose \textit{LCSim}, a large-scale controllable traffic simulator. First, we define a unified data format for traffic scenarios and provide tools to construct them from multiple data sources, enabling large-scale traffic simulation. Furthermore, we integrate a diffusion-based vehicle motion planner into LCSim to facilitate realistic and diverse vehicle modeling. Under specific guidance, this allows for the creation of traffic scenarios that reflect various driving styles. Leveraging these features, LCSim can provide large-scale, realistic, and controllable virtual traffic environments. Codes and demos are available at https://tsinghua-fib-lab.github.io/LCSim.

arxiv情報

著者 Yuheng Zhang,Tianjian Ouyang,Fudan Yu,Lei Qiao,Wei Wu,Jingtao Ding,Jian Yuan,Yong Li
発行日 2025-02-13 11:24:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LCSim: A Large-Scale Controllable Traffic Simulator はコメントを受け付けていません

OpenBench: A New Benchmark and Baseline for Semantic Navigation in Smart Logistics

要約

Smart Logisticsでの効率的なラストマイル配信の需要の増加は、運用効率を高め、コストを削減する上での自律的なロボットの役割を強調しています。
高精度マップに依存する従来のナビゲーション方法はリソース集約型ですが、学習ベースのアプローチは多くの場合、実際のシナリオで一般化に苦労しています。
これらの課題に対処するために、この作業は、基礎モデルとスケーラブルな屋外ナビゲーションのための古典的なアルゴリズムを組み合わせたOpenStreetMapが強化したオープンエアセマンティックナビゲーション(OPEN)システムを提案します。
このシステムは、柔軟なマップ表現に既製のOpenStreetMap(OSM)を使用して、広範な事前マッピングの取り組みの必要性を排除します。
また、大規模な言語モデル(LLM)を採用して、グローバルローカリゼーション、マップ更新、およびハウス番号認識のために配信指示とビジョン言語モデル(VLM)を理解します。
ラストマイル配信の評価に不十分な既存のベンチマークの制限を補うために、この作業は、自律配信システムが直面する現実世界の課題を反映した、住宅地での屋外ナビゲーションのために特別に設計された新しいベンチマークを導入します。
シミュレートされた現実世界環境での広範な実験は、ナビゲーションの効率と信頼性の向上における提案されたシステムの有効性を示しています。
さらなる研究を促進するために、私たちのコードとベンチマークは公開されています。

要約(オリジナル)

The increasing demand for efficient last-mile delivery in smart logistics underscores the role of autonomous robots in enhancing operational efficiency and reducing costs. Traditional navigation methods, which depend on high-precision maps, are resource-intensive, while learning-based approaches often struggle with generalization in real-world scenarios. To address these challenges, this work proposes the Openstreetmap-enhanced oPen-air sEmantic Navigation (OPEN) system that combines foundation models with classic algorithms for scalable outdoor navigation. The system uses off-the-shelf OpenStreetMap (OSM) for flexible map representation, thereby eliminating the need for extensive pre-mapping efforts. It also employs Large Language Models (LLMs) to comprehend delivery instructions and Vision-Language Models (VLMs) for global localization, map updates, and house number recognition. To compensate the limitations of existing benchmarks that are inadequate for assessing last-mile delivery, this work introduces a new benchmark specifically designed for outdoor navigation in residential areas, reflecting the real-world challenges faced by autonomous delivery systems. Extensive experiments in simulated and real-world environments demonstrate the proposed system’s efficacy in enhancing navigation efficiency and reliability. To facilitate further research, our code and benchmark are publicly available.

arxiv情報

著者 Junhui Wang,Dongjie Huo,Zehui Xu,Yongliang Shi,Yimin Yan,Yuanxin Wang,Chao Gao,Yan Qiao,Guyue Zhou
発行日 2025-02-13 11:55:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | OpenBench: A New Benchmark and Baseline for Semantic Navigation in Smart Logistics はコメントを受け付けていません

Safety Evaluation of Human Arm Operations Using IMU Sensors with a Spring-Damper-Mass Predictive Model

要約

このホワイトペーパーでは、予測安全モデル(PSM)と統合された手首に取り付けられた慣性測定ユニット(IMU)システムを介して、人間とロボットの共同製造環境におけるリアルタイムの安全性監視に対する新しいアプローチを紹介します。
提案されたシステムは、インピーダンスベースの計算を通じて確率的安全評価を採用して、手首の動きに特化したスプリングダンパーマスモデルの適応を通じて以前のPSM実装を拡張します。
包括的な比較分析を通じて定量的な安全性のしきい値を確立するために、周波数ドメイン法で提案されたインピーダンスベースの安全アプローチを分析します。
3つの製造タスクにわたる実験的検証 – ツール操作、目視検査、およびピックアンドプレイス操作。
結果は、最適化されたパラメーター選択を通じて計算効率を維持しながら、多様な製造シナリオ全体で堅牢なパフォーマンスを示しています。
この作業は、人間とロボットの共同製造環境のリアルタイムでの適応リスク評価における将来の開発の基盤を確立しています。

要約(オリジナル)

This paper presents a novel approach to real-time safety monitoring in human-robot collaborative manufacturing environments through a wrist-mounted Inertial Measurement Unit (IMU) system integrated with a Predictive Safety Model (PSM). The proposed system extends previous PSM implementations through the adaptation of a spring-damper-mass model specifically optimized for wrist motions, employing probabilistic safety assessment through impedance-based computations. We analyze our proposed impedance-based safety approach with frequency domain methods, establishing quantitative safety thresholds through comprehensive comparative analysis. Experimental validation across three manufacturing tasks – tool manipulation, visual inspection, and pick-and-place operations. Results show robust performance across diverse manufacturing scenarios while maintaining computational efficiency through optimized parameter selection. This work establishes a foundation for future developments in adaptive risk assessment in real-time for human-robot collaborative manufacturing environments.

arxiv情報

著者 Musab Zubair Inamdar,Seyed Amir Tafrishi
発行日 2025-02-13 11:57:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Safety Evaluation of Human Arm Operations Using IMU Sensors with a Spring-Damper-Mass Predictive Model はコメントを受け付けていません

Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulations for Time-Efficient Fine-Resolution Policy Learning

要約

土工と建設では、掘削機はしばしばさまざまな土壌条件と混合した大きな岩に遭遇し、熟練したオペレーターを必要とします。
このホワイトペーパーでは、Rock Excavation Simulatorを介して強化学習(RL)を使用して自律的な掘削を達成するためのフレームワークを紹介します。
シミュレーションでは、分解能は、土壌空間全体の粒子サイズ/数によって定義できます。
微小解像度シミュレーションは実際の動作を密接に模倣していますが、重要な計算時間と挑戦的なサンプル収集を必要としますが、粗解像度シミュレーションはより速いサンプル収集を可能にしますが、実際の動作から逸脱します。
両方の解像度の利点を組み合わせるために、微細解像度シミュレーションでの事前トレーニングのために粗い解像度シミュレーションで開発されたポリシーを使用して検討します。
この目的のために、私たちは、進歩的解像度政策蒸留(PRPD)と呼ばれる新しい政策学習フレームワークを提案します。これは、ポリシーの障害につながる可能性のあるドメインのギャップを回避するために、いくつかの中央分解シミュレーションを介して保守的な政策転送を介して徐々にポリシーを転送します。
ロック掘削シミュレーターと9つの実世界の岩環境での検証は、PRPDがサンプリング時間を1/7未満に短縮し、タスクの成功率を微細解像度シミュレーションでポリシー学習を通じて達成したものに匹敵することを実証しました。

要約(オリジナル)

In earthwork and construction, excavators often encounter large rocks mixed with various soil conditions, requiring skilled operators. This paper presents a framework for achieving autonomous excavation using reinforcement learning (RL) through a rock excavation simulator. In the simulation, resolution can be defined by the particle size/number in the whole soil space. Fine-resolution simulations closely mimic real-world behavior but demand significant calculation time and challenging sample collection, while coarse-resolution simulations enable faster sample collection but deviate from real-world behavior. To combine the advantages of both resolutions, we explore using policies developed in coarse-resolution simulations for pre-training in fine-resolution simulations. To this end, we propose a novel policy learning framework called Progressive-Resolution Policy Distillation (PRPD), which progressively transfers policies through some middle-resolution simulations with conservative policy transfer to avoid domain gaps that could lead to policy transfer failure. Validation in a rock excavation simulator and nine real-world rock environments demonstrated that PRPD reduced sampling time to less than 1/7 while maintaining task success rates comparable to those achieved through policy learning in a fine-resolution simulation.

arxiv情報

著者 Yuki Kadokawa,Hirotaka Tahara,Takamitsu Matsubara
発行日 2025-02-13 12:06:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulations for Time-Efficient Fine-Resolution Policy Learning はコメントを受け付けていません

GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation

要約

具体化された人工知能の急速な発展に伴い、一般的なロボットの意思決定のための視覚言語行動(VLA)モデルが大幅に進歩しました。
ただし、既存のVLAの大部分は、展開中に遭遇する避けられない外部摂動を説明できません。
これらの摂動により、予期せぬ状態情報がVLAに導入され、その結果、不正確なアクションが発生し、その結果、一般化パフォーマンスが大幅に減少します。
古典的な内部モデルコントロール(IMC)原理は、外部入力信号を含む内部モデルを備えた閉ループシステムが参照入力を正確に追跡し、妨害を効果的に相殺できることを示しています。
IMCの原理を統合してロボットの視覚操作の堅牢性を高める新しい閉ループループVLAメソッドGevrmを提案します。
GEVRMのテキスト誘導ビデオ生成モデルは、非常に表現力のある将来の視覚計画の目標を生み出すことができます。
同時に、内部埋め込みと呼ばれる応答をシミュレートすることにより、摂動を評価し、プロトタイプの対照学習を通じて最適化されます。
これにより、モデルは摂動を外部環境と暗黙的に推測し、区別することができます。
提案されているGEVRMは、標準と摂動の両方のカルビンベンチマークの両方で最先端のパフォーマンスを達成し、現実的なロボットタスクの大幅な改善を示しています。

要約(オリジナル)

With the rapid development of embodied artificial intelligence, significant progress has been made in vision-language-action (VLA) models for general robot decision-making. However, the majority of existing VLAs fail to account for the inevitable external perturbations encountered during deployment. These perturbations introduce unforeseen state information to the VLA, resulting in inaccurate actions and consequently, a significant decline in generalization performance. The classic internal model control (IMC) principle demonstrates that a closed-loop system with an internal model that includes external input signals can accurately track the reference input and effectively offset the disturbance. We propose a novel closed-loop VLA method GEVRM that integrates the IMC principle to enhance the robustness of robot visual manipulation. The text-guided video generation model in GEVRM can generate highly expressive future visual planning goals. Simultaneously, we evaluate perturbations by simulating responses, which are called internal embeddings and optimized through prototype contrastive learning. This allows the model to implicitly infer and distinguish perturbations from the external environment. The proposed GEVRM achieves state-of-the-art performance on both standard and perturbed CALVIN benchmarks and shows significant improvements in realistic robot tasks.

arxiv情報

著者 Hongyin Zhang,Pengxiang Ding,Shangke Lyu,Ying Peng,Donglin Wang
発行日 2025-02-13 12:29:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation はコメントを受け付けていません

Moving Matter: Efficient Reconfiguration of Tile Arrangements by a Single Active Robot

要約

パッシブビルディングブロックの2次元接続グリッド配置を開始構成から目標構成まで再構成する問題を検討します。
残りの構成を歩くことによる新しい位置。
目的は、タイルの構成が接続されたままであることを保証しながら、全体的なMASMSPANを最小限に抑える再構成スケジュールを決定することです。
否定的な結果と肯定的な結果の両方を提供します。
(1)タイルの有無にかかわらず移動するための加重コストによってパラメーター化された問題の一般化バージョンを提示し、これがNP完全であることを示します。
(2)分離開始ボックスとターゲット境界ボックスの場合の多項式時間定数係数近似アルゴリズムを指定します。
さらに、このアプローチは、2スケールのインスタンスで最適なキャリー距離をもたらします。

要約(オリジナル)

We consider the problem of reconfiguring a two-dimensional connected grid arrangement of passive building blocks from a start configuration to a goal configuration, using a single active robot that can move on the tiles, remove individual tiles from a given location and physically move them to a new position by walking on the remaining configuration. The objective is to determine a reconfiguration schedule that minimizes the overall makespan, while ensuring that the tile configuration remains connected. We provide both negative and positive results. (1) We present a generalized version of the problem, parameterized by weighted costs for moving with or without tiles, and show that this is NP-complete. (2) We give a polynomial-time constant-factor approximation algorithm for the case of disjoint start and target bounding boxes. In addition, our approach yields optimal carry distance for 2-scaled instances.

arxiv情報

著者 Aaron T. Becker,Sándor P. Fekete,Jonas Friemel,Ramin Kosfeld,Peter Kramer,Harm Kube,Christian Rieck,Christian Scheffer,Arne Schmidt
発行日 2025-02-13 13:13:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CG, cs.DS, cs.RO, F.2.2 | Moving Matter: Efficient Reconfiguration of Tile Arrangements by a Single Active Robot はコメントを受け付けていません

A Deep Inverse-Mapping Model for a Flapping Robotic Wing

要約

システム制御では、システムのダイナミクスは、その入力を変調して望ましい結果を達成することによって支配されます。
たとえば、Quad-Copter Propellerの推力を制御するために、コントローラーは回転速度を変調し、入力回転速度と結果として生じるスラストの間の簡単なマッピングに依存します。
このマッピングは、目的の推力を生成するために必要な回転速度を決定するために反転させることができます。
ただし、複雑な流体運動が関与する羽ばたき翼ロボットなどの複雑なシステムでは、結果(翼の運動学)を結果(空力力学的力)にマッピングすることは非些細であり、リアルタイムコントロールのためのこのマッピングは計算的に非実施的です。
ここでは、開発した実験システムのデータに基づいて、フラッピングウィングシステムの逆マッピングのための機械学習ソリューションを報告します。
私たちのモデルは、目的の空力力の結果を生成するために必要な入力翼の動きを学習します。
タイムシリーズデータに合わせたシーケンスからシーケンスモデルを使用し、周波数領域で表現学習を実装する新しい適応型スペクトル層で拡張しました。
モデルをトレーニングするために、高速カメラを使用して翼の空力とその3Dモーションを同時に測定する羽ばたき翼システムを開発しました。
別のフローレジームで羽ばたき翼の追加のオープンソースデータセットでシステムのパフォーマンスを示します。
結果は、より複雑な最先端の変圧器ベースのモデルと比較して優れた性能を示し、テストデータセットの中央値損失を11%改善します。
さらに、私たちのモデルは優れた推論時間を示しており、オンボードロボット制御に実用的です。
当社のオープンソースデータとフレームワークは、生体模倣ロボットから生物医学デバイスまで、複雑なダイナミクスによって支配されたシステムのモデリングとリアルタイムの制御を改善する可能性があります。

要約(オリジナル)

In systems control, the dynamics of a system are governed by modulating its inputs to achieve a desired outcome. For example, to control the thrust of a quad-copter propeller the controller modulates its rotation rate, relying on a straightforward mapping between the input rotation rate and the resulting thrust. This mapping can be inverted to determine the rotation rate needed to generate a desired thrust. However, in complex systems, such as flapping-wing robots where intricate fluid motions are involved, mapping inputs (wing kinematics) to outcomes (aerodynamic forces) is nontrivial and inverting this mapping for real-time control is computationally impractical. Here, we report a machine-learning solution for the inverse mapping of a flapping-wing system based on data from an experimental system we have developed. Our model learns the input wing motion required to generate a desired aerodynamic force outcome. We used a sequence-to-sequence model tailored for time-series data and augmented it with a novel adaptive-spectrum layer that implements representation learning in the frequency domain. To train our model, we developed a flapping wing system that simultaneously measures the wing’s aerodynamic force and its 3D motion using high-speed cameras. We demonstrate the performance of our system on an additional open-source dataset of a flapping wing in a different flow regime. Results show superior performance compared with more complex state-of-the-art transformer-based models, with 11% improvement on the test datasets median loss. Moreover, our model shows superior inference time, making it practical for onboard robotic control. Our open-source data and framework may improve modeling and real-time control of systems governed by complex dynamics, from biomimetic robots to biomedical devices.

arxiv情報

著者 Hadar Sharvit,Raz Karl,Tsevi Beatus
発行日 2025-02-13 14:46:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | A Deep Inverse-Mapping Model for a Flapping Robotic Wing はコメントを受け付けていません