ENFORCE: Exact Nonlinear Constrained Learning with Adaptive-depth Neural Projection

要約

ニューラルネットワークがドメイン固有の制約に準拠することを保証することは、安全性と倫理的懸念に対処しながら予測精度を高めるために重要です。
ほとんどの現実世界のタスクの非線形性にもかかわらず、既存の方法は主にアフィンまたは凸の制約に限定されています。
非線形制約を正確に満たす予測を保証するニューラルネットワークアーキテクチャであるEnforceを紹介します。
Enforceは、標準の制約のないグラデーションベースのオプティマー(ADAMなど)でトレーニングされ、自己分化と局所的なニューラル予測を活用して、$ \ Mathcal {c}^1 $制約を任意の寛容$ \ epsilon $に施行します。
特定の問題と必要な許容レベルに合わせて複雑さを動的に調整する適応距離のあるニューラル投影(ADANP)モジュールを構築します。
Enforceは、最小(および調整可能な)計算コストで、ニューラルネットワークの出力と出力の両方で非線形の平等制約の満足度を保証します。

要約(オリジナル)

Ensuring neural networks adhere to domain-specific constraints is crucial for addressing safety and ethical concerns while also enhancing prediction accuracy. Despite the nonlinear nature of most real-world tasks, existing methods are predominantly limited to affine or convex constraints. We introduce ENFORCE, a neural network architecture that guarantees predictions to satisfy nonlinear constraints exactly. ENFORCE is trained with standard unconstrained gradient-based optimizers (e.g., Adam) and leverages autodifferentiation and local neural projections to enforce any $\mathcal{C}^1$ constraint to arbitrary tolerance $\epsilon$. We build an adaptive-depth neural projection (AdaNP) module that dynamically adjusts its complexity to suit the specific problem and the required tolerance levels. ENFORCE guarantees satisfaction of equality constraints that are nonlinear in both inputs and outputs of the neural network with minimal (and adjustable) computational cost.

arxiv情報

著者 Giacomo Lastrucci,Artur M. Schweidtmann
発行日 2025-02-11 18:54:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | ENFORCE: Exact Nonlinear Constrained Learning with Adaptive-depth Neural Projection はコメントを受け付けていません

ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms

要約

ユニットテストの生成は、LLMSの有望で重要なユースケースになっています。
ただし、LLMユニットテスト生成機能を評価するための既存の評価ベンチマークは、より実用的で挑戦的なプロジェクトレベルのコードベースではなく、機能またはクラスレベルのコードに焦点を当てています。
このような制限に対処するために、Python、Java、およびJavaScriptをカバーするユニットテスト生成のプロジェクトレベルのベンチマークであるProjectTestを提案します。
ProjectTestは、言語ごとに20の中程度のサイズの高品質のプロジェクトを備えています。
ProjectTestで9つのフロンティアLLMを評価し、結果は、PicthonとJavaのProjecttestで中程度のパフォーマンスを示し、ProjectTestの難易度を強調していることを示しています。
また、徹底的なエラー分析も実施します。これは、Claude-3.5-SonnetなどのフロンティアLLMでさえ、コンピレーションやカスケードエラーを含む重要な簡単なエラーがあることを示しています。
この観察に動機付けられて、エラー固定メカニズムを装備した場合の可能性を評価するために、手動のエラー固定シナリオと自己誤差固定シナリオの下ですべてのフロンティアLLMをさらに評価します。

要約(オリジナル)

Unit test generation has become a promising and important use case of LLMs. However, existing evaluation benchmarks for assessing LLM unit test generation capabilities focus on function- or class-level code rather than more practical and challenging project-level codebases. To address such limitation, we propose ProjectTest, a project-level benchmark for unit test generation covering Python, Java, and JavaScript. ProjectTest features 20 moderate-sized and high-quality projects per language. We evaluate nine frontier LLMs on ProjectTest and the results show that all frontier LLMs tested exhibit moderate performance on ProjectTest on Python and Java, highlighting the difficulty of ProjectTest. We also conduct a thorough error analysis, which shows that even frontier LLMs, such as Claude-3.5-Sonnet, have significant simple errors, including compilation and cascade errors. Motivated by this observation, we further evaluate all frontier LLMs under manual error-fixing and self-error-fixing scenarios to assess their potential when equipped with error-fixing mechanisms.

arxiv情報

著者 Yibo Wang,Congying Xia,Wenting Zhao,Jiangshu Du,Chunyu Miao,Zhongfen Deng,Philip S. Yu,Chen Xing
発行日 2025-02-11 15:48:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SE | ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms はコメントを受け付けていません

ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models

要約

目的:地球システムモデル(ESM)大気、海、陸地、氷、生物圏の相互作用を統合して、さまざまな条件下で地域および世界の気候の状態を推定します。
ESMは非常に複雑であるため、深いニューラルネットワークアーキテクチャを使用して複雑さをモデル化し、ダウンサンプリングデータを保存します。
このホワイトペーパーでは、ESMデータの単一画像SR(SR)再構成タスクを改善するために、Vision Transformer Sinusoidal表現ネットワーク(VISIR)を提案します。
方法:Visirは、SR視力変圧器(VIT)のSR能力を組み合わせて、SRタスクで観察されるスペクトルバイアスに対処するために、正弦波表現ネットワーク(SIREN)の高周波詳細保存を組み合わせています。
結果:VISIRは、3つの異なる測定で平均7.1dB PSNR緩衝されたSR世代敵(SRガン)、SR世代の敵対的(SR-Gans)を4.1 dB、7.5 dB、Sr世代の敵対的(SR-Gans)よりも優れています。
結論:提案されたVISIRが評価され、最先端の方法と比較されます。
結果は、提案されたアルゴリズムが平均平方根誤差(MSE)、ピークシグナルからノイズへの比例(PSNR)、および構造類似性指数測定(SSIM)の観点から他の方法を上回っていることを示しています。

要約(オリジナル)

Purpose: Earth system models (ESMs) integrate the interactions of the atmosphere, ocean, land, ice, and biosphere to estimate the state of regional and global climate under a wide variety of conditions. The ESMs are highly complex, and thus, deep neural network architectures are used to model the complexity and store the down-sampled data. In this paper, we propose the Vision Transformer Sinusoidal Representation Networks (ViSIR) to improve the single image SR (SR) reconstruction task for the ESM data. Methods: ViSIR combines the SR capability of Vision Transformers (ViT) with the high-frequency detail preservation of the Sinusoidal Representation Network (SIREN) to address the spectral bias observed in SR tasks. Results: The ViSIR outperforms ViT by 4.1 dB, SIREN by 7.5 dB, and SR-Generative Adversarial (SR-GANs) by 7.1dB PSNR on average for three different measurements. Conclusion: The proposed ViSIR is evaluated and compared with state-of-the-art methods. The results show that the proposed algorithm is outperforming other methods in terms of Mean Square Error(MSE), Peak-Signal-to-Noise-Ratio(PSNR), and Structural Similarity Index Measure(SSIM).

arxiv情報

著者 Ehsan Zeraatkar,Salah Faroughi,Jelena Tešić
発行日 2025-02-11 16:02:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models はコメントを受け付けていません

Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification

要約

Domain-Generalizable Redification(DG Reid)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインでのパフォーマンスを評価することを目指しています。
多数の方法が提案されていますが、ほとんどが差別的または対照的な学習フレームワークに依存して、一般化可能な機能表現を学習しています。
ただし、これらのアプローチは、ショートカット学習を軽減できず、最適ではないパフォーマンスにつながることがよくあります。
この作業では、DG Reidを強化するために、相関認識条件付けスキーム(DCAC)を使用した拡散モデル支援表現学習と呼ばれる新しい方法を提案します。
私たちの方法は、相関認識条件付けスキームを通じて、識別と対照的なReidモデルと事前に訓練された拡散モデルを統合します。
REIDモデルから生成されたID分類確率を、学習可能なIDワイズプロンプトのセットで組み込むことにより、コンディショニングスキームは、拡散プロセスをガイドするためにID相関をキャプチャする暗い知識を注入します。
同時に、拡散モデルからのフィードバックは、コンディショニングスキームを通じてREIDモデルに戻り、REID機能の一般化能力を効果的に改善します。
シングルソースとマルチソースの両方のDG Reidタスクの両方の広範な実験は、この方法が最先端のパフォーマンスを達成することを示しています。
包括的なアブレーション研究は、提案されたアプローチの有効性をさらに検証し、その堅牢性に関する洞察を提供します。
コードはhttps://github.com/rikoli/dcacで入手できます。

要約(オリジナル)

Domain-generalizable re-identification (DG Re-ID) aims to train a model on one or more source domains and evaluate its performance on unseen target domains, a task that has attracted growing attention due to its practical relevance. While numerous methods have been proposed, most rely on discriminative or contrastive learning frameworks to learn generalizable feature representations. However, these approaches often fail to mitigate shortcut learning, leading to suboptimal performance. In this work, we propose a novel method called diffusion model-assisted representation learning with a correlation-aware conditioning scheme (DCAC) to enhance DG Re-ID. Our method integrates a discriminative and contrastive Re-ID model with a pre-trained diffusion model through a correlation-aware conditioning scheme. By incorporating ID classification probabilities generated from the Re-ID model with a set of learnable ID-wise prompts, the conditioning scheme injects dark knowledge that captures ID correlations to guide the diffusion process. Simultaneously, feedback from the diffusion model is back-propagated through the conditioning scheme to the Re-ID model, effectively improving the generalization capability of Re-ID features. Extensive experiments on both single-source and multi-source DG Re-ID tasks demonstrate that our method achieves state-of-the-art performance. Comprehensive ablation studies further validate the effectiveness of the proposed approach, providing insights into its robustness. Codes will be available at https://github.com/RikoLi/DCAC.

arxiv情報

著者 Jiachen Li,Xiaojin Gong
発行日 2025-02-11 05:29:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification はコメントを受け付けていません

HEROES: Unreal Engine-based Human and Emergency Robot Operation Education System

要約

大規模な犠牲者事故(MCIS)のためのファーストレスポンダーと人道的ロボットのトレーニングと準備は、現実的で簡単にアクセス可能なテスト施設がないため、多くの場合課題となります。
このような施設は、最初の対応者と人道的ロボットのためにトレーニングと教育目的を果たすことができるMCIを投稿する現実的なシナリオを提供できますが、物流上の制約のためにアクセスするのは難しいことがよくあります。
この課題を克服するために、ヒーローズを紹介します。ヒーローは、そのような都市の捜索救助作戦のための人間と緊急ロボットの新しいトレーニングシミュレーションを設計するための多用途の非現実的なエンジンシミュレーターです。
提案されたHeroesシミュレーターは、ロボットナビゲーションのトレーニングに使用される機械学習パイプライン用の合成データセットを生成できます。
この作業は、ロボットコミュニティの包括的なトレーニングプラットフォームの必要性に対処し、実際の緊急シナリオの実用的で効率的な準備を確保しています。
私たちのシミュレーターの強みは、その適応性、スケーラビリティ、およびロボット開発者とファーストレスポンダー間のコラボレーションを促進する能力にあり、MCISの捜索救助運用のための効果的な戦略を開発する際の相乗効果を促進します。
ヒーローが十分に多様な環境を生成する能力をサポートする81%の肯定的な応答と、ヒーローのシミュレーション環境の有用性を確認する78%の肯定的な応答をサポートする予備ユーザー調査を実施しました。

要約(オリジナル)

Training and preparing first responders and humanitarian robots for Mass Casualty Incidents (MCIs) often poses a challenge owing to the lack of realistic and easily accessible test facilities. While such facilities can offer realistic scenarios post an MCI that can serve training and educational purposes for first responders and humanitarian robots, they are often hard to access owing to logistical constraints. To overcome this challenge, we present HEROES- a versatile Unreal Engine simulator for designing novel training simulations for humans and emergency robots for such urban search and rescue operations. The proposed HEROES simulator is capable of generating synthetic datasets for machine learning pipelines that are used for training robot navigation. This work addresses the necessity for a comprehensive training platform in the robotics community, ensuring pragmatic and efficient preparation for real-world emergency scenarios. The strengths of our simulator lie in its adaptability, scalability, and ability to facilitate collaboration between robot developers and first responders, fostering synergy in developing effective strategies for search and rescue operations in MCIs. We conducted a preliminary user study with an 81% positive response supporting the ability of HEROES to generate sufficiently varied environments, and a 78% positive response affirming the usefulness of the simulation environment of HEROES.

arxiv情報

著者 Anav Chaudhary,Kshitij Tiwari,Aniket Bera
発行日 2025-02-10 17:16:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | HEROES: Unreal Engine-based Human and Emergency Robot Operation Education System はコメントを受け付けていません

Multispectral Indices for Wildfire Management

要約

山火事の頻度と重症度の増加には、効果的な監視と管理のための高度な方法が必要です。
従来の地上観察技術は、急速に変化する火災行動と環境条件に適応するのに苦労しています。
このホワイトペーパーでは、野火管理におけるマルチスペクトル空中および衛星画像の適用を検証し、可燃性植生や水の特徴などの山火事行動に影響を与える重要な要因の識別と分析を強調します。
現在の文献の包括的なレビューと2つの実用的なケーススタディの提示により、さまざまな多宇宙指数を評価し、山火事の予防と管理に不可欠な重要な環境属性を抽出する際の有効性を評価します。
私たちのケーススタディは、セグメンテーションと抽出に特に効果的ないくつかの指標を強調しています。植生用のNVDI、水の特徴のためのMNDWI、および人工構造のMSRです。
これらのインデックスは、山火事データ処理を大幅に強化し、それにより監視戦略と対応戦略の改善をサポートします。

要約(オリジナル)

The increasing frequency and severity of wildfires requires advanced methods for effective surveillance and management. Traditional ground-based observation techniques often struggle to adapt to rapidly changing fire behavior and environmental conditions. This paper examines the application of multispectral aerial and satellite imagery in wildfire management, emphasizing the identification and analysis of key factors influencing wildfire behavior, such as combustible vegetation and water features. Through a comprehensive review of current literature and the presentation of two practical case studies, we assess various multispectral indices and evaluate their effectiveness in extracting critical environmental attributes essential for wildfire prevention and management. Our case studies highlight several indices as particularly effective for segmentation and extraction: NVDI for vegetation, MNDWI for water features, and MSR for artificial structures. These indices significantly enhance wildfire data processing, thereby supporting improved monitoring and response strategies.

arxiv情報

著者 Afonso Oliveira,João P. Matos-Carvalho,Filipe Moutinho,Nuno Fachada
発行日 2025-02-10 16:05:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, I.2.10, physics.geo-ph | Multispectral Indices for Wildfire Management はコメントを受け付けていません

Diffusion-Based Planning for Autonomous Driving with Flexible Guidance

要約

複雑なオープンワールド環境で人間のような運転行動を達成することは、自律運転における重要な課題です。
模倣学習方法などの現代の学習ベースの計画アプローチは、競合する目標と安全保証の欠如のバランスをとるのに苦労しています。
事前定義されたルールを備えたフォールバック戦略。
閉ループ計画のための新しい変圧器ベースの拡散プランナーを提案します。これは、マルチモーダルの運転行動を効果的にモデル化し、ルールベースの改良なしで軌跡の品質を確保できます。
私たちのモデルは、同じアーキテクチャの下での予測タスクと計画タスクの両方の共同モデリングをサポートし、車両間の協力的な行動を可能にします。
さらに、軌道スコア関数の勾配を学び、柔軟な分類器ガイダンスメカニズムを採用することにより、拡散プランナーは安全で適応性のある計画行動を効果的に実現します。
大規模な現実世界の自律計画ベンチマークNuplanと新たに収集された200時間の配送車両駆動データセットの評価は、拡散プランナーが多様なドライビングスタイルで堅牢な転送可能性を備えた最先端のクローズドループパフォーマンスを達成することを示しています。

要約(オリジナル)

Achieving human-like driving behaviors in complex open-world environments is a critical challenge in autonomous driving. Contemporary learning-based planning approaches such as imitation learning methods often struggle to balance competing objectives and lack of safety assurance,due to limited adaptability and inadequacy in learning complex multi-modal behaviors commonly exhibited in human planning, not to mention their strong reliance on the fallback strategy with predefined rules. We propose a novel transformer-based Diffusion Planner for closed-loop planning, which can effectively model multi-modal driving behavior and ensure trajectory quality without any rule-based refinement. Our model supports joint modeling of both prediction and planning tasks under the same architecture, enabling cooperative behaviors between vehicles. Moreover, by learning the gradient of the trajectory score function and employing a flexible classifier guidance mechanism, Diffusion Planner effectively achieves safe and adaptable planning behaviors. Evaluations on the large-scale real-world autonomous planning benchmark nuPlan and our newly collected 200-hour delivery-vehicle driving dataset demonstrate that Diffusion Planner achieves state-of-the-art closed-loop performance with robust transferability in diverse driving styles.

arxiv情報

著者 Yinan Zheng,Ruiming Liang,Kexin Zheng,Jinliang Zheng,Liyuan Mao,Jianxiong Li,Weihao Gu,Rui Ai,Shengbo Eben Li,Xianyuan Zhan,Jingjing Liu
発行日 2025-02-09 16:37:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Diffusion-Based Planning for Autonomous Driving with Flexible Guidance はコメントを受け付けていません

Redefining Robot Generalization Through Interactive Intelligence

要約

大規模な機械学習における最近の進歩により、幅広いダウンストリームタスクに適応できる大容量の基礎モデルが生まれました。
このようなモデルはロボット工学に大きな期待を抱いていますが、一般的なパラダイムは、ロボットを依然として単一の自律的な意思決定者として描写し、操作やナビゲーションなどのタスクを実行し、人間の関与が限られています。
ただし、ウェアラブルロボット工学(補綴物、装具、エクソスケルトンなど)、テレオ操作、神経界面などの、実世界のロボットシステムの大規模なクラスは半自動化されており、人間のパートナーとの継続的なインタラクティブな調整が必要であり、単一エージェントの仮定に挑戦します。
このポジションペーパーでは、ロボットファンデーションモデルは、リアルタイムのヒューマンロボットの共適応の複雑さを処理するために、インタラクティブなマルチエージェントの視点に進化しなければならないと主張します。
4つのモジュールを含む一般化可能な神経科学にインスパイアされたアーキテクチャを提案します。(1)感覚運動統合原則によって通知されるマルチモーダルセンシングモジュール、(2)認知科学における関節型枠組みを連想させるアドホックチームワークモデル、(3)予測
運動制御の内部モデル理論に基づいた世界の信念モデル、および(4)ヘビアンと強化ベースの可塑性の概念をエコーするメモリ/フィードバックメカニズム。
ウェアラブルデバイスと人間の生理学が不可分に絡み合っているサイボーグシステムのレンズを通して示されていますが、提案されたフレームワークは、半自律的またはインタラクティブなコンテキストで動作するロボットに広く適用できます。
シングルエージェントデザインを超えて移動することにより、私たちの立場は、ロボット工学の基礎モデルが、より堅牢でパーソナライズされ、予測的なレベルのパフォーマンスをどのように達成できるかを強調しています。

要約(オリジナル)

Recent advances in large-scale machine learning have produced high-capacity foundation models capable of adapting to a broad array of downstream tasks. While such models hold great promise for robotics, the prevailing paradigm still portrays robots as single, autonomous decision-makers, performing tasks like manipulation and navigation, with limited human involvement. However, a large class of real-world robotic systems, including wearable robotics (e.g., prostheses, orthoses, exoskeletons), teleoperation, and neural interfaces, are semiautonomous, and require ongoing interactive coordination with human partners, challenging single-agent assumptions. In this position paper, we argue that robot foundation models must evolve to an interactive multi-agent perspective in order to handle the complexities of real-time human-robot co-adaptation. We propose a generalizable, neuroscience-inspired architecture encompassing four modules: (1) a multimodal sensing module informed by sensorimotor integration principles, (2) an ad-hoc teamwork model reminiscent of joint-action frameworks in cognitive science, (3) a predictive world belief model grounded in internal model theories of motor control, and (4) a memory/feedback mechanism that echoes concepts of Hebbian and reinforcement-based plasticity. Although illustrated through the lens of cyborg systems, where wearable devices and human physiology are inseparably intertwined, the proposed framework is broadly applicable to robots operating in semi-autonomous or interactive contexts. By moving beyond single-agent designs, our position emphasizes how foundation models in robotics can achieve a more robust, personalized, and anticipatory level of performance.

arxiv情報

著者 Sharmita Dey
発行日 2025-02-09 17:13:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Redefining Robot Generalization Through Interactive Intelligence はコメントを受け付けていません

Mechanic Modeling and Nonlinear Optimal Control of Actively Articulated Suspension of Mobile Heavy-Duty Manipulators

要約

このペーパーでは、積極的に明確なサスペンションを備えたモバイルヘビーデューティマニピュレーターの分析モデリングと、その静的および動的な安定化を最大化する最適な制御を紹介します。
ネジ理論形式を採用することにより、懸濁液メカニズムは、2つの閉じた運動系チェーンで構成される剛性マルチボディと見なします。
この機械的モデリングにより、プラットフォーム全体の空間慣性パラメーターを、明確な体慣性法を介したサスペンションの線形アクチュエーターの関数として計算できます。
私たちのソリューションは、モバイルマニピュレーターの質量の中心と慣性テンソルに正確なソリューションを提供することにより、ホイールの反応の正常力の計算精度を強化します。
さらに、これらの慣性パラメーターと正常な力を使用して、モバイルマニピュレーターの静的および動的安定性の両方のメトリックを定義し、そのようなメトリックを最適化してプラットフォームのオーバートーリングを防止する最適な安定性運動を生成する非線形プログラミング問題を定式化します。
アクチュエータは、ステートフィードバックの油圧バルブ制御で追跡されます。
7ホイールと積極的に明確なサスペンションを備えた7度の大量平行系列モバイルマニピュレーターをシミュレートすることにより、C ++計算速度、精度、パフォーマンスの改善の観点からの方法の効率を示します。

要約(オリジナル)

This paper presents the analytic modeling of mobile heavy-duty manipulators with actively articulated suspension and its optimal control to maximize its static and dynamic stabilization. By adopting the screw theory formalism, we consider the suspension mechanism as a rigid multibody composed of two closed kinematic chains. This mechanical modeling allows us to compute the spatial inertial parameters of the whole platform as a function of the suspension’s linear actuators through the articulated-body inertia method. Our solution enhances the computation accuracy of the wheels’ reaction normal forces by providing an exact solution for the center of mass and inertia tensor of the mobile manipulator. Moreover, these inertial parameters and the normal forces are used to define metrics of both static and dynamic stability of the mobile manipulator and formulate a nonlinear programming problem that optimizes such metrics to generate an optimal stability motion that prevents the platform’s overturning, such optimal position of the actuator is tracked with a state-feedback hydraulic valve control. We demonstrate our method’s efficiency in terms of C++ computational speed, accuracy and performance improvement by simulating a 7 degrees-of-freedom heavy-duty parallel-serial mobile manipulator with four wheels and actively articulated suspension.

arxiv情報

著者 Alvaro Paz,Jouni Mattila
発行日 2025-02-09 17:52:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Mechanic Modeling and Nonlinear Optimal Control of Actively Articulated Suspension of Mobile Heavy-Duty Manipulators はコメントを受け付けていません

Motion Control in Multi-Rotor Aerial Robots Using Deep Reinforcement Learning

要約

このペーパーでは、添加剤のドローン(AM)のモーションコントロールの課題に対処するために、ディープ補強材(DRL)学習の適用を調査します。
ドローンベースの添加剤製造は、大規模または危険な環境で柔軟で自律的な材料の堆積を約束します。
ただし、さまざまなペイロードと潜在的な障害の下で、マルチローターの空中ロボットの堅牢なリアルタイム制御を達成することは依然として困難です。
PIDのような従来のコントローラーは、多くの場合、頻繁にパラメーターを再調整する必要があり、動的シナリオでの適用性を制限します。
AMタスクでウェイポイントナビゲーションを実行するマルチロータードローンの適応可能な制御ポリシーを学習するDRLフレームワークを提案します。
深い決定論的ポリシーグラデーション(DDPG)とツインの遅延により、複雑さの増加を処理するように設計されたカリキュラム学習スキーム内で、深い決定論的ポリシー勾配(TD3)を比較します。
私たちの実験では、TD3が一貫してトレーニングの安定性、精度、および成功をバランスさせていることが示されています。特に、質量のばらつきが導入された場合です。
これらの発見は、添加剤の製造における堅牢で自律的なドローン制御へのスケーラブルなパスを提供します。

要約(オリジナル)

This paper investigates the application of Deep Reinforcement (DRL) Learning to address motion control challenges in drones for additive manufacturing (AM). Drone-based additive manufacturing promises flexible and autonomous material deposition in large-scale or hazardous environments. However, achieving robust real-time control of a multi-rotor aerial robot under varying payloads and potential disturbances remains challenging. Traditional controllers like PID often require frequent parameter re-tuning, limiting their applicability in dynamic scenarios. We propose a DRL framework that learns adaptable control policies for multi-rotor drones performing waypoint navigation in AM tasks. We compare Deep Deterministic Policy Gradient (DDPG) and Twin Delayed Deep Deterministic Policy Gradient (TD3) within a curriculum learning scheme designed to handle increasing complexity. Our experiments show TD3 consistently balances training stability, accuracy, and success, particularly when mass variability is introduced. These findings provide a scalable path toward robust, autonomous drone control in additive manufacturing.

arxiv情報

著者 Gaurav Shetty,Mahya Ramezani,Hamed Habibi,Holger Voos,Jose Luis Sanchez-Lopez
発行日 2025-02-09 19:00:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Motion Control in Multi-Rotor Aerial Robots Using Deep Reinforcement Learning はコメントを受け付けていません