HiBerNAC: Hierarchical Brain-emulated Robotic Neural Agent Collective for Disentangling Complex Manipulation

要約

マルチモーダルビジョン言語アクション(VLA)モデルの最近の進歩により、従来のロボット学習に革命をもたらし、システムが複雑なタスク計画のための統一フレームワークでビジョン、言語、およびアクションを解釈できるようになりました。
ただし、複雑な操作タスクの習得は、永続的なコンテキストメモリの制限、不確実性の下でのマルチエージェント調整、およびさまざまなシーケンス全体の動的な長期計画によって制約されるオープンな課題のままです。
この課題に対処するために、\ textbf {hibernac}、a \ textbf {hi} erarchical \ textbf {b} rain- \ textbf {e} mulated \ textbf {r} obotic \ textbf {n} eural \ eural \ textbf {a} gent \ textbf {cs} cs \ by by by by by cs
特に神経回路のメカニズムと階層的な意思決定における神経科学。
私たちのフレームワークは、(1)複雑なロボット操作タスクのために特別に設計された(2)ニューロ風の反射とマルチエージェントメカニズムを使用したマルチモーダルVLA計画と推論を組み合わせています。
分散化されたマルチエージェントコラボレーションでニューロ風の機能モジュールを活用することにより、このアプローチにより、複雑な操作タスクの堅牢でリアルタイムの実行が強化されます。
さらに、エージェントシステムは、ダイナミックエージェントの専門化を介してスケーラブルな集合インテリジェンスを示し、その調整戦略をさまざまなタスクの視野と複雑さに適応させます。
最先端のVLAモデルと比較して複雑な操作タスクに関する広範な実験を通じて、\ textBF {hibernac}が平均長距離タスクの完了時間を23%削減し、マルチパスのタスクで非ゼロの成功率(12 \ textendash 31 \%)を達成することを実証します。
これらの結果は、生物学的認知とロボット学習メカニズムを橋渡しするための示唆的な証拠を提供します。

要約(オリジナル)

Recent advances in multimodal vision-language-action (VLA) models have revolutionized traditional robot learning, enabling systems to interpret vision, language, and action in unified frameworks for complex task planning. However, mastering complex manipulation tasks remains an open challenge, constrained by limitations in persistent contextual memory, multi-agent coordination under uncertainty, and dynamic long-horizon planning across variable sequences. To address this challenge, we propose \textbf{HiBerNAC}, a \textbf{Hi}erarchical \textbf{B}rain-\textbf{e}mulated \textbf{r}obotic \textbf{N}eural \textbf{A}gent \textbf{C}ollective, inspired by breakthroughs in neuroscience, particularly in neural circuit mechanisms and hierarchical decision-making. Our framework combines: (1) multimodal VLA planning and reasoning with (2) neuro-inspired reflection and multi-agent mechanisms, specifically designed for complex robotic manipulation tasks. By leveraging neuro-inspired functional modules with decentralized multi-agent collaboration, our approach enables robust and enhanced real-time execution of complex manipulation tasks. In addition, the agentic system exhibits scalable collective intelligence via dynamic agent specialization, adapting its coordination strategy to variable task horizons and complexity. Through extensive experiments on complex manipulation tasks compared with state-of-the-art VLA models, we demonstrate that \textbf{HiBerNAC} reduces average long-horizon task completion time by 23\%, and achieves non-zero success rates (12\textendash 31\%) on multi-path tasks where prior state-of-the-art VLA models consistently fail. These results provide indicative evidence for bridging biological cognition and robotic learning mechanisms.

arxiv情報

著者 Hongjun Wu,Heng Zhang,Pengsong Zhang,Jin Wang,Cong Wang
発行日 2025-06-11 14:29:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | HiBerNAC: Hierarchical Brain-emulated Robotic Neural Agent Collective for Disentangling Complex Manipulation はコメントを受け付けていません

Reinforced Refinement with Self-Aware Expansion for End-to-End Autonomous Driving

要約

エンドツーエンドの自律運転は、学習ベースのモジュラー統合を使用して、センサー入力を計画するための直接マッピングセンサー入力のための有望なパラダイムとして浮上しています。
ただし、既存の模倣学習(IL)ベースのモデルは、一般化への一般化に悩まされており、展開後の矯正フィードバックループの欠如に悩まされています。
強化学習(RL)は、最適性を備えたハードケースに取り組むための潜在的なソリューションを提供しますが、特定の運転ケースに過度に適合することにより妨げられることが多く、一般化可能な知識とサンプルの非効率性の壊滅的な忘却をもたらします。
これらの課題を克服するために、モデルに依存しないエンドツーエンドの駆動システムの一般化可能な運転ポリシーを維持しながら、ハードドメインを絶えず改良している新しい学習パイプラインである自己認識拡張(R2SE)で強化された改良を提案します。
継続的な改善を促進する強化微調整と政策の拡大を通じて、R2SEは3つの重要なコンポーネントを備えています。1)ハードケース配分列車での一般主義者の事前に登録されているジェネラリストの模倣学習(IL)運転システムは、ターゲットの洗練のために障害が発生しやすいケースを動的に識別します。
2)残留補強スペシャリストの微調整は、グローバルな運転知識を維持しながら、ハードケースドメインのパフォーマンスを改善するために、強化学習(RL)を使用して残留補正を最適化します。
3)自己認識アダプターの拡張は、専門家のポリシーをジェネラリストモデルに動的に統合し、継続的なパフォーマンスの改善を強化します。
閉ループシミュレーションと現実世界のデータセットにおける実験結果は、最先端のE2Eシステムに対する一般化、安全性、および長老のポリシーの堅牢性の改善を示し、スケーラブルな自動運転の洗練の有効性を強調しています。

要約(オリジナル)

End-to-end autonomous driving has emerged as a promising paradigm for directly mapping sensor inputs to planning maneuvers using learning-based modular integrations. However, existing imitation learning (IL)-based models suffer from generalization to hard cases, and a lack of corrective feedback loop under post-deployment. While reinforcement learning (RL) offers a potential solution to tackle hard cases with optimality, it is often hindered by overfitting to specific driving cases, resulting in catastrophic forgetting of generalizable knowledge and sample inefficiency. To overcome these challenges, we propose Reinforced Refinement with Self-aware Expansion (R2SE), a novel learning pipeline that constantly refines hard domain while keeping generalizable driving policy for model-agnostic end-to-end driving systems. Through reinforcement fine-tuning and policy expansion that facilitates continuous improvement, R2SE features three key components: 1) Generalist Pretraining with hard-case allocation trains a generalist imitation learning (IL) driving system while dynamically identifying failure-prone cases for targeted refinement; 2) Residual Reinforced Specialist Fine-tuning optimizes residual corrections using reinforcement learning (RL) to improve performance in hard case domain while preserving global driving knowledge; 3) Self-aware Adapter Expansion dynamically integrates specialist policies back into the generalist model, enhancing continuous performance improvement. Experimental results in closed-loop simulation and real-world datasets demonstrate improvements in generalization, safety, and long-horizon policy robustness over state-of-the-art E2E systems, highlighting the effectiveness of reinforce refinement for scalable autonomous driving.

arxiv情報

著者 Haochen Liu,Tianyu Li,Haohan Yang,Li Chen,Caojun Wang,Ke Guo,Haochen Tian,Hongchen Li,Hongyang Li,Chen Lv
発行日 2025-06-11 14:42:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Reinforced Refinement with Self-Aware Expansion for End-to-End Autonomous Driving はコメントを受け付けていません

Benchmarking Population-Based Reinforcement Learning across Robotic Tasks with GPU-Accelerated Simulation

要約

近年、Deep Rehnection Learning(RL)は、複雑な連続制御タスクを解決する際の有効性を示しています。
ただし、これは、学習効率の感度とハイパーパラメーター選択に対する政策パフォーマンスによって悪化することによって悪化するトレーニングに必要な膨大な経験を犠牲にしてもたらされます。
この作業は、人口ベースの強化学習(PBRL)アプローチとGPUにアクセラル化された物理シミュレーターを活用して、複数のポリシーを並行して同時にトレーニングすることにより、RLの探査機能を強化します。
PBRLフレームワークは、学習エージェントのパフォーマンスに基づいてハイパーパラメーターを動的に調整する3つの最先端のRLアルゴリズム(PPO、SAC、およびDDPG)に対してベンチマークされています。
この実験は、ハイパーパラメーターの人口サイズと突然変異メカニズムの効果を分析することにより、アイザックジムの4つの挑戦的なタスク(アブマル地形、シャドウハンド、ヒューマノイド、フランカナットピック)で実行されます。
結果は、PBRLエージェントが非進化ベースラインエージェントと比較して、累積報酬の観点から優れた性能を達成することを示しています。
さらに、訓練を受けたエージェントは、フランカナットピックのタスクのために最終的に現実の世界に展開されます。
私たちの知る限り、これは実際のハードウェアにPBRLエージェントを展開するための最初のSIMからリアルへの試みです。
学んだポリシーのコードとビデオは、プロジェクトWebサイト(https://sites.google.com/view/pbrl)で入手できます。

要約(オリジナル)

In recent years, deep reinforcement learning (RL) has shown its effectiveness in solving complex continuous control tasks. However, this comes at the cost of an enormous amount of experience required for training, exacerbated by the sensitivity of learning efficiency and the policy performance to hyperparameter selection, which often requires numerous trials of time-consuming experiments. This work leverages a Population-Based Reinforcement Learning (PBRL) approach and a GPU-accelerated physics simulator to enhance the exploration capabilities of RL by concurrently training multiple policies in parallel. The PBRL framework is benchmarked against three state-of-the-art RL algorithms — PPO, SAC, and DDPG — dynamically adjusting hyperparameters based on the performance of learning agents. The experiments are performed on four challenging tasks in Isaac Gym — Anymal Terrain, Shadow Hand, Humanoid, Franka Nut Pick — by analyzing the effect of population size and mutation mechanisms for hyperparameters. The results show that PBRL agents achieve superior performance, in terms of cumulative reward, compared to non-evolutionary baseline agents. Moreover, the trained agents are finally deployed in the real world for a Franka Nut Pick task. To our knowledge, this is the first sim-to-real attempt for deploying PBRL agents on real hardware. Code and videos of the learned policies are available on our project website (https://sites.google.com/view/pbrl).

arxiv情報

著者 Asad Ali Shahid,Yashraj Narang,Vincenzo Petrone,Enrico Ferrentino,Ankur Handa,Dieter Fox,Marco Pavone,Loris Roveda
発行日 2025-06-11 15:21:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Benchmarking Population-Based Reinforcement Learning across Robotic Tasks with GPU-Accelerated Simulation はコメントを受け付けていません

Hierarchical Learning-Enhanced MPC for Safe Crowd Navigation with Heterogeneous Constraints

要約

この論文では、不均一な制約を備えた動的環境でのロボットナビゲーションのための新しい階層的なフレームワークを提案します。
当社のアプローチは、Rehonforce Learning(RL)を介してトレーニングされたグラフニューラルネットワークを活用して、ローカルの目標推奨事項として策定されたロボットのコストを効率的に推定します。
その後、運動学的制約を説明する時空間のパス検索モジュールを使用して、明示的な制約施行に使用される非凸最適化問題を解決するための参照軌跡を生成するために採用されます。
さらに重要なことは、提案されたプランナーのエンドツーエンドのトレーニングを可能にする、インクリメンタルなアクションマスキングメカニズムと特権学習戦略を導入することです。
シミュレーションと現実世界の両方の実験は、提案された方法が複雑な動的環境でのローカル計画に効果的に対処し、最先端の(SOTA)パフォーマンスを達成することを示しています。
既存の学習最適化ハイブリッドメソッドと比較して、このアプローチは高忠実度シミュレーション環境への依存性を排除し、計算効率とトレーニングスケーラビリティに大きな利点をもたらします。
コードは、論文を受け入れるとオープンソースとしてリリースされます。

要約(オリジナル)

In this paper, we propose a novel hierarchical framework for robot navigation in dynamic environments with heterogeneous constraints. Our approach leverages a graph neural network trained via reinforcement learning (RL) to efficiently estimate the robot’s cost-to-go, formulated as local goal recommendations. A spatio-temporal path-searching module, which accounts for kinematic constraints, is then employed to generate a reference trajectory to facilitate solving the non-convex optimization problem used for explicit constraint enforcement. More importantly, we introduce an incremental action-masking mechanism and a privileged learning strategy, enabling end-to-end training of the proposed planner. Both simulation and real-world experiments demonstrate that the proposed method effectively addresses local planning in complex dynamic environments, achieving state-of-the-art (SOTA) performance. Compared with existing learning-optimization hybrid methods, our approach eliminates the dependency on high-fidelity simulation environments, offering significant advantages in computational efficiency and training scalability. The code will be released as open-source upon acceptance of the paper.

arxiv情報

著者 Huajian Liu,Yixuan Feng,Wei Dong,Kunpeng Fan,Chao Wang,Yongzhuo Gao
発行日 2025-06-11 15:31:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Hierarchical Learning-Enhanced MPC for Safe Crowd Navigation with Heterogeneous Constraints はコメントを受け付けていません

Aucamp: An Underwater Camera-Based Multi-Robot Platform with Low-Cost, Distributed, and Robust Localization

要約

このホワイトペーパーでは、ローカリゼーションのための費用対効果の高いモノクラーカメラベースのセンシング、分散プロトコル、および堅牢な方向制御を特徴とする、Aucampという名前の水中マルチロボットプラットフォームを紹介します。
透明度機能を利用して距離を測定し、単眼イメージングモデルを提示し、ターゲットオブジェクトの位置を推定します。
分散アップデートプロトコルを設計することにより、プラットフォームでグローバルなポジショニングを実現します。
分散アルゴリズムにより、知覚プロセスがより広い範囲を同時にカバーすることができ、ポジショニングの精度と堅牢性を大幅に改善します。
さらに、プラットフォーム内のロボットの明示的なダイナミクスモデルが取得されます。そのことに基づいて、堅牢な方向制御フレームワークを提案します。
制御システムは、プラットフォームが各ロボットのバランスの取れた姿勢を維持することを保証し、それによりローカリゼーションシステムの安定性を保証します。
このプラットフォームは、強制不安定な状態から安定した水平姿勢に迅速に回復することができます。
さらに、プラットフォームのパフォーマンスを評価するために、広範な実験とアプリケーションシナリオを実施します。
提案された新しいプラットフォームは、水中センサーネットワークによる広範な海洋探査のサポートを提供する場合があります。

要約(オリジナル)

This paper introduces an underwater multi-robot platform, named Aucamp, characterized by cost-effective monocular-camera-based sensing, distributed protocol and robust orientation control for localization. We utilize the clarity feature to measure the distance, present the monocular imaging model, and estimate the position of the target object. We achieve global positioning in our platform by designing a distributed update protocol. The distributed algorithm enables the perception process to simultaneously cover a broader range, and greatly improves the accuracy and robustness of the positioning. Moreover, the explicit dynamics model of the robot in our platform is obtained, based on which, we propose a robust orientation control framework. The control system ensures that the platform maintains a balanced posture for each robot, thereby ensuring the stability of the localization system. The platform can swiftly recover from an forced unstable state to a stable horizontal posture. Additionally, we conduct extensive experiments and application scenarios to evaluate the performance of our platform. The proposed new platform may provide support for extensive marine exploration by underwater sensor networks.

arxiv情報

著者 Jisheng Xu,Ding Lin,Pangkit Fong,Chongrong Fang,Xiaoming Duan,Jianping He
発行日 2025-06-11 15:44:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Aucamp: An Underwater Camera-Based Multi-Robot Platform with Low-Cost, Distributed, and Robust Localization はコメントを受け付けていません

From Theory to Practice: Advancing Multi-Robot Path Planning Algorithms and Applications

要約

ラベル付きMRPP(マルチロボットパス計画)問題には、衝突を避けながら、ロボットを最初から目標構成まで効率的にルーティングすることが含まれます。
ソリューションの品質とランタイムの進歩にもかかわらず、その複雑さと産業の関連性は研究を促進し続けています。
この論文では、証明可能な保証と実用的なヒューリスティックを備えたスケーラブルなMRPPメソッドを導入します。
まず、倉庫および小包システムに関連する2Dグリッドで密なMRPPを研究します。
Rubik Tableメソッドを提案し、$(1 + \ delta)$ – 最適なメイク($ \ delta \ in(0、0.5] $)を最大$ \ frac {m_1 m_2} {2} $ $ロボットで実現し、大規模なインスタンスを効率的に解決し、最適なベンチマークを設定します。
(たとえば、倉庫、駐車システム)、密集したデッドロックのない自動車駐車のためのパズルベースのシステムを提案します。

要約(オリジナル)

The labeled MRPP (Multi-Robot Path Planning) problem involves routing robots from start to goal configurations efficiently while avoiding collisions. Despite progress in solution quality and runtime, its complexity and industrial relevance continue to drive research. This dissertation introduces scalable MRPP methods with provable guarantees and practical heuristics. First, we study dense MRPP on 2D grids, relevant to warehouse and parcel systems. We propose the Rubik Table method, achieving $(1 + \delta)$-optimal makespan (with $\delta \in (0, 0.5]$) for up to $\frac{m_1 m_2}{2}$ robots, solving large instances efficiently and setting a new theoretical benchmark. Next, we address real-world MRPP. We design optimal layouts for structured environments (e.g., warehouses, parking systems) and propose a puzzle-based system for dense, deadlock-free autonomous vehicle parking. We also extend MRPP to Reeds-Shepp robots, introducing motion primitives and smoothing techniques to ensure feasible, efficient paths under nonholonomic constraints. Simulations and real-world tests validate the approach in urban driving and robotic transport scenarios.

arxiv情報

著者 Teng Guo
発行日 2025-06-11 16:29:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | From Theory to Practice: Advancing Multi-Robot Path Planning Algorithms and Applications はコメントを受け付けていません

Locomotion on Constrained Footholds via Layered Architectures and Model Predictive Control

要約

これらのロボットの非線形、ハイブリッド、および高次元性の性質により、リアルタイムで脚のある運動のためのコンピューティング安定化と最適な制御アクションは困難です。
システムのハイブリッド性は、数値最適制御の問題を引き起こす離散変数と連続変数の組み合わせを導入します。
これらの課題に対処するために、離散変数とスムーズモデル予測コントローラー(MPC)の選択を分離する層状アーキテクチャを提案します。
層状の定式化により、グラデーションフリーとグラデーションベースの方法の組み合わせを通じてリアルタイムのパフォーマンスを犠牲にすることなく、オンラインの柔軟性と最適性が可能になります。
アーキテクチャは、離散変数を決定するためのサンプリングベースの方法と、これらの固定離散変数を使用して古典的な滑らかなMPC定式化を活用します。
四肢のロボットが、さまざまな高さで隙間を介して地形に足を踏み入れる結果を示します。
シミュレーションでは、ギャップトラバーサルのヒューマノイドロボット上のコントローラーを実証します。
階層化されたアプローチは、一般的なヒューリスティックベースのアプローチよりも最適で信頼性が高く、純粋なサンプリング方法よりも計算が速いことが示されています。

要約(オリジナル)

Computing stabilizing and optimal control actions for legged locomotion in real time is difficult due to the nonlinear, hybrid, and high dimensional nature of these robots. The hybrid nature of the system introduces a combination of discrete and continuous variables which causes issues for numerical optimal control. To address these challenges, we propose a layered architecture that separates the choice of discrete variables and a smooth Model Predictive Controller (MPC). The layered formulation allows for online flexibility and optimality without sacrificing real-time performance through a combination of gradient-free and gradient-based methods. The architecture leverages a sampling-based method for determining discrete variables, and a classical smooth MPC formulation using these fixed discrete variables. We demonstrate the results on a quadrupedal robot stepping over gaps and onto terrain with varying heights. In simulation, we demonstrate the controller on a humanoid robot for gap traversal. The layered approach is shown to be more optimal and reliable than common heuristic-based approaches and faster to compute than pure sampling methods.

arxiv情報

著者 Zachary Olkin,Aaron D. Ames
発行日 2025-06-11 17:54:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Locomotion on Constrained Footholds via Layered Architectures and Model Predictive Control はコメントを受け付けていません

FinTSBridge: A New Evaluation Suite for Real-world Financial Prediction with Advanced Time Series Models

要約

近年の時系列予測への注意が高まっているにもかかわらず、多くの研究は、予測パフォーマンスの向上を目指して、時系列予測で遭遇する課題に対処するためのさまざまなソリューションを提案しています。
ただし、これらの時系列予測モデルを金融資産価格設定の分野に効果的に適用することは依然として困難な問題です。
最先端の時系列予測モデルを金融資産の価格設定と結びつける橋がまだ必要です。
このギャップを埋めるために、次の取り組みを実施しました。1)財務ドメインから3つのデータセットを構築しました。
2)最近の研究から10以上の時系列予測モデルを選択し、財務時系列でのパフォーマンスを検証しました。
3)MSEとMAEに加えて、MSICとMSIRの新しいメトリックを開発し、モデルによってキャプチャされた時系列相関を紹介しました。
4)これら3つのデータセットの財務固有のタスクを設計し、重要な財務上の問題におけるこれらの予測モデルの実用的なパフォーマンスとアプリケーションの可能性を評価しました。
開発された新しい評価スイートであるFintsbridgeが、フィナニカルドメインの高度な予測モデルの有効性と堅牢性に関する貴重な洞察を提供できることを願っています。

要約(オリジナル)

Despite the growing attention to time series forecasting in recent years, many studies have proposed various solutions to address the challenges encountered in time series prediction, aiming to improve forecasting performance. However, effectively applying these time series forecasting models to the field of financial asset pricing remains a challenging issue. There is still a need for a bridge to connect cutting-edge time series forecasting models with financial asset pricing. To bridge this gap, we have undertaken the following efforts: 1) We constructed three datasets from the financial domain; 2) We selected over ten time series forecasting models from recent studies and validated their performance in financial time series; 3) We developed new metrics, msIC and msIR, in addition to MSE and MAE, to showcase the time series correlation captured by the models; 4) We designed financial-specific tasks for these three datasets and assessed the practical performance and application potential of these forecasting models in important financial problems. We hope the developed new evaluation suite, FinTSBridge, can provide valuable insights into the effectiveness and robustness of advanced forecasting models in finanical domains.

arxiv情報

著者 Yanlong Wang,Jian Xu,Tiantian Gao,Hongkang Zhang,Shao-Lun Huang,Danny Dongning Sun,Xiao-Ping Zhang
発行日 2025-06-11 15:26:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-fin.TR | FinTSBridge: A New Evaluation Suite for Real-world Financial Prediction with Advanced Time Series Models はコメントを受け付けていません

Tractable hierarchies of convex relaxations for polynomial optimization on the nonnegative orthant

要約

非陰性オルサントに含まれる半自由セットの多項式最適化問題(POP)を考慮します(コンパクトセットのすべてのPOPは、原点の単純な翻訳によってこの形式に配置できます)。
このようなポップは、各変数を二乗することにより、同等のポップに変換できます。
対称性と因子幅の概念さえも使用して、ディキンソン-PovhによるP \ ‘OlyaのPositivstellensatzの拡張に基づいて、半微細緩和の階層を提案します。
際立った特徴と重要な特徴として、結果として生じる各半光緩和の最大マトリックスサイズは任意に選択でき、さらに、新しい階層によって返される値のシーケンスは、速度で$ o(\ varepsilon^{ – c})がemplainsysを持っている場合に速度で最適な値に収束することを証明します。
(i)多層ニューラルネットワークの堅牢性認証と(ii)正の最大特異値の計算に適用されると、P \ ‘OlyaのPositivstellensatzに基づく方法に基づく方法は、標準的なモーメントソス階層の数百倍速い境界を提供し、数百倍速く走ります。

要約(オリジナル)

We consider polynomial optimization problems (POP) on a semialgebraic set contained in the nonnegative orthant (every POP on a compact set can be put in this format by a simple translation of the origin). Such a POP can be converted to an equivalent POP by squaring each variable. Using even symmetry and the concept of factor width, we propose a hierarchy of semidefinite relaxations based on the extension of P\’olya’s Positivstellensatz by Dickinson-Povh. As its distinguishing and crucial feature, the maximal matrix size of each resulting semidefinite relaxation can be chosen arbitrarily and in addition, we prove that the sequence of values returned by the new hierarchy converges to the optimal value of the original POP at the rate $O(\varepsilon^{-c})$ if the semialgebraic set has nonempty interior. When applied to (i) robustness certification of multi-layer neural networks and (ii) computation of positive maximal singular values, our method based on P\’olya’s Positivstellensatz provides better bounds and runs several hundred times faster than the standard Moment-SOS hierarchy.

arxiv情報

著者 Ngoc Hoang Anh Mai,Victor Magron,Jean-Bernard Lasserre,Kim-Chuan Toh
発行日 2025-06-11 15:28:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.AG, math.OC | Tractable hierarchies of convex relaxations for polynomial optimization on the nonnegative orthant はコメントを受け付けていません

Machine Learning-Based Classification of Oils Using Dielectric Properties and Microwave Resonant Sensing

要約

このペーパーでは、マイクロ波共鳴センサーを利用して、誘電特性に基づいたさまざまなオイルサンプルの分類のための機械学習ベースの方法論を提案します。
分子組成によって支配される油の誘電挙動は、センサーの共鳴周波数と振幅応答の明確なシフトを誘発します。
これらのバリエーションは、顕著な特徴を抽出するために体系的にキャプチャおよび処理されます。これは、複数の機械学習分類器の入力として機能します。
マイクロ波共振センサーは、非破壊的で低電力の方法で動作し、リアルタイムの産業用アプリケーションに特に適しています。
包括的なデータセットは、オイルサンプルの誘電率を変化させ、対応するセンサー応答を取得することにより開発されます。
抽出された共振機能を使用していくつかの分類器を訓練および評価して、オイルタイプを区別する能力を評価します。
実験結果は、提案されたアプローチがランダムフォレスト分類器で99.41%の高い分類精度を達成し、自動化されたオイル識別の強い可能性を強調することを示しています。
システムのコンパクトなフォームファクター、効率、および高性能は、産業環境での高速で信頼性の高いオイルの特性評価に対する実行可能性を強調しています。

要約(オリジナル)

This paper proposes a machine learning-based methodology for the classification of various oil samples based on their dielectric properties, utilizing a microwave resonant sensor. The dielectric behaviour of oils, governed by their molecular composition, induces distinct shifts in the sensor’s resonant frequency and amplitude response. These variations are systematically captured and processed to extract salient features, which serve as inputs for multiple machine learning classifiers. The microwave resonant sensor operates in a non-destructive, low-power manner, making it particularly well-suited for real-time industrial applications. A comprehensive dataset is developed by varying the permittivity of oil samples and acquiring the corresponding sensor responses. Several classifiers are trained and evaluated using the extracted resonant features to assess their capability in distinguishing between oil types. Experimental results demonstrate that the proposed approach achieves a high classification accuracy of 99.41% with the random forest classifier, highlighting its strong potential for automated oil identification. The system’s compact form factor, efficiency, and high performance underscore its viability for fast and reliable oil characterization in industrial environments.

arxiv情報

著者 Amit Baran Dey,Wasim Arif,Rakhesh Singh Kshetrimayum
発行日 2025-06-11 15:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Machine Learning-Based Classification of Oils Using Dielectric Properties and Microwave Resonant Sensing はコメントを受け付けていません