RGB-Event Fusion with Self-Attention for Collision Prediction

要約

動的で現実世界の環境での自律的なロボットの安全な動作には、堅牢でリアルタイムの障害物回避を確保することが重要です。
このペーパーでは、RGBとイベントベースのビジョンセンサーを使用して、動的オブジェクトを備えた無人航空機の時間と衝突位置を予測するためのニューラルネットワークフレームワークを提案します。
提案されたアーキテクチャは、各モダリティに1つずつ、2つの個別のエンコーダーブランチで構成され、次に予測精度を向上させるための自己関節による融合が続きます。
ベンチマークを容易にするために、シングルモダリティと融合ベースのアプローチの詳細な比較を可能にするABCD [8]データセットを活用します。
50Hzの同じ予測スループットで、実験結果は、融合ベースのモデルが平均で1%、0.5mを超える距離で10%のシングルモダリティアプローチで予測精度を改善することを示していますが、メモリで + 71%、フロップで + 105%のコストで提供されます。
特に、イベントベースのモデルは、RGBモデルをポジションで4%、同様の計算コストで時間エラーを26%上回るため、競争力のある代替手段になります。
さらに、イベントベースのモデルの量子化バージョンを評価し、1〜8ビットの量子化を適用して、予測パフォーマンスと計算効率の間のトレードオフを評価します。
これらの調査結果は、RGBおよびイベントベースのカメラをロボットアプリケーションで使用したマルチモーダル認識のトレードオフを強調しています。

要約(オリジナル)

Ensuring robust and real-time obstacle avoidance is critical for the safe operation of autonomous robots in dynamic, real-world environments. This paper proposes a neural network framework for predicting the time and collision position of an unmanned aerial vehicle with a dynamic object, using RGB and event-based vision sensors. The proposed architecture consists of two separate encoder branches, one for each modality, followed by fusion by self-attention to improve prediction accuracy. To facilitate benchmarking, we leverage the ABCD [8] dataset collected that enables detailed comparisons of single-modality and fusion-based approaches. At the same prediction throughput of 50Hz, the experimental results show that the fusion-based model offers an improvement in prediction accuracy over single-modality approaches of 1% on average and 10% for distances beyond 0.5m, but comes at the cost of +71% in memory and + 105% in FLOPs. Notably, the event-based model outperforms the RGB model by 4% for position and 26% for time error at a similar computational cost, making it a competitive alternative. Additionally, we evaluate quantized versions of the event-based models, applying 1- to 8-bit quantization to assess the trade-offs between predictive performance and computational efficiency. These findings highlight the trade-offs of multi-modal perception using RGB and event-based cameras in robotic applications.

arxiv情報

著者 Pietro Bonazzi,Christian Vogt,Michael Jost,Haotong Qin,Lyes Khacef,Federico Paredes-Valles,Michele Magno
発行日 2025-05-07 09:03:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | RGB-Event Fusion with Self-Attention for Collision Prediction はコメントを受け付けていません

A Case Study on the Application of Digital Twins for Enhancing CPS Operations

要約

さまざまなドメイン(農業や製造など)にわたる複雑なサイバー物理システムのダウンタイムを確保し、農業と製造など、開発と運用の両方で複雑なフォールトトレランスメカニズムが実装されています。
さらに、サイバー物理システムはしばしば限られたハードウェアリソースに直面しているか、レガシーシステムであり、どちらも多くの場合、オンボードハードウェアに新しい機能を直接妨害します。
デジタル双子は、高価な計算をオフロードするために採用することができ、断層許容メカニズムを通じてサポートを提供するため、サイバー物理システムのコストと運用上のダウンタイムが削減されます。
この論文では、業界指向のユースケースで、特に機能的増強と断層トレランスの増加を通じて、サイバー物理システムの運用を強化するために使用されるデジタルツインの実現可能性を示します。

要約(オリジナル)

To ensure the availability and reduce the downtime of complex cyber-physical systems across different domains, e.g., agriculture and manufacturing, fault tolerance mechanisms are implemented which are complex in both their development and operation. In addition, cyber-physical systems are often confronted with limited hardware resources or are legacy systems, both often hindering the addition of new functionalities directly on the onboard hardware. Digital Twins can be adopted to offload expensive computations, as well as providing support through fault tolerance mechanisms, thus decreasing costs and operational downtime of cyber-physical systems. In this paper, we show the feasibility of a Digital Twin used for enhancing cyber-physical system operations, specifically through functional augmentation and increased fault tolerance, in an industry-oriented use case.

arxiv情報

著者 Irina Muntean,Mirgita Frasheri,Tiziano Munaro
発行日 2025-05-07 11:12:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SE | A Case Study on the Application of Digital Twins for Enhancing CPS Operations はコメントを受け付けていません

Evaluation Framework for Sensor Configuration Impact on Deep Learning-Based Perception

要約

自動車認識システムに関する現在の研究は、主にセンサー技術のパフォーマンスを向上させるか、単独で知覚機能を強化することに焦点を当てています。
高レベルの知覚機能は、従来のアルゴリズムと比較してパフォーマンスの向上と一般化可能性のため、ますます深い学習(DL)モデルに基づいています。
オンボードセンサー入力を使用して、実際の条件下でDLベースの知覚関数のパフォーマンスを評価する必要があるにもかかわらず、このような体系的な評価を実装するためのフレームワークが不足しています。
このペーパーでは、DLベースの知覚関数に対する知覚センサーのモダリティとパラメーター設定の影響を評価するための多用途のフレームワークを紹介します。
シミュレーション環境を使用して、フレームワークは、さまざまな運用設計ドメイン条件下でのセンサーモダリティの選択とパラメーターのチューニングを容易にします。
その有効性は、最先端のサラウンド軌道予測モデルを含むケーススタディを通じて実証され、センサーモダリティレーダーとカメラ全体のパフォーマンスの違いを強調しています。
最適な構成を識別するために、パラメーター、水平ビューフィールド(HFOV)のさまざまな設定が評価されました。
結果は、狭いHFOVを備えたレーダーセンサーが、評価された知覚アルゴリズムに最も適した構成であることを示しています。
提案されたフレームワークは、認識センサースイートの設計に対する全体的なアプローチを提供し、自動化された運転システムの堅牢な認識システムの開発に大きく貢献しています。

要約(オリジナル)

Current research on automotive perception systems predominantly focusses on either improving the performance of sensor technology or enhancing the perception functions in isolation. High-level perception functions are increasingly based on deep learning (DL) models due to their improved performance and generalisability compared to traditional algorithms. Despite the vital need to evaluate the performance of DL-based perception functions under real-world conditions using onboard sensor inputs, there is a lack of frameworks to implement such systematic evaluations. This paper presents a versatile framework to evaluate the impact of perception sensor modalities and parameter settings on DL-based perception functions. Using a simulation environment, the framework facilitates sensor modality selection and parameter tuning under different operational design domain conditions. Its effectiveness is demonstrated through a case study involving a state-of-the-art surround trajectory prediction model, highlighting performance differences across the sensor modalities radar and camera. Different settings for the parameter, horizontal field of view (HFOV) were evaluated to identify the optimal configuration. The results indicate that a radar sensor with a narrow HFOV is the most suitable configuration for the evaluated perception algorithm. The proposed framework offers a holistic approach to the design of the perception sensor suite, significantly contributing to the development of robust perception systems for automated driving systems.

arxiv情報

著者 A Gamage,V Donzella
発行日 2025-05-07 13:01:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Evaluation Framework for Sensor Configuration Impact on Deep Learning-Based Perception はコメントを受け付けていません

Do We Still Need to Work on Odometry for Autonomous Driving?

要約

過去数十年にわたり、膨大な量の作業が、さまざまな固有受容および外部受容センサーに基づいて、移動プラットフォームのエゴモーション推定のトピックに対処してきました。
増え続ける計算負荷とセンサーの複雑さを犠牲にして、臭気測定アルゴリズムは、さまざまな条件でのドリフトを最小限に抑えて、印象的なレベルの精度に達しました。
このホワイトペーパーでは、最も単純なアルゴリズムの1つの精度を評価することにより、自律運転の臭気測定に関するさらなる研究が必要であることに疑問を呈しています:ホイールエンコーダーデータの直接統合とジャイロスコープからのヨーレート測定。
このアルゴリズムは、走行距離計(OG)匂いとして示されます。
この作業は、OG臭気が、ほとんどのシナリオで計算コストの一部について、現在の最先端のレーダー介入SE(2)臭気を上回ることができることを示しています。
たとえば、OG臭気は0.20%の相対的な翻訳誤差を持つボレアスリーダーボードの上にありますが、2番目に良い方法では0.26%の誤差が表示されます。
Lidar-inertialアプローチはより正確な推定値を提供できますが、計算負荷はOG臭トよりも3桁高いです。
分析をさらに促進するために、さまざまな運転行動で収集されたデータを使用して、根本的な滑り止めの仮定に意図的に違反することにより、OG臭トメトリの限界を押し広げました。
私たちの結論は、OG臭トからの不十分なポーズ推定値をもたらすために、かなりの量の滑りが必要であることを示しています。

要約(オリジナル)

Over the past decades, a tremendous amount of work has addressed the topic of ego-motion estimation of moving platforms based on various proprioceptive and exteroceptive sensors. At the cost of ever-increasing computational load and sensor complexity, odometry algorithms have reached impressive levels of accuracy with minimal drift in various conditions. In this paper, we question the need for more research on odometry for autonomous driving by assessing the accuracy of one of the simplest algorithms: the direct integration of wheel encoder data and yaw rate measurements from a gyroscope. We denote this algorithm as Odometer-Gyroscope (OG) odometry. This work shows that OG odometry can outperform current state-of-the-art radar-inertial SE(2) odometry for a fraction of the computational cost in most scenarios. For example, the OG odometry is on top of the Boreas leaderboard with a relative translation error of 0.20%, while the second-best method displays an error of 0.26%. Lidar-inertial approaches can provide more accurate estimates, but the computational load is three orders of magnitude higher than the OG odometry. To further the analysis, we have pushed the limits of the OG odometry by purposely violating its fundamental no-slip assumption using data collected during a heavy snowstorm with different driving behaviours. Our conclusion shows that a significant amount of slippage is required to result in non-satisfactory pose estimates from the OG odometry.

arxiv情報

著者 Cedric Le Gentil,Daniil Lisus,Timothy D. Barfoot
発行日 2025-05-07 14:07:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Do We Still Need to Work on Odometry for Autonomous Driving? はコメントを受け付けていません

Estimating Dynamic Soft Continuum Robot States From Boundaries

要約

正確な状態推定は、ロボットを効果的に制御するために不可欠です。
ソフトロボットの場合、このタスクは、ロボットの継続的な変形性のために、州の状態が本質的に無限の次元関数であるため、特に困難です。
ただし、従来のセンシング技術は、個別の測定のみを提供できます。
最近、境界オブザーバーとして知られる動的状態推定方法が導入されました。これは、ロボットの先端で速度のねじれのみを測定することにより、Cosserat Rod理論を活用してすべての無限次元状態を回復するために活用します。
この作業では、無限の次元の動的状態も回復できるが、ロボットのベースで内部レンチの測定に依存する新しい境界観測者を提示します。
この設計は、先端の速度のねじれとベースの内部レンチとの間の二重性を活用し、両方のタイプの境界オブザーバーがエネルギー散逸の原理に触発されています。
数学的な二重性にもかかわらず、提案されたアプローチは明確な利点を提供します。ベースに埋め込まれた6軸力/トルクセンサーのみが必要であり、モーションキャプチャカメラなどの外部センシングシステムの必要性を排除します。
さらに、先端ベースとベースベースの技術の両方を組み合わせることで、エネルギー散逸が強化され、収束が加速され、推定精度が向上します。
腱駆動の連続体ロボットに基づいたシミュレーション研究と実験の両方を通じて、提案されたアルゴリズムを検証します。
私たちの結果は、すべての境界オブザーバーが、初期条件が大幅に逸脱していても、3秒以内に地上の真理に収束することを示しています。
さらに、それらは未知の摂動から回復し、高周波振動を効果的に追跡します。
また、デュアルテクニックを組み合わせることで、収束速度と精度がさらに向上することも示しています。
最後に、これらのアルゴリズムの計算効率は、リアルタイムの状態推定の実現可能性を示しています。

要約(オリジナル)

Accurate state estimation is essential for effective control of robots. For soft robots, this task is particularly challenging because their states are inherently infinite-dimensional functions due to the robots’ continuous deformability. Traditional sensing techniques, however, can only provide discrete measurements. Recently, a dynamic state estimation method known as a boundary observer was introduced, which leverages Cosserat rod theory to recover all infinite-dimensional states by measuring only the velocity twist at the robot’s tip. In this work, we present a novel boundary observer that can also recover infinite-dimensional dynamic states, but instead relies on measuring the internal wrench at the robot’s base. This design exploits the duality between the velocity twist at the tip and the internal wrench at the base, with both types of boundary observers being inspired by principles of energy dissipation. Despite the mathematical duality, the proposed approach offers a distinct advantage: it requires only a 6-axis force/torque sensor embedded at the base, eliminating the need for external sensing systems such as motion capture cameras. Moreover, combining both tip- and base-based techniques enhances energy dissipation, accelerates convergence, and improves estimation accuracy. We validate the proposed algorithms through both simulation studies and experiments based on tendon-driven continuum robots. Our results demonstrate that all boundary observers converge to the ground truth within 3 seconds, even with significantly deviated initial conditions. Furthermore, they recover from unknown perturbations and effectively track high-frequency vibrations. We also show that combining the dual techniques further improves convergence speed and accuracy. Finally, the computational efficiency of these algorithms indicates their feasibility for real-time state estimation.

arxiv情報

著者 Tongjia Zheng,Jessica Burgner-Kahrs
発行日 2025-05-07 15:12:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Estimating Dynamic Soft Continuum Robot States From Boundaries はコメントを受け付けていません

Accelerating Audio Research with Robotic Dummy Heads

要約

この作品は、従来のオーディオロジカルマネキンの音響リアリズムとロボットの可動性を融合させるロボットダミーヘッドを紹介します。
提案されたデバイスは、人々がそうであるように移動、話し、聞くことができ、空間的に定常のオーディオ実験を自動化するために使用できるため、オーディオリサーチのペースを加速します。
重大なことに、このデバイスは、静かなモーターのため、動的実験で動く音源としても使用できます。
この機能は、私たちの作業を以前のロボットアコースティック研究プラットフォームと区別しています。
ロボットが高品質のオーディオデータ収集を有効にすることは、さまざまな実験と音響測定を通じて提供されます。
また、これらの実験は、適応性のあるバイノーラルビームフォーミングを研究するためにロボットを使用する方法も示しています。
設計ファイルは、新しいオーディオリサーチを刺激するためのオープンソースとして提供されます。

要約(オリジナル)

This work introduces a robotic dummy head that fuses the acoustic realism of conventional audiological mannequins with the mobility of robots. The proposed device is capable of moving, talking, and listening as people do, and can be used to automate spatially-stationary audio experiments, thus accelerating the pace of audio research. Critically, the device may also be used as a moving sound source in dynamic experiments, due to its quiet motor. This feature differentiates our work from previous robotic acoustic research platforms. Validation that the robot enables high quality audio data collection is provided through various experiments and acoustic measurements. These experiments also demonstrate how the robot might be used to study adaptive binaural beamforming. Design files are provided as open-source to stimulate novel audio research.

arxiv情報

著者 Austin Lu,Kanad Sarkar,Yongjie Zhuang,Leo Lin,Ryan M Corey,Andrew C Singer
発行日 2025-05-07 16:30:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO, cs.SD, eess.AS | Accelerating Audio Research with Robotic Dummy Heads はコメントを受け付けていません

Hierarchical Task Decomposition for Execution Monitoring and Error Recovery: Understanding the Rationale Behind Task Demonstrations

要約

ロボットが環境と相互作用し、知覚された状況に基づいてプロセス力を適用する必要があるマルチステップ操作タスクは、学習に挑戦し、実行エラーを発生させがちです。
これらのタスクを正確にシミュレートすることも困難です。
したがって、堅牢なタス​​クパフォ​​ーマンスがエンドエフェクターのポーズと適用力を調整し、実行を監視し、偏差に反応する方法を学ぶことが重要です。
これらの課題に対処するために、実際のシステム上のユーザーデモンストレーションから、低レベルと高レベルのタスク表現の両方を直接誘導する学習アプローチを提案します。
意図認識と機能クラスタリングを組み合わせてタスクのスキルを推測する監視されていないタスクセグメンテーションアルゴリズムを開発しました。
私たちは、意図したタスクの実行から偏差を特定するために、監視されていない新しい異常検出アプローチで、各スキルの推測された特徴を活用します。
一緒に、これらのコンポーネントは、新しい状況が発生するにつれて、タスクの決定と新しい行動を段階的に学習できる包括的なフレームワークを形成します。
最先端の学習技術と比較して、私たちのアプローチは、必要な量のトレーニングデータと計算の複雑さを大幅に削減し、複雑な接触行動と回復戦略を効率的に学習します。
提案されたタスクセグメンテーションと異常検出アプローチは、2つの異なるロボットシステムで評価された力ベースのタスクに関する最先端の方法よりも優れています。

要約(オリジナル)

Multi-step manipulation tasks where robots interact with their environment and must apply process forces based on the perceived situation remain challenging to learn and prone to execution errors. Accurately simulating these tasks is also difficult. Hence, it is crucial for robust task performance to learn how to coordinate end-effector pose and applied force, monitor execution, and react to deviations. To address these challenges, we propose a learning approach that directly infers both low- and high-level task representations from user demonstrations on the real system. We developed an unsupervised task segmentation algorithm that combines intention recognition and feature clustering to infer the skills of a task. We leverage the inferred characteristic features of each skill in a novel unsupervised anomaly detection approach to identify deviations from the intended task execution. Together, these components form a comprehensive framework capable of incrementally learning task decisions and new behaviors as new situations arise. Compared to state-of-the-art learning techniques, our approach significantly reduces the required amount of training data and computational complexity while efficiently learning complex in-contact behaviors and recovery strategies. Our proposed task segmentation and anomaly detection approaches outperform state-of-the-art methods on force-based tasks evaluated on two different robotic systems.

arxiv情報

著者 Christoph Willibald,Dongheui Lee
発行日 2025-05-07 16:57:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Hierarchical Task Decomposition for Execution Monitoring and Error Recovery: Understanding the Rationale Behind Task Demonstrations はコメントを受け付けていません

Graph-based Path Planning with Dynamic Obstacle Avoidance for Autonomous Parking

要約

駐車場のシナリオでの安全で効率的なパス計画は、静的および動的な障害に満ちた乱雑な環境が存在するため、重要な課題を提示します。
これに対処するために、動的障害の予測を計画プロセスにシームレスに統合し、衝突のないパスの生成を確保する、斬新で計算効率の高い計画戦略を提案します。
私たちのアプローチは、グラフのノード探索中の動的障害の予測を明示的に説明し、動的障害物の回避を可能にする、時間をインデックスしたバリアントを導入することにより、従来のハイブリッドA Starアルゴリズムに基づいています。
オンライン計画フレームワーク内に時間をインデックスしたハイブリッドAスターアルゴリズムを統合して、各計画ステップでローカルパスを計算し、適応的に選択された中間目標に導かれます。
提案された方法は、垂直、角度のある、並列駐車を含む多様な駐車場シナリオで検証されています。
シミュレーションを通じて、駐車状況の最先端のスプラインベースの計画方法と比較した場合、効率と安全性を大幅に改善するアプローチの可能性を紹介します。

要約(オリジナル)

Safe and efficient path planning in parking scenarios presents a significant challenge due to the presence of cluttered environments filled with static and dynamic obstacles. To address this, we propose a novel and computationally efficient planning strategy that seamlessly integrates the predictions of dynamic obstacles into the planning process, ensuring the generation of collision-free paths. Our approach builds upon the conventional Hybrid A star algorithm by introducing a time-indexed variant that explicitly accounts for the predictions of dynamic obstacles during node exploration in the graph, thus enabling dynamic obstacle avoidance. We integrate the time-indexed Hybrid A star algorithm within an online planning framework to compute local paths at each planning step, guided by an adaptively chosen intermediate goal. The proposed method is validated in diverse parking scenarios, including perpendicular, angled, and parallel parking. Through simulations, we showcase our approach’s potential in greatly improving the efficiency and safety when compared to the state of the art spline-based planning method for parking situations.

arxiv情報

著者 Farhad Nawaz,Minjun Sung,Darshan Gadginmath,Jovin D’sa,Sangjae Bae,David Isele,Nadia Figueroa,Nikolai Matni,Faizan M. Tariq
発行日 2025-05-07 17:02:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Graph-based Path Planning with Dynamic Obstacle Avoidance for Autonomous Parking はコメントを受け付けていません

Stow: Robotic Packing of Items into Fabric Pods

要約

このペーパーでは、アイテムを密集した棚に置くことができる準拠した操作システムを紹介します。
幅広いアイテムの多様性と高生産率と欠陥の低い発生のための厳格なビジネス要件により、倉庫ロボット工学がこのタスクを実行することが禁止されています。
ハードウェア、認識、意思決定、モーション計画、および制御のイノベーションにより、このシステムは大規模なeコマースフルフィルメントセンターで500,000を超えるストウを実行することができました。
このシステムは、ロボットと一緒に作業する人間の安全性を高めるために、頭上の棚での作業を優先しながら、人間のレベルの梱包密度と速度を達成します。

要約(オリジナル)

This paper presents a compliant manipulation system capable of placing items onto densely packed shelves. The wide diversity of items and strict business requirements for high producing rates and low defect generation have prohibited warehouse robotics from performing this task. Our innovations in hardware, perception, decision-making, motion planning, and control have enabled this system to perform over 500,000 stows in a large e-commerce fulfillment center. The system achieves human levels of packing density and speed while prioritizing work on overhead shelves to enhance the safety of humans working alongside the robots.

arxiv情報

著者 Nicolas Hudson,Josh Hooks,Rahul Warrier,Curt Salisbury,Ross Hartley,Kislay Kumar,Bhavana Chandrashekhar,Paul Birkmeyer,Bosch Tang,Matt Frost,Shantanu Thakar,Tony Piaskowy,Petter Nilsson,Josh Petersen,Neel Doshi,Alan Slatter,Ankit Bhatia,Cassie Meeker,Yuechuan Xue,Dylan Cox,Alex Kyriazis,Bai Lou,Nadeem Hasan,Asif Rana,Nikhil Chacko,Ruinian Xu,Siamak Faal,Esi Seraj,Mudit Agrawal,Kevin Jamieson,Alessio Bisagni,Valerie Samzun,Christine Fuller,Alex Keklak,Alex Frenkel,Lillian Ratliff,Aaron Parness
発行日 2025-05-07 17:07:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Stow: Robotic Packing of Items into Fabric Pods はコメントを受け付けていません

Towards Initialization-Agnostic Clustering with Iterative Adaptive Resonance Theory

要約

ファジー適応共鳴理論(ファジーアート)のクラスタリングパフォーマンスは、その価値の逸脱がクラスタリング結果の大幅な変動につながり、非専門家の実用性を厳しく制限する可能性があるプリセット警戒パラメーターに大きく依存しています。
既存のアプローチは、一般に、粒子群の最適化やファジーロジックルールなどの適応メカニズムを通じて、警戒パラメーターの堅牢性を高めます。
ただし、多くの場合、アルゴリズムの元のシンプルさと矛盾する追加のハイパーパラメーターまたは複雑なフレームワークを導入します。
これに対処するために、3つの重要なフェーズを統一された反復フレームワークに統合する反復改良適応共鳴理論(IR-ART)を提案します。
(2)不安定なクラスター削除:低品質のクラスターを排除する進化的剪定モジュール。
(3)警戒地域の拡大:類似性のしきい値を適応的に調整する警戒地域の拡張メカニズム。
クラスタリングの特定の実行とは無関係に、これらの3つのフェーズは、反復プロセス内の暗黙の知識の分析、重みと警戒パラメーターの調整、それにより次の反復の基礎を築くことに順番に焦点を当てています。
15のデータセットでの実験的評価は、IR-ARTがファジーアートのパラメーターの単純さを維持しながら、最適ではない警戒パラメーター値に対する耐性を改善することを示しています。
ケーススタディは、反復的な改良を通じてアルゴリズムの自己最適化能力を視覚的に確認し、リソースに制約のあるシナリオの非専門家に特に適しています。

要約(オリジナル)

The clustering performance of Fuzzy Adaptive Resonance Theory (Fuzzy ART) is highly dependent on the preset vigilance parameter, where deviations in its value can lead to significant fluctuations in clustering results, severely limiting its practicality for non-expert users. Existing approaches generally enhance vigilance parameter robustness through adaptive mechanisms such as particle swarm optimization and fuzzy logic rules. However, they often introduce additional hyperparameters or complex frameworks that contradict the original simplicity of the algorithm. To address this, we propose Iterative Refinement Adaptive Resonance Theory (IR-ART), which integrates three key phases into a unified iterative framework: (1) Cluster Stability Detection: A dynamic stability detection module that identifies unstable clusters by analyzing the change of sample size (number of samples in the cluster) in iteration. (2) Unstable Cluster Deletion: An evolutionary pruning module that eliminates low-quality clusters. (3) Vigilance Region Expansion: A vigilance region expansion mechanism that adaptively adjusts similarity thresholds. Independent of the specific execution of clustering, these three phases sequentially focus on analyzing the implicit knowledge within the iterative process, adjusting weights and vigilance parameters, thereby laying a foundation for the next iteration. Experimental evaluation on 15 datasets demonstrates that IR-ART improves tolerance to suboptimal vigilance parameter values while preserving the parameter simplicity of Fuzzy ART. Case studies visually confirm the algorithm’s self-optimization capability through iterative refinement, making it particularly suitable for non-expert users in resource-constrained scenarios.

arxiv情報

著者 Xiaozheng Qu,Zhaochuan Li,Zhuang Qi,Xiang Li,Haibei Huang,Lei Meng,Xiangxu Meng
発行日 2025-05-07 14:12:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Towards Initialization-Agnostic Clustering with Iterative Adaptive Resonance Theory はコメントを受け付けていません