ExoStart: Efficient learning for dexterous manipulation with sensorized exoskeleton demonstrations

要約

テレオ操作システムにおける最近の進歩により、ロボットマニピュレーターの高品質のデータ収集が可能になり、大規模な学習操作における印象的な結果が示されています。
この進歩は、これらの機能をロボットの手に拡張することで、特に人間の手が示す同じレベルの器用さを達成できる場合、さらに幅広い操作スキルのロックを解除できることを示唆しています。
ただし、テレオパのロボットハンドは、ロボットの手の自由度が高く、コンタクトリッチな設定中に発生する複雑なダイナミクスのために大きな課題を提示するため、解決された問題とはほど遠いものです。
この作業では、人間の器用さを活用してロボットハンドコントロールを改善する一般的でスケーラブルな学習フレームワークであるExostartを提示します。
特に、センサー化された低コストのウェアラブル外骨格を使用して、ループにロボットを使用して直接デモンストレーションを収集し、人間が自分の手でデモンストレーションできる豊富な行動をキャプチャすることにより、高品質のデータを取得します。
また、収集されたデモから動的に実行可能な軌道を生成するシミュレーションベースのダイナミクスフィルターを提案し、生成された軌道を使用して、単純なスパース報酬のみに依存する自動カリキュラム補強学習方法をブートストラップします。
Exostartパイプラインは一般化可能であり、ゼロショットを実際のロボットに転送する堅牢なポリシーを生成します。
我々の結果は、Exostartが器用な現実世界のハンドスキルを生成し、AirPodsケースの開設やロックのキーを挿入して回すなど、幅広い複雑なタスクで50%を超える成功率を達成できることを示しています。
詳細とビデオは、https://sites.google.com/view/exostartをご覧ください。

要約(オリジナル)

Recent advancements in teleoperation systems have enabled high-quality data collection for robotic manipulators, showing impressive results in learning manipulation at scale. This progress suggests that extending these capabilities to robotic hands could unlock an even broader range of manipulation skills, especially if we could achieve the same level of dexterity that human hands exhibit. However, teleoperating robotic hands is far from a solved problem, as it presents a significant challenge due to the high degrees of freedom of robotic hands and the complex dynamics occurring during contact-rich settings. In this work, we present ExoStart, a general and scalable learning framework that leverages human dexterity to improve robotic hand control. In particular, we obtain high-quality data by collecting direct demonstrations without a robot in the loop using a sensorized low-cost wearable exoskeleton, capturing the rich behaviors that humans can demonstrate with their own hands. We also propose a simulation-based dynamics filter that generates dynamically feasible trajectories from the collected demonstrations and use the generated trajectories to bootstrap an auto-curriculum reinforcement learning method that relies only on simple sparse rewards. The ExoStart pipeline is generalizable and yields robust policies that transfer zero-shot to the real robot. Our results demonstrate that ExoStart can generate dexterous real-world hand skills, achieving a success rate above 50% on a wide range of complex tasks such as opening an AirPods case or inserting and turning a key in a lock. More details and videos can be found in https://sites.google.com/view/exostart.

arxiv情報

著者 Zilin Si,Jose Enrique Chen,M. Emre Karagozler,Antonia Bronars,Jonathan Hutchinson,Thomas Lampe,Nimrod Gileadi,Taylor Howell,Stefano Saliceti,Lukasz Barczyk,Ilan Olivarez Correa,Tom Erez,Mohit Shridhar,Murilo Fernandes Martins,Konstantinos Bousmalis,Nicolas Heess,Francesco Nori,Maria Bauza Villalonga
発行日 2025-06-13 13:35:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | ExoStart: Efficient learning for dexterous manipulation with sensorized exoskeleton demonstrations はコメントを受け付けていません

Auditory-Tactile Congruence for Synthesis of Adaptive Pain Expressions in RoboPatients

要約

誤診は、治療の遅延と害につながる可能性があります。
ロボット患者は、まれ、微妙な、または複雑な症例で臨床医を訓練および評価するための制御された方法を提供し、診断エラーを減らします。
触診ベースのトレーニングシナリオ中の触覚および聴覚フィードバックに基づいたマルチモーダル疼痛合成を目的とした医療ロボットシミュレーターであるロボパティエントを提示します。
ロボパティエントは、触診中に生成された触覚刺激に応じて、声と顔の声を上げて象徴的な痛みの表現を合成することができる適応性のある仲介者として機能します。
腹部ファントムを使用して、ロボパイティエントは、内部触診からペインへのマッピングモデルを介して触媒入力をキャプチャおよび処理します。
触診と対応する聴覚出力との間の知覚的な一致を評価するために、20人の参加者で7680回の試験を含む研究を実施し、そこで音を介して痛みの強さを評価しました。
結果は、振幅とピッチが痛みの音に関係なく、ロボットの痛みの表現との一致に大きく影響することを示しています。
より強い触診力は、精神物理学的パターンと整合し、より強力な一致を引き出しました。
この研究では、2つの重要な次元が明らかになりました。ピッチと振幅は、人々が痛みの音をどのように知覚するかの中心であり、ピッチが最も影響力のあるキューです。
これらの音響的特徴は、触診中の適用力と音がどれだけうまく対応し、認識されたリアリズムに影響を与えるかを形作ります。
このアプローチは、臨床教育と診断シミュレーションにおける高忠実度ロボット患者の基礎を築きます。

要約(オリジナル)

Misdiagnosis can lead to delayed treatments and harm. Robotic patients offer a controlled way to train and evaluate clinicians in rare, subtle, or complex cases, reducing diagnostic errors. We present RoboPatient, a medical robotic simulator aimed at multimodal pain synthesis based on haptic and auditory feedback during palpation-based training scenarios. The robopatient functions as an adaptive intermediary, capable of synthesizing plausible pain expressions vocal and facial in response to tactile stimuli generated during palpation. Using an abdominal phantom, robopatient captures and processes haptic input via an internal palpation-to-pain mapping model. To evaluate perceptual congruence between palpation and the corresponding auditory output, we conducted a study involving 7680 trials across 20 participants, where they evaluated pain intensity through sound. Results show that amplitude and pitch significantly influence agreement with the robot’s pain expressions, irrespective of pain sounds. Stronger palpation forces elicited stronger agreement, aligning with psychophysical patterns. The study revealed two key dimensions: pitch and amplitude are central to how people perceive pain sounds, with pitch being the most influential cue. These acoustic features shape how well the sound matches the applied force during palpation, impacting perceived realism. This approach lays the groundwork for high-fidelity robotic patients in clinical education and diagnostic simulation.

arxiv情報

著者 Saitarun Nadipineni,Chapa Sirithunge,Yue Xie,Fumiya Iida,Thilina Dulantha Lalitharatne
発行日 2025-06-13 14:32:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Auditory-Tactile Congruence for Synthesis of Adaptive Pain Expressions in RoboPatients はコメントを受け付けていません

The Space Between Us: A Methodological Framework for Researching Bonding and Proxemics in Situated Group-Agent Interactions

要約

このペーパーでは、社会的インタラクティブなエージェントとの実際のグループエージェント相互作用における空間的および社会的ダイナミクスを研究するためのマルチメソッドフレームワークを紹介します。
プロキセミックとボンディング理論を利用するこの方法は、主観的な自己報告と客観的な空間追跡を組み合わせています。
ロボットと仮想エージェントを使用して博物館(n = 187)の2つのフィールドスタディに適用されたこの論文は、人間の知覚と行動を調整する際の課題に取り組んでいます。
将来の研究のために、オープンソース、スケーラブル、フィールドテストのツールキットを提示することに焦点を当てています。

要約(オリジナル)

This paper introduces a multimethod framework for studying spatial and social dynamics in real-world group-agent interactions with socially interactive agents. Drawing on proxemics and bonding theories, the method combines subjective self-reports and objective spatial tracking. Applied in two field studies in a museum (N = 187) with a robot and a virtual agent, the paper addresses the challenges in aligning human perception and behavior. We focus on presenting an open source, scalable, and field-tested toolkit for future studies.

arxiv情報

著者 Ana Müller,Anja Richert
発行日 2025-06-13 14:32:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO, stat.ME | The Space Between Us: A Methodological Framework for Researching Bonding and Proxemics in Situated Group-Agent Interactions はコメントを受け付けていません

Autonomous Robotic Radio Source Localization via a Novel Gaussian Mixture Filtering Approach

要約

この研究では、未知の環境での自律的なロボット無線信号ソースの検索とローカリゼーションの問題の推定パフォーマンスを改善するために、新しいガウス混合フィルター(GMF)を提案しています。
提案されたフィルターは、最初にベンチマーク数値問題でテストされ、粒子フィルター(PF)や粒子ガウス混合(PGM)フィルターなどの他の最先端のアプローチとのパフォーマンスを検証します。
次に、提案されたアプローチがテストされ、実際のロボットフィールド実験でPFおよびPGMフィルターに対して比較され、実際のアプリケーションへの影響を検証します。
考慮された現実世界のシナリオは、範囲のみの測定値と測定モデルでの不確実性で部分的に観察されます。
結果は、提案されたフィルターがPFと比較して改善されたパフォーマンスを示す一方で、この部分的な観測可能性を効果的に処理できることを示しており、比較技術よりも堅牢性が改善されたことを示しながら、計算要件を減らします。

要約(オリジナル)

This study proposes a new Gaussian Mixture Filter (GMF) to improve the estimation performance for the autonomous robotic radio signal source search and localization problem in unknown environments. The proposed filter is first tested with a benchmark numerical problem to validate the performance with other state-of-the-practice approaches such as Particle Filter (PF) and Particle Gaussian Mixture (PGM) filters. Then the proposed approach is tested and compared against PF and PGM filters in real-world robotic field experiments to validate its impact for real-world applications. The considered real-world scenarios have partial observability with the range-only measurement and uncertainty with the measurement model. The results show that the proposed filter can handle this partial observability effectively whilst showing improved performance compared to PF, reducing the computation requirements while demonstrating improved robustness over compared techniques.

arxiv情報

著者 Sukkeun Kim,Sangwoo Moon,Ivan Petrunin,Hyo-Sang Shin,Shehryar Khattak
発行日 2025-06-13 14:42:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.SP | Autonomous Robotic Radio Source Localization via a Novel Gaussian Mixture Filtering Approach はコメントを受け付けていません

Your Ride, Your Rules: Psychology and Cognition Enabled Automated Driving Systems

要約

自律運転の急速な進歩にもかかわらず、現在の自動運転車(AVS)には、居住者との効果的な双方向通信が欠けており、不動化からのパーソナライズと回復が制限されています。
これにより、快適さと信頼が軽減され、より広範なAV採用が遅くなります。
AVSが外部交通と内部の居住者状態の両方を感知、解釈、および対応できるようにする、人間中心の自律的な枠組みであるPACE-ADS(心理学と認知対応の自動運転システム)を提案します。
PACE-ADSは、3つの基礎モデルベースのエージェントで構成されています。運転コンテキストを分析するドライバーエージェント、居住者の心理的信号(EEG、心拍数、表情)(例えば、スピーチ)を解釈する心理学者エージェント、およびこれらの入力を統合して高レベルの行動決定と運用パラメーターを作成するコーディネーターエージェント。
既存のAVモジュールを置き換えるのではなく、PACE-ADSは行動レベルで動作し、低レベルの制御をネイティブAVシステムに委任することで補完します。
この分離により、閉ループの適応が可能になり、多様なプラットフォーム間の統合がサポートされます。
信号、歩行者、作業ゾーン、車のフォローを含むさまざまなシナリオにわたって、シミュレーションでPACE-ADを評価します。
結果は、PACE-ADSが運転スタイルを居住者状態に適応させ、乗り心地を改善し、自律的推論または人間の指導を介して固定化から安全に回復できることを示しています。
私たちの調査結果は、機械の自律性と人間中心の運転の間のギャップを埋めるためのLLMベースのフレームワークの約束を強調しています。

要約(オリジナル)

Despite rapid advances in autonomous driving, current autonomous vehicles (AVs) lack effective bidirectional communication with occupants, limiting personalization and recovery from immobilization. This reduces comfort and trust, potentially slowing broader AV adoption. We propose PACE-ADS (Psychology and Cognition Enabled Automated Driving Systems), a human-centered autonomy framework that enables AVs to sense, interpret, and respond to both external traffic and internal occupant states. PACE-ADS comprises three foundation model-based agents: a Driver Agent that analyzes the driving context, a Psychologist Agent that interprets occupant psychological signals (e.g., EEG, heart rate, facial expressions) and cognitive commands (e.g., speech), and a Coordinator Agent that integrates these inputs to produce high-level behavior decisions and operational parameters. Rather than replacing existing AV modules, PACE-ADS complements them by operating at the behavioral level, delegating low-level control to native AV systems. This separation enables closed-loop adaptation and supports integration across diverse platforms. We evaluate PACE-ADS in simulation across varied scenarios involving traffic lights, pedestrians, work zones, and car following. Results show that PACE-ADS adapts driving styles to occupant states, improves ride comfort, and enables safe recovery from immobilization via autonomous reasoning or human guidance. Our findings highlight the promise of LLM-based frameworks for bridging the gap between machine autonomy and human-centered driving.

arxiv情報

著者 Zhipeng Bao,Qianwen Li
発行日 2025-06-13 14:44:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Your Ride, Your Rules: Psychology and Cognition Enabled Automated Driving Systems はコメントを受け付けていません

Palpation Alters Auditory Pain Expressions with Gender-Specific Variations in Robopatients

要約

診断エラーは、特に資源制限された地域で、予防可能な死亡の主な原因のままです。
ロボパイティ患者を含む医療トレーニングシミュレーターは、触診などの手続き訓練のために実際の患者を模倣することにより、これらのエラーを減らす上で重要な役割を果たします。
ただし、マルチモーダルフィードバック、特に聴覚の痛みの表現の生成は、触診と音の複雑な関係のために困難なままです。
痛みの音の高次元性により、従来の方法で探索が困難になります。
この研究では、機械学習を使用して人間のフィードバックを共同最適化することにより、触診力に応答して聴覚疼痛表現を動的に生成するロボパタティア患者の疼痛表現性の新しい実験パラダイムを紹介します。
継続的な適応のために最適化された強化学習(RL)技術である近位政策最適化(PPO)を使用して、ロボットはリアルタイムの人間のフィードバックに基づいて痛みの音を繰り返し洗練します。
このロボットは、触診力に対する無作為化疼痛反応を初期化し、RLエージェントはこれらの音を調整して人間の好みに合わせて調整することを学びます。
結果は、システムが個人の触診力と健全な好みに適応し、軽度の不快感から急性苦痛まで、聴覚疼痛空間のRLガイド付き探査を通じて、幅広い痛みの強さを捉えることを実証しました。
この研究はさらに、痛みの健全性知覚が性別特異的しきい値を持つ低い力で飽和を示すことを示しました。
これらの調査結果は、制御可能で没入型のシミュレーションプラットフォームを提供することにより、腹部触診トレーニングを強化するシステムの可能性を強調しています。

要約(オリジナル)

Diagnostic errors remain a major cause of preventable deaths, particularly in resource-limited regions. Medical training simulators, including robopatients, play a vital role in reducing these errors by mimicking real patients for procedural training such as palpation. However, generating multimodal feedback, especially auditory pain expressions, remains challenging due to the complex relationship between palpation behavior and sound. The high-dimensional nature of pain sounds makes exploration challenging with conventional methods. This study introduces a novel experimental paradigm for pain expressivity in robopatients where they dynamically generate auditory pain expressions in response to palpation force, by co-optimizing human feedback using machine learning. Using Proximal Policy Optimization (PPO), a reinforcement learning (RL) technique optimized for continuous adaptation, our robot iteratively refines pain sounds based on real-time human feedback. This robot initializes randomized pain responses to palpation forces, and the RL agent learns to adjust these sounds to align with human preferences. The results demonstrated that the system adapts to an individual’s palpation forces and sound preferences and captures a broad spectrum of pain intensity, from mild discomfort to acute distress, through RL-guided exploration of the auditory pain space. The study further showed that pain sound perception exhibits saturation at lower forces with gender specific thresholds. These findings highlight the system’s potential to enhance abdominal palpation training by offering a controllable and immersive simulation platform.

arxiv情報

著者 Chapa Sirithunge,Yue Xie,Saitarun Nadipineni,Fumiya Iida,Thilina Dulantha Lalitharatne
発行日 2025-06-13 15:55:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Palpation Alters Auditory Pain Expressions with Gender-Specific Variations in Robopatients はコメントを受け付けていません

Extended Hybrid Zero Dynamics for Bipedal Walking of the Knee-less Robot SLIDER

要約

スライダーのような膝のない二足歩行ロボットには、従来のヒューマノイドロボットと比較して、超軽量脚と歩行エネルギー効率の向上の利点があります。
この論文では、まず、新しいラインフィートとより最適化された質量分布を備えたスライダーバイペダルロボットの改善されたハードウェア設計を導入し、より高い移動速度を可能にします。
第二に、スライダーなどのプリズムジョイントロボットに適用できる拡張ハイブリッドゼロダイナミクス(EHZD)メソッドを提案します。
次に、EHZDメソッドを使用して、オフラインでの参照速度が異なる歩行ライブラリを生成します。
第三に、ガイド付きディープ補強学習(DRL)アルゴリズムが提案されており、事前に生成されたライブラリを使用してウォーキングコントロールポリシーをリアルタイムで作成します。
このアプローチにより、HZD(フルダナミクスモデルを使用して安定した歩行を生成するため)とDRL(リアルタイム適応歩行生成用)の両方の利点を組み合わせることができます。
実験結果は、このアプローチが以前のMPCベースのアプローチよりも150%高い歩行速度を達成することを示しています。

要約(オリジナル)

Knee-less bipedal robots like SLIDER have the advantage of ultra-lightweight legs and improved walking energy efficiency compared to traditional humanoid robots. In this paper, we firstly introduce an improved hardware design of the SLIDER bipedal robot with new line-feet and more optimized mass distribution that enables higher locomotion speeds. Secondly, we propose an extended Hybrid Zero Dynamics (eHZD) method, which can be applied to prismatic joint robots like SLIDER. The eHZD method is then used to generate a library of gaits with varying reference velocities in an offline way. Thirdly, a Guided Deep Reinforcement Learning (DRL) algorithm is proposed to use the pre-generated library to create walking control policies in real-time. This approach allows us to combine the advantages of both HZD (for generating stable gaits with a full-dynamics model) and DRL (for real-time adaptive gait generation). The experimental results show that this approach achieves 150% higher walking velocity than the previous MPC-based approach.

arxiv情報

著者 Rui Zong,Martin Liang,Yuntian Fang,Ke Wang,Xiaoshuai Chen,Wei Chen,Petar Kormushev
発行日 2025-06-13 15:58:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Extended Hybrid Zero Dynamics for Bipedal Walking of the Knee-less Robot SLIDER はコメントを受け付けていません

A Soft Robotic Module with Pneumatic Actuation and Enhanced Controllability Using a Shape Memory Alloy Wire

要約

このホワイトペーパーでは、圧縮された空気作動式ソフトロボットモジュールが開発され、形状メモリ合金(SMA)ワイヤがその構造に組み込まれ、より高い精度で目的の曲げ角を実現しました。
第一に、ポリプロピレンで作られたひずみ制限層を備えた繊維強化曲げモジュールを製造しました。
次に、SMAワイヤをシリコンマトリックスに配置しました。これは、新しいひずみ制限層として使用されました。
単純な閉ループ制御アルゴリズムを使用して、ワークスペース内のソフトロボットの曲げ角を調整しました。
垂直面の角度変化を測定するためにカメラを使用しました。
0〜65度の範囲のさまざまな角度がカバーされ、モジュールと曲げ角制御アルゴリズムの性能を評価しました。
実験テストは、SMAワイヤを使用すると、垂直面での曲げのより正確な制御が得られることを示しています。
さらに、作業圧力が少ないほど曲がることができます。
エラー範囲は平均5度から2度に減少し、立ち上がり時間は平均19秒から3秒に短縮されました。

要約(オリジナル)

In this paper, a compressed air-actuated soft robotic module was developed by incorporating a shape memory alloy (SMA) wire into its structure to achieve the desired bending angle with greater precision. First, a fiber-reinforced bending module with a strain-limiting layer made of polypropylene was fabricated. The SMA wire was then placed in a silicon matrix, which was used as a new strain-limiting layer. A simple closed-loop control algorithm was used to regulate the bending angle of the soft robot within its workspace. A camera was utilized to measure the angular changes in the vertical plane. Different angles, ranging from 0 to 65 degrees, were covered to evaluate the performance of the module and the bending angle control algorithm. The experimental tests demonstrate that using the SMA wire results in more precise control of bending in the vertical plane. In addition, it is possible to bend more with less working pressure. The error range was reduced from an average of 5 degrees to 2 degrees, and the rise time was reduced from an average of 19 seconds to 3 seconds.

arxiv情報

著者 Mohammadnavid Golchin
発行日 2025-06-13 16:03:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Soft Robotic Module with Pneumatic Actuation and Enhanced Controllability Using a Shape Memory Alloy Wire はコメントを受け付けていません

mimic-one: a Scalable Model Recipe for General Purpose Robot Dexterity

要約

サンプル効率の良い学習とスムーズな細かい運動行動推論のために設計された、非常に器用なヒューマノイドロボットハンドの実際の制御のための拡散ベースのモデルレシピを提示します。
私たちのシステムは、広角リストカメラを装備し、フランカエミカパンダアームに取り付けられた、新しく設計された16ドフ腱駆動型の手を備えています。
グローブベースとVRインターフェイスの両方を使用して、汎用性の高いテレオ操作パイプラインとデータ収集プロトコルを開発し、ピックや場所、アイテムの並べ替え、アセンブリ挿入などの多様なタスク全体で高品質のデータ収集を可能にします。
高周波生成制御を活用して、生の感覚入力からエンドツーエンドのポリシーをトレーニングし、複雑な操作シナリオでスムーズで自己修正する動きを可能にします。
現実世界の評価は、分布の成功率から最大93.3%を示しており、緊急の自己修正行動のために最大33.3%のパフォーマンスが向上し、政策パフォーマンスのスケーリング傾向も明らかにします。
私たちの結果は、ハードウェア、学習、現実世界の展開に対する完全に統合された実用的なアプローチを通じて、器用なロボット操作の最先端を前進させます。

要約(オリジナル)

We present a diffusion-based model recipe for real-world control of a highly dexterous humanoid robotic hand, designed for sample-efficient learning and smooth fine-motor action inference. Our system features a newly designed 16-DoF tendon-driven hand, equipped with wide angle wrist cameras and mounted on a Franka Emika Panda arm. We develop a versatile teleoperation pipeline and data collection protocol using both glove-based and VR interfaces, enabling high-quality data collection across diverse tasks such as pick and place, item sorting and assembly insertion. Leveraging high-frequency generative control, we train end-to-end policies from raw sensory inputs, enabling smooth, self-correcting motions in complex manipulation scenarios. Real-world evaluations demonstrate up to 93.3% out of distribution success rates, with up to a +33.3% performance boost due to emergent self-correcting behaviors, while also revealing scaling trends in policy performance. Our results advance the state-of-the-art in dexterous robotic manipulation through a fully integrated, practical approach to hardware, learning, and real-world deployment.

arxiv情報

著者 Elvis Nava,Victoriano Montesinos,Erik Bauer,Benedek Forrai,Jonas Pai,Stefan Weirich,Stephan-Daniel Gravert,Philipp Wand,Stephan Polinski,Benjamin F. Grewe,Robert K. Katzschmann
発行日 2025-06-13 16:09:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | mimic-one: a Scalable Model Recipe for General Purpose Robot Dexterity はコメントを受け付けていません

Learning Overspecified Gaussian Mixtures Exponentially Fast with the EM Algorithm

要約

過剰に指定されたガウス混合モデルに適用されたとき、EMアルゴリズムの収束特性を調査します。つまり、適合モデルのコンポーネントの数が真の基礎分布の数を超える場合です。
コンポーネントの平均が通常のシンプレックスの頂点に配置され、混合重量が非偏光条件を満たす構造化された構成に焦点を当てると、母集団EMアルゴリズムがKullback-Leibler(KL)距離の観点から指数関数的に速く収束することを示します。
私たちの分析は、最適な周辺の近隣の負の対数尤度関数の強い凸性を活用し、polyak-{\ l} ojasiewiczの不等式を利用して、$ \ epsilon $ -Accurate近似が$ o(\ log(1/\ epsilon))$ iterationsで達成できることを確立します。
さらに、これらの結果は、明示的な統計的収束保証を導き出すことにより、有限サンプル設定に拡張します。
合成データセットの数値実験は、私たちの理論的発見を裏付け、従来のサブリンレートと比較して収束の劇的な加速を強調しています。
この作業は、特別な設定におけるEMの行動の理解を深めるだけでなく、高次元クラスタリングおよび密度推定タスクの初期化戦略とモデル設計に関する実用的な洞察を提供します。

要約(オリジナル)

We investigate the convergence properties of the EM algorithm when applied to overspecified Gaussian mixture models — that is, when the number of components in the fitted model exceeds that of the true underlying distribution. Focusing on a structured configuration where the component means are positioned at the vertices of a regular simplex and the mixture weights satisfy a non-degeneracy condition, we demonstrate that the population EM algorithm converges exponentially fast in terms of the Kullback-Leibler (KL) distance. Our analysis leverages the strong convexity of the negative log-likelihood function in a neighborhood around the optimum and utilizes the Polyak-{\L}ojasiewicz inequality to establish that an $\epsilon$-accurate approximation is achievable in $O(\log(1/\epsilon))$ iterations. Furthermore, we extend these results to a finite-sample setting by deriving explicit statistical convergence guarantees. Numerical experiments on synthetic datasets corroborate our theoretical findings, highlighting the dramatic acceleration in convergence compared to conventional sublinear rates. This work not only deepens the understanding of EM’s behavior in overspecified settings but also offers practical insights into initialization strategies and model design for high-dimensional clustering and density estimation tasks.

arxiv情報

著者 Zhenisbek Assylbekov,Alan Legg,Artur Pak
発行日 2025-06-13 14:57:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Learning Overspecified Gaussian Mixtures Exponentially Fast with the EM Algorithm はコメントを受け付けていません