On the Importance of Tactile Sensing for Imitation Learning: A Case Study on Robotic Match Lighting

要約

ロボット操作の分野は、過去数年間で大幅に進歩しています。
センシングレベルでは、正確な連絡先情報を提供できるいくつかの新しい触覚センサーが開発されています。
方法論的レベルでは、デモンストレーションから学ぶことで、パフォーマンスのロボット操作ポリシーを取得するための効率的なパラダイムが証明されています。
両方の組み合わせは、デモンストレーションデータから重要な連絡先に関連する情報を抽出し、ポリシーロールアウト中に積極的に活用するという約束を保持します。
しかし、その可能性にもかかわらず、それは未熟な方向のままです。
したがって、この作業は、高速で器用な操作ポリシーを効率的に学習できるマルチモーダルで視覚操作模倣学習フレームワークを提案しています。
ロボットマッチ照明の動的で接触豊富なタスクに関するフレームワークを評価します。これは、触覚フィードバックが人間の操作性能に影響を与えるタスクです。
実験結果は、触覚情報をポリシーに追加するとパフォーマンスが40%を大幅に向上させ、それによって接触豊富な操作タスクの触覚センシングの重要性を強調することを示しています。
プロジェクトWebサイト:https://sites.google.com/view/tactile-il。

要約(オリジナル)

The field of robotic manipulation has advanced significantly in the last years. At the sensing level, several novel tactile sensors have been developed, capable of providing accurate contact information. On a methodological level, learning from demonstrations has proven an efficient paradigm to obtain performant robotic manipulation policies. The combination of both holds the promise to extract crucial contact-related information from the demonstration data and actively exploit it during policy rollouts. However, despite its potential, it remains an underexplored direction. This work therefore proposes a multimodal, visuotactile imitation learning framework capable of efficiently learning fast and dexterous manipulation policies. We evaluate our framework on the dynamic, contact-rich task of robotic match lighting – a task in which tactile feedback influences human manipulation performance. The experimental results show that adding tactile information into the policies significantly improves performance by over 40%, thereby underlining the importance of tactile sensing for contact-rich manipulation tasks. Project website: https://sites.google.com/view/tactile-il .

arxiv情報

著者 Niklas Funk,Changqi Chen,Tim Schneider,Georgia Chalvatzaki,Roberto Calandra,Jan Peters
発行日 2025-04-18 10:48:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | On the Importance of Tactile Sensing for Imitation Learning: A Case Study on Robotic Match Lighting はコメントを受け付けていません

Robust Humanoid Walking on Compliant and Uneven Terrain with Deep Reinforcement Learning

要約

現実世界の環境での脚のロボットの展開には、予期しない変形性と不規則性を示す可能性のある地形に挑戦するための堅牢な運動制御方法を開発することが不可欠です。
このホワイトペーパーでは、準拠および不均一な地形でのヒューマノイドロボット用の二足歩行運動コントローラーの設計にSIM-to-Real Deep Renection Learning(RL)の適用を調査します。
私たちの重要な貢献は、シミュレーションでRLエージェントをランダム化された地形にさらすための簡単なトレーニングカリキュラムが、固有受容フィードバックのみを使用して実際のヒューマノイドロボットで堅牢な歩行を実現できることを示すことです。
提案されたアプローチを使用してエンドツーエンドの二足歩行運動ポリシーをトレーニングし、ラボ環境内外のいくつかの困難な地形にわたってHRP-5Pヒューマノイドに関する広範なレアルロボットデモンストレーションを示します。
さらに、ロボットがさまざまなステッピング周波数のあるlobot幅を示すことが許可されている場合、二足歩行の歩行ポリシーの堅牢性を改善できると主張します。
観測されたクロック信号の変更を有効にするための新しい制御ポリシーを提案し、地形とコマンド速度に応じて適応的な歩行頻度につながります。
シミュレーション実験を通じて、スイングとスタンスの期間を制御することにより、挑戦的な地形を歩き回るためのこのポリシーの有効性を示します。
トレーニングと評価のコードは、https://github.com/rohanpsingh/learninghumanoidwalkingでオンラインで入手できます。
デモビデオはhttps://www.youtube.com/watch?v=zgfnzgakk2qで入手できます。

要約(オリジナル)

For the deployment of legged robots in real-world environments, it is essential to develop robust locomotion control methods for challenging terrains that may exhibit unexpected deformability and irregularity. In this paper, we explore the application of sim-to-real deep reinforcement learning (RL) for the design of bipedal locomotion controllers for humanoid robots on compliant and uneven terrains. Our key contribution is to show that a simple training curriculum for exposing the RL agent to randomized terrains in simulation can achieve robust walking on a real humanoid robot using only proprioceptive feedback. We train an end-to-end bipedal locomotion policy using the proposed approach, and show extensive real-robot demonstration on the HRP-5P humanoid over several difficult terrains inside and outside the lab environment. Further, we argue that the robustness of a bipedal walking policy can be improved if the robot is allowed to exhibit aperiodic motion with variable stepping frequency. We propose a new control policy to enable modification of the observed clock signal, leading to adaptive gait frequencies depending on the terrain and command velocity. Through simulation experiments, we show the effectiveness of this policy specifically for walking over challenging terrains by controlling swing and stance durations. The code for training and evaluation is available online at https://github.com/rohanpsingh/LearningHumanoidWalking. Demo video is available at https://www.youtube.com/watch?v=ZgfNzGAkk2Q.

arxiv情報

著者 Rohan P. Singh,Mitsuharu Morisawa,Mehdi Benallegue,Zhaoming Xie,Fumio Kanehiro
発行日 2025-04-18 10:49:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Robust Humanoid Walking on Compliant and Uneven Terrain with Deep Reinforcement Learning はコメントを受け付けていません

Robot Navigation in Dynamic Environments using Acceleration Obstacles

要約

このペーパーでは、加速度障害に対する速度障害と非線形速度障害の概念を拡張することにより、動的環境での動き計画の問題に対処し、AOと非線形加速障害物NAO。
VOとNLVOと同様に、AOとNAOは、それぞれ線形および非線形の軌跡に沿って障害物が移動する操縦ロボットの衝突する一定の加速のセットを表します。
以前の作品とは反対に、AOとNAOの正確な境界を分析的に導き出します。
これらの表現の直感的な理解を高めるために、最初にいくつかのステップでAOを導き出します。まず、ロボットと障害のゼロ初期速度を想定しながら、一定の加速で動く障害と衝突するロボットの一定の加速度のセットで構成される基本的な加速障害物BaoにVoを拡張します。
これは、ロボットと障害物の任意の初期速度を想定しながら、AOに拡張されます。
そして最後に、以前の仮定に加えて、arbitrary意的な軌跡に沿って移動する障害を説明するNAOを導き出します。
NAOの導入により、ロボットの2次のダイナミクスを直接説明する安全な回避操作の生成が可能になり、加速度が制御入力として加速されます。
AOとNAOは、挑戦的な道路交通における回避策を選択するいくつかの例で実証されています。
NAOを使用すると、複雑な道路交通シナリオで移動しながら、操縦ロボットの加速の調整速度が大幅に減少することが示されています。
提示されたアプローチにより、複数のロボットのリアクティブで効率的なナビゲーションが可能になり、複雑な動的環境で動作する自律車両の潜在的な用途があります。

要約(オリジナル)

This paper addresses the issue of motion planning in dynamic environments by extending the concept of Velocity Obstacle and Nonlinear Velocity Obstacle to Acceleration Obstacle AO and Nonlinear Acceleration Obstacle NAO. Similarly to VO and NLVO, the AO and NAO represent the set of colliding constant accelerations of the maneuvering robot with obstacles moving along linear and nonlinear trajectories, respectively. Contrary to prior works, we derive analytically the exact boundaries of AO and NAO. To enhance an intuitive understanding of these representations, we first derive the AO in several steps: first extending the VO to the Basic Acceleration Obstacle BAO that consists of the set of constant accelerations of the robot that would collide with an obstacle moving at constant accelerations, while assuming zero initial velocities of the robot and obstacle. This is then extended to the AO while assuming arbitrary initial velocities of the robot and obstacle. And finally, we derive the NAO that in addition to the prior assumptions, accounts for obstacles moving along arbitrary trajectories. The introduction of NAO allows the generation of safe avoidance maneuvers that directly account for the robot’s second-order dynamics, with acceleration as its control input. The AO and NAO are demonstrated in several examples of selecting avoidance maneuvers in challenging road traffic. It is shown that the use of NAO drastically reduces the adjustment rate of the maneuvering robot’s acceleration while moving in complex road traffic scenarios. The presented approach enables reactive and efficient navigation for multiple robots, with potential application for autonomous vehicles operating in complex dynamic environments.

arxiv情報

著者 Asher Stern,Zvi Shiller
発行日 2025-04-18 11:22:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Robot Navigation in Dynamic Environments using Acceleration Obstacles はコメントを受け付けていません

Performance Analysis of a Mass-Spring-Damper Deformable Linear Object Model in Robotic Simulation Frameworks

要約

ケーブル、ワイヤー、弦などの変形可能な線形オブジェクト(DLO)のモデリングは、柔軟で変形可能な性質のために重要な課題を提示します。
ロボット工学では、DLOSの動的な動作を正確にシミュレートすることは、ワイヤーの取り扱いやアセンブリなどのタスクを自動化するために不可欠です。
提示された研究は、リファレンスモデルとして質量噴水(MSD)システムを使用して、シミュレーションでロボットをトレーニングするためのドメインランダム化(DR)を介した力データ収集を目的とした予備分析です。
この研究の目的は、ISAAC SIMとGazeboを使用して、これらのシナリオでのDR技術の適用可能性を検証するDLOダイナミクスに対するモデルパラメーターの変動の影響を評価することを目的としています。

要約(オリジナル)

The modelling of Deformable Linear Objects (DLOs) such as cables, wires, and strings presents significant challenges due to their flexible and deformable nature. In robotics, accurately simulating the dynamic behavior of DLOs is essential for automating tasks like wire handling and assembly. The presented study is a preliminary analysis aimed at force data collection through domain randomization (DR) for training a robot in simulation, using a Mass-Spring-Damper (MSD) system as the reference model. The study aims to assess the impact of model parameter variations on DLO dynamics, using Isaac Sim and Gazebo to validate the applicability of DR technique in these scenarios.

arxiv情報

著者 Andrea Govoni,Nadia Zubair,Simone Soprani,Gianluca Palli
発行日 2025-04-18 12:38:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Performance Analysis of a Mass-Spring-Damper Deformable Linear Object Model in Robotic Simulation Frameworks はコメントを受け付けていません

Magnecko: Design and Control of a Quadrupedal Magnetic Climbing Robot

要約

クライミングロボットは、特に危険または到達しにくい環境で、産業検査やメンテナンスなどのアプリケーションに大きな約束を抱いています。
この論文では、脚の登山機関の研究プラットフォームを提供するという主要な目標を持って開発されたQuadrupedal Climbing Robot Magneckoについて説明します。
昆虫スタイルのジョイント構成に配置された12の作動性自由度により、マグネックの高い操作性と高い可動域により、凹面90度のコーナーを克服するなどの挑戦的な環境を処理できます。
モデル予測コントローラーにより、マグネココは水平方向のオーバーハングと垂直壁の地面をcraいることができます。
カスタムアクチュエーターと鉄の表面の接着に使用される電気透視の磁石のおかげで、システムは、すべての方向で独自の体重の少なくとも65%の追加ペイロードを運ぶのに十分なほど強力です。
マグネックプラットフォームは、複雑な3次元環境で運動を登るための基盤として機能します。

要約(オリジナル)

Climbing robots hold significant promise for applications such as industrial inspection and maintenance, particularly in hazardous or hard-to-reach environments. This paper describes the quadrupedal climbing robot Magnecko, developed with the major goal of providing a research platform for legged climbing locomotion. With its 12 actuated degrees of freedom arranged in an insect-style joint configuration, Magnecko’s high manipulability and high range of motion allow it to handle challenging environments like overcoming concave 90 degree corners. A model predictive controller enables Magnecko to crawl on the ground on horizontal overhangs and on vertical walls. Thanks to the custom actuators and the electro-permanent magnets that are used for adhesion on ferrous surfaces, the system is powerful enough to carry additional payloads of at least 65 percent of its own weight in all orientations. The Magnecko platform serves as a foundation for climbing locomotion in complex three-dimensional environments.

arxiv情報

著者 Stefan Leuthard,Timo Eugster,Nicolas Faesch,Riccardo Feingold,Connor Flynn,Michael Fritsche,Nicolas Hürlimann,Elena Morbach,Fabian Tischhauser,Matthias Müller,Markus Montenegro,Valerio Schelbert,Jia-Ruei Chiu,Philip Arm,Marco Hutter
発行日 2025-04-18 13:06:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Magnecko: Design and Control of a Quadrupedal Magnetic Climbing Robot はコメントを受け付けていません

A Dynamic Safety Shield for Safe and Efficient Reinforcement Learning of Navigation Tasks

要約

Rehnection Learning(RL)は、さまざまなロボットアプリケーションに正常に適用されており、古典的な方法よりも優れています。
ただし、RLの安全性と現実世界への移転は、オープンな課題のままです。
この課題に取り組み、トレーニングと実行中にエージェントの安全を確保するための顕著な分野は、安全な補強学習です。
安全なRLは、制約されたRLおよび安全な探査アプローチを通じて達成できます。
前者は、トレーニングの終了までに安全な行動を達成するためのトレーニングの過程で、トレーニングの初期段階での衝突の数が多いことを学びます。
後者は、安全性の制約をハード制約として強制することにより堅牢な安全性を提供します。これにより、衝突が防止されますが、RLエージェントの調査が妨げられ、その結果、報酬が低くパフォーマンスが低下します。
これらの欠点を克服するために、最適化ベースのコントローラーの堅牢性とRLエージェントの長い予測機能を組み合わせた新しい安全シールドを提案し、RLエージェントがコントローラーのパラメーターを適応的に調整できるようにします。
私たちのアプローチは、衝突の数を最小限に抑えながら、ナビゲーションタスクのRLエージェントの調査を改善することができます。
シミュレーションの実験は、私たちのアプローチが、さまざまな挑戦的な環境で到達された目標と衝突率の最先端のベースラインよりも優れていることを示しています。
目標と都市の比率メトリックは、タスクを達成することを学びながら、衝突の数を最小限に抑えることの重要性を強調しています。
私たちのアプローチは、古典的な安全シールドと比較して、制約付きのRLアプローチと比較してより少ない衝突の到達目標を達成します。
最後に、実際の実験で提案された方法のパフォーマンスを実証します。

要約(オリジナル)

Reinforcement learning (RL) has been successfully applied to a variety of robotics applications, where it outperforms classical methods. However, the safety aspect of RL and the transfer to the real world remain an open challenge. A prominent field for tackling this challenge and ensuring the safety of the agents during training and execution is safe reinforcement learning. Safe RL can be achieved through constrained RL and safe exploration approaches. The former learns the safety constraints over the course of training to achieve a safe behavior by the end of training, at the cost of high number of collisions at earlier stages of the training. The latter offers robust safety by enforcing the safety constraints as hard constraints, which prevents collisions but hinders the exploration of the RL agent, resulting in lower rewards and poor performance. To overcome those drawbacks, we propose a novel safety shield, that combines the robustness of the optimization-based controllers with the long prediction capabilities of the RL agents, allowing the RL agent to adaptively tune the parameters of the controller. Our approach is able to improve the exploration of the RL agents for navigation tasks, while minimizing the number of collisions. Experiments in simulation show that our approach outperforms state-of-the-art baselines in the reached goals-to-collisions ratio in different challenging environments. The goals-to-collisions ratio metrics emphasizes the importance of minimizing the number of collisions, while learning to accomplish the task. Our approach achieves a higher number of reached goals compared to the classic safety shields and fewer collisions compared to constrained RL approaches. Finally, we demonstrate the performance of the proposed method in a real-world experiment.

arxiv情報

著者 Murad Dawood,Ahmed Shokry,Maren Bennewitz
発行日 2025-04-18 13:37:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | A Dynamic Safety Shield for Safe and Efficient Reinforcement Learning of Navigation Tasks はコメントを受け付けていません

Self-Mixing Laser Interferometry: In Search of an Ambient Noise-Resilient Alternative to Acoustic Sensing

要約

セルフミキシング干渉法(SMI)は、マイクロバイブ化を検出する際の感度で賞賛されていますが、ターゲットとの物理的接触は必要ありません。
マイクロバイブレーション、つまり、音は最近、ロボット操作における外因性接触の顕著な指標として使用されています。
以前の作業では、音響センシングの周囲のノイズライレンな代替品として、外因性接触センシングのためにSMIを使用してロボットの指先を提示しました。
ここでは、検証実験を周波数領域に拡張します。
ブロードバンドの周囲ノイズの場合、SMIは依然として音響センシングよりも優れていることがわかりますが、違いは時間領域分析よりも顕著ではありません。
ターゲットを絞った騒音障害の場合、複数のロボットが同時に同じタスクのデータを収集するのと同様に、SMIはまだ明確な勝者です。
最後に、モーターノイズが音響センシングよりもSMIセンシングにどのように影響するか、そして将来の作業にはより高いSMI読み出し頻度が重要であることを示します。
設計およびデータファイルは、https://github.com/remkopr/icra2025-smi-tactile-sensingで入手できます。

要約(オリジナル)

Self-mixing interferometry (SMI) has been lauded for its sensitivity in detecting microvibrations, while requiring no physical contact with its target. Microvibrations, i.e., sounds, have recently been used as a salient indicator of extrinsic contact in robotic manipulation. In previous work, we presented a robotic fingertip using SMI for extrinsic contact sensing as an ambient-noise-resilient alternative to acoustic sensing. Here, we extend the validation experiments to the frequency domain. We find that for broadband ambient noise, SMI still outperforms acoustic sensing, but the difference is less pronounced than in time-domain analyses. For targeted noise disturbances, analogous to multiple robots simultaneously collecting data for the same task, SMI is still the clear winner. Lastly, we show how motor noise affects SMI sensing more so than acoustic sensing, and that a higher SMI readout frequency is important for future work. Design and data files are available at https://github.com/RemkoPr/icra2025-SMI-tactile-sensing.

arxiv情報

著者 Remko Proesmans,Thomas Lips,Francis wyffels
発行日 2025-04-18 14:20:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Self-Mixing Laser Interferometry: In Search of an Ambient Noise-Resilient Alternative to Acoustic Sensing はコメントを受け付けていません

Unified Manipulability and Compliance Analysis of Modular Soft-Rigid Hybrid Fingers

要約

このペーパーでは、モジュラーソフトリジッドハイブリッドロボット指の操作性とコンプライアンスを分析するための統一されたフレームワークを紹介します。
このアプローチは、油圧および空気圧の両方の作動システムに適用されます。
Jacobianベースの製剤は、ジョイントとタスク空間の応答へのアクチュエータの入力をマップします。
油圧アクチュエーターは非圧縮性の仮定の下でモデル化され、空気圧アクチュエーターは非線形圧力容積関係を使用して記述されます。
このフレームワークにより、作動モード全体の操作性楕円体とコンプライアンスマトリックスの一貫した評価が可能になります。
Dexco(油圧)とEdgy-2(空気圧)の2つの代表的な手を使用して分析を検証します。
結果は、器用さと受動的剛性の作動依存のトレードオフを強調しています。
これらの調査結果は、ソフトリギッドロボット指の構造認識設計とアクチュエータの選択に関する洞察を提供します。

要約(オリジナル)

This paper presents a unified framework to analyze the manipulability and compliance of modular soft-rigid hybrid robotic fingers. The approach applies to both hydraulic and pneumatic actuation systems. A Jacobian-based formulation maps actuator inputs to joint and task-space responses. Hydraulic actuators are modeled under incompressible assumptions, while pneumatic actuators are described using nonlinear pressure-volume relations. The framework enables consistent evaluation of manipulability ellipsoids and compliance matrices across actuation modes. We validate the analysis using two representative hands: DexCo (hydraulic) and Edgy-2 (pneumatic). Results highlight actuation-dependent trade-offs in dexterity and passive stiffness. These findings provide insights for structure-aware design and actuator selection in soft-rigid robotic fingers.

arxiv情報

著者 Jianshu Zhou,Boyuan Liang,Junda Huang,Masayoshi Tomizuka
発行日 2025-04-18 17:05:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Unified Manipulability and Compliance Analysis of Modular Soft-Rigid Hybrid Fingers はコメントを受け付けていません

DiffOG: Differentiable Policy Trajectory Optimization with Generalizability

要約

模倣学習ベースの視覚運動ポリシーは、操作タスクに優れていますが、モデルベースの方法と比較して最適でないアクション軌跡を生成することがよくあります。
カメラデータをニューラルネットワークを介したアクションに直接マッピングすると、ぎくしゃくした動きや、重要な制約を満たし、現実世界の展開における安全性と堅牢性の侵害が困難になる可能性があります。
制約の高い堅牢性または厳密な順守を必要とするタスクの場合、軌道の品質が重要であることを保証します。
ただし、ニューラルネットワークに解釈可能性がないため、制御された方法で制約に準拠したアクションを生成することが困難になります。
このペーパーでは、視覚運動ポリシーを強化するために設計された学習ベースの軌跡最適化フレームワークである一般化可能性(diffog)を使用した微分可能なポリシー軌道最適化を紹介します。
Transformerを使用した軌道最適化の提案された微分可能な定式化を活用することにより、Diffogは一般化可能な最適化レイヤーとポリシーをシームレスに統合します。
Diffogによって強化された視覚運動ポリシーは、より解釈可能な方法でよりスムーズで制約準拠のアクション軌跡を生成します。
Diffogは、強力な一般化能力と高い柔軟性を示します。
11のシミュレートされたタスクと2つの実際のタスクにわたるディフェグを評価しました。
結果は、ディフェグが視覚運動ポリシーの軌跡の品質を大幅に向上させながら、ポリシーのパフォーマンスに最小限の影響を与え、貪欲な制約クリッピングやペナルティベースの軌跡の最適化などの軌跡処理ベースラインを上回ることを示しています。
さらに、Diffogは、既存の制約された視覚運動ポリシーと比較して優れた性能を達成します。

要約(オリジナル)

Imitation learning-based visuomotor policies excel at manipulation tasks but often produce suboptimal action trajectories compared to model-based methods. Directly mapping camera data to actions via neural networks can result in jerky motions and difficulties in meeting critical constraints, compromising safety and robustness in real-world deployment. For tasks that require high robustness or strict adherence to constraints, ensuring trajectory quality is crucial. However, the lack of interpretability in neural networks makes it challenging to generate constraint-compliant actions in a controlled manner. This paper introduces differentiable policy trajectory optimization with generalizability (DiffOG), a learning-based trajectory optimization framework designed to enhance visuomotor policies. By leveraging the proposed differentiable formulation of trajectory optimization with transformer, DiffOG seamlessly integrates policies with a generalizable optimization layer. Visuomotor policies enhanced by DiffOG generate smoother, constraint-compliant action trajectories in a more interpretable way. DiffOG exhibits strong generalization capabilities and high flexibility. We evaluated DiffOG across 11 simulated tasks and 2 real-world tasks. The results demonstrate that DiffOG significantly enhances the trajectory quality of visuomotor policies while having minimal impact on policy performance, outperforming trajectory processing baselines such as greedy constraint clipping and penalty-based trajectory optimization. Furthermore, DiffOG achieves superior performance compared to existing constrained visuomotor policy.

arxiv情報

著者 Zhengtong Xu,Zichen Miao,Qiang Qiu,Zhe Zhang,Yu She
発行日 2025-04-18 17:20:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DiffOG: Differentiable Policy Trajectory Optimization with Generalizability はコメントを受け付けていません

On the Convergence of Irregular Sampling in Reproducing Kernel Hilbert Spaces

要約

Kernel Hilbertスペース(RKH)の再現における機能のサンプリングアルゴリズムの収束を分析します。
この目的のために、カーネルと入力データの両方の最小限の仮定の下で、カーネル回帰の近似特性について説明します。
最初に、カーネルのRKHSノルムでエラー推定値を証明します。
これにより、コンパクトドメインでのカーネル回帰の均一な収束に関する新しい結果が得られます。
Lipschitzの連続的およびH \ ‘より古い連続カーネルの場合、収束率を証明します。

要約(オリジナル)

We analyse the convergence of sampling algorithms for functions in reproducing kernel Hilbert spaces (RKHS). To this end, we discuss approximation properties of kernel regression under minimalistic assumptions on both the kernel and the input data. We first prove error estimates in the kernel’s RKHS norm. This leads us to new results concerning uniform convergence of kernel regression on compact domains. For Lipschitz continuous and H\’older continuous kernels, we prove convergence rates.

arxiv情報

著者 Armin Iske
発行日 2025-04-18 10:57:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML | On the Convergence of Irregular Sampling in Reproducing Kernel Hilbert Spaces はコメントを受け付けていません