CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving

要約

軌道計画は、自律的な運転に不可欠であり、複雑な環境での安全で効率的なナビゲーションを確保します。
最近の学習ベースの方法、特に強化学習(RL)は特定のシナリオで有望であることを示していますが、RLプランナーは非効率性のトレーニングと大規模で現実世界の運転シナリオの管理に苦労しています。
この論文では、\ textbf {carplanner}、a \ textbf {c} onsistent \ textbf {a} uto- \ textbf {r} earsission \ textbf {planner}を紹介します。
自動回帰構造により、効率的な大規模なRLトレーニングが可能になり、一貫性の組み込みにより、時間ステップを越えて一貫した時間的一貫性を維持することにより、安定したポリシー学習が保証されます。
さらに、Carplannerは、専門家が誘導する報酬機能と不変視ビューモジュールを備えた世代選択フレームワークを採用し、RLトレーニングを簡素化し、ポリシーパフォーマンスを向上させます。
広範な分析では、提案されたRLフレームワークが、トレーニング効率とパフォーマンス向上の課題に効果的に対処し、自律運転における軌跡計画の有望なソリューションとしてカープレーナーを配置することを実施しています。
私たちの知る限り、私たちは、RLベースのプランナーが、挑戦的な大規模な現実世界のデータセットNuplanでILおよびルールベースの最先端(SOTA)の両方を超えることができることを最初に示しています。
提案されたCarplannerは、この要求の厳しいデータセット内でRL-、IL-、およびルールベースのSOTAアプローチを上回ります。

要約(オリジナル)

Trajectory planning is vital for autonomous driving, ensuring safe and efficient navigation in complex environments. While recent learning-based methods, particularly reinforcement learning (RL), have shown promise in specific scenarios, RL planners struggle with training inefficiencies and managing large-scale, real-world driving scenarios. In this paper, we introduce \textbf{CarPlanner}, a \textbf{C}onsistent \textbf{a}uto-\textbf{r}egressive \textbf{Planner} that uses RL to generate multi-modal trajectories. The auto-regressive structure enables efficient large-scale RL training, while the incorporation of consistency ensures stable policy learning by maintaining coherent temporal consistency across time steps. Moreover, CarPlanner employs a generation-selection framework with an expert-guided reward function and an invariant-view module, simplifying RL training and enhancing policy performance. Extensive analysis demonstrates that our proposed RL framework effectively addresses the challenges of training efficiency and performance enhancement, positioning CarPlanner as a promising solution for trajectory planning in autonomous driving. To the best of our knowledge, we are the first to demonstrate that the RL-based planner can surpass both IL- and rule-based state-of-the-arts (SOTAs) on the challenging large-scale real-world dataset nuPlan. Our proposed CarPlanner surpasses RL-, IL-, and rule-based SOTA approaches within this demanding dataset.

arxiv情報

著者 Dongkun Zhang,Jiaming Liang,Ke Guo,Sha Lu,Qi Wang,Rong Xiong,Zhenwei Miao,Yue Wang
発行日 2025-03-24 14:03:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving はコメントを受け付けていません

ETAP: Event-based Tracking of Any Point

要約

任意のポイント(TAP)を追跡すると、最近、モーション推定パラダイムが個々の顕著なポイントに焦点を合わせて、ローカルテンプレートを使用してグローバルな画像コンテキストで任意のポイントを追跡することにシフトしました。
ただし、研究では、名目設定でモデルの精度を促進することに焦点を当てていますが、センサーの制限により、照明条件や高速モーションの困難な条件と高速モーションのシナリオに対処することに焦点を当てています。
この作業は、最初のイベントカメラベースのTAPメソッドでこの課題に対処します。
堅牢な高速追跡のために、高い時間分解能とイベントカメラの高いダイナミックレンジを活用し、非同期およびまばらなイベント測定を処理するためのTAPメソッドのグローバルコンテキストを活用します。
さらに、TAPフレームワークを拡張して、モーションによって誘導されるイベント機能のバリエーションを処理します。これにより、純粋にイベントベースの追跡におけるオープンな課題に対処します。
私たちの方法は、新しいデータ生成パイプラインのデータでトレーニングされ、すべての設計上の決定にわたって体系的に除去されます。
私たちの方法は、強力なクロスダタセットの一般化を示しており、ベースラインよりも平均ジャッカーメトリックで136%優れたパフォーマンスを発揮します。
さらに、確立された機能追跡ベンチマークでは、以前のベストイベントのみの方法よりも20%の改善を達成し、以前のベストイベントとフレーム方法を4.1%上回ります。
私たちのコードは、https://github.com/tub-rip/etapで入手できます

要約(オリジナル)

Tracking any point (TAP) recently shifted the motion estimation paradigm from focusing on individual salient points with local templates to tracking arbitrary points with global image contexts. However, while research has mostly focused on driving the accuracy of models in nominal settings, addressing scenarios with difficult lighting conditions and high-speed motions remains out of reach due to the limitations of the sensor. This work addresses this challenge with the first event camera-based TAP method. It leverages the high temporal resolution and high dynamic range of event cameras for robust high-speed tracking, and the global contexts in TAP methods to handle asynchronous and sparse event measurements. We further extend the TAP framework to handle event feature variations induced by motion — thereby addressing an open challenge in purely event-based tracking — with a novel feature-alignment loss which ensures the learning of motion-robust features. Our method is trained with data from a new data generation pipeline and systematically ablated across all design decisions. Our method shows strong cross-dataset generalization and performs 136% better on the average Jaccard metric than the baselines. Moreover, on an established feature tracking benchmark, it achieves a 20% improvement over the previous best event-only method and even surpasses the previous best events-and-frames method by 4.1%. Our code is available at https://github.com/tub-rip/ETAP

arxiv情報

著者 Friedhelm Hamann,Daniel Gehrig,Filbert Febryanto,Kostas Daniilidis,Guillermo Gallego
発行日 2025-03-24 14:08:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | ETAP: Event-based Tracking of Any Point はコメントを受け付けていません

Kalib: Easy Hand-Eye Calibration with Reference Point Tracking

要約

ハンドアイキャリブレーションは、カメラとロボット間の変換を推定することを目的としています。
従来の方法は、かなりの手動の努力と正確なセットアップを必要とする法律上のマーカーに依存しています。
ディープラーニングの最近の進歩により、マーカーレステクニックが導入されていますが、各ロボットの再訓練ネットワークやデータ生成の正確なメッシュモデルへのアクセスなど、より前提条件が伴います。
このホワイトペーパーでは、これらの課題を克服するために視覚基盤モデルの一般化可能性を活用する自動で設定できるハンドアイキャリブレーション方法であるKalibを提案します。
ロボットの運動系チェーンとロボットの事前定義された基準点の2つの基本的な前提条件のみが備わっています。
キャリブレーション中、参照ポイントはカメラスペースで追跡されます。
ロボット座標内の対応する3D座標は、前方の運動学によって推測できます。
次に、PNPソルバーは、新しいネットワークをトレーニングしたり、メッシュモデルにアクセスすることなく、カメラとロボット間の変換を直接推定します。
シミュレートされたベンチマークと現実世界のベンチマークの評価は、カリブが最近のベースライン方法と比較してより低い手動ワークロードで良好な精度を達成することを示しています。
また、さまざまなロボットアームとグリッパーを備えた複数の現実世界の設定でそのアプリケーションを実証します。
Kalibのユーザーフレンドリーな設計と最小限のセットアップ要件により、構造化されていない環境での継続的な動作のためのソリューションが可能になります。

要約(オリジナル)

Hand-eye calibration aims to estimate the transformation between a camera and a robot. Traditional methods rely on fiducial markers, which require considerable manual effort and precise setup. Recent advances in deep learning have introduced markerless techniques but come with more prerequisites, such as retraining networks for each robot, and accessing accurate mesh models for data generation. In this paper, we propose Kalib, an automatic and easy-to-setup hand-eye calibration method that leverages the generalizability of visual foundation models to overcome these challenges. It features only two basic prerequisites, the robot’s kinematic chain and a predefined reference point on the robot. During calibration, the reference point is tracked in the camera space. Its corresponding 3D coordinates in the robot coordinate can be inferred by forward kinematics. Then, a PnP solver directly estimates the transformation between the camera and the robot without training new networks or accessing mesh models. Evaluations in simulated and real-world benchmarks show that Kalib achieves good accuracy with a lower manual workload compared with recent baseline methods. We also demonstrate its application in multiple real-world settings with various robot arms and grippers. Kalib’s user-friendly design and minimal setup requirements make it a possible solution for continuous operation in unstructured environments.

arxiv情報

著者 Tutian Tang,Minghao Liu,Wenqiang Xu,Cewu Lu
発行日 2025-03-24 14:22:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Kalib: Easy Hand-Eye Calibration with Reference Point Tracking はコメントを受け付けていません

Physics-Informed Multi-Agent Reinforcement Learning for Distributed Multi-Robot Problems

要約

マルチロボットシステムのネットワーク化された性質は、マルチエージェント強化学習のコンテキストで課題を提示します。
集中型制御ポリシーは、ロボットの数が増えて拡大しませんが、独立した制御ポリシーは他のロボットから提供される情報を活用せず、協力競争的タスクのパフォーマンスが低いことを示しています。
この作業では、物理学に基づいた強化学習アプローチを提案します。これは、スケーラブルであり、各ロボットに利用可能なすべての情報を利用できる分散マルチロボット制御ポリシーを学習できます。
私たちのアプローチには3つの重要な特性があります。
第一に、物理ロボットシステムの省エネルギー特性とロボットチームの相互作用のネットワーク化された性質を尊重するために、政策表現にポートハミルトニアン構造を課します。
第二に、自己関節を使用して、相互作用グラフから各ロボットで時間変動情報を処理できるまばらなポリシー表現を確保します。
第三に、値関数係数の必要性を克服しながら、トレーニング中のロボット間の相関を説明する自己関節のポートハミルトニアン制御ポリシーによってパラメーター化されたソフトアクターcriticな強化学習アルゴリズムを提示します。
さまざまなマルチロボットシナリオでの広範なシミュレーションは、提案されたアプローチの成功を示しており、スケーラビリティの以前のマルチロボット補強学習ソリューションを上回り、同様または優れたパフォーマンスを達成します(トレーニング時のロボット数を超えるロボットチームの最先端の累積報酬を平均化します)。
また、不完全な通信の下でジョージア工科大学ロボタリウムの複数の実際のロボットでのアプローチを検証し、ロボットの数にわたってゼロショットSIMからリアルへの転送とスケーラビリティを示しています。

要約(オリジナル)

The networked nature of multi-robot systems presents challenges in the context of multi-agent reinforcement learning. Centralized control policies do not scale with increasing numbers of robots, whereas independent control policies do not exploit the information provided by other robots, exhibiting poor performance in cooperative-competitive tasks. In this work we propose a physics-informed reinforcement learning approach able to learn distributed multi-robot control policies that are both scalable and make use of all the available information to each robot. Our approach has three key characteristics. First, it imposes a port-Hamiltonian structure on the policy representation, respecting energy conservation properties of physical robot systems and the networked nature of robot team interactions. Second, it uses self-attention to ensure a sparse policy representation able to handle time-varying information at each robot from the interaction graph. Third, we present a soft actor-critic reinforcement learning algorithm parameterized by our self-attention port-Hamiltonian control policy, which accounts for the correlation among robots during training while overcoming the need of value function factorization. Extensive simulations in different multi-robot scenarios demonstrate the success of the proposed approach, surpassing previous multi-robot reinforcement learning solutions in scalability, while achieving similar or superior performance (with averaged cumulative reward up to x2 greater than the state-of-the-art with robot teams x6 larger than the number of robots at training time). We also validate our approach on multiple real robots in the Georgia Tech Robotarium under imperfect communication, demonstrating zero-shot sim-to-real transfer and scalability across number of robots.

arxiv情報

著者 Eduardo Sebastian,Thai Duong,Nikolay Atanasov,Eduardo Montijano,Carlos Sagues
発行日 2025-03-24 14:36:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.MA, cs.RO, cs.SY, eess.SY | Physics-Informed Multi-Agent Reinforcement Learning for Distributed Multi-Robot Problems はコメントを受け付けていません

RoboEngine: Plug-and-Play Robot Data Augmentation with Semantic Robot Segmentation and Background Generation

要約

視覚的増強は、模倣学習の視覚的堅牢性を高めるための重要な技術となっています。
ただし、既存の方法は、カメラのキャリブレーションや制御された環境の必要性(緑色の画面設定など)などの前提条件によって制限されることがよくあります。
この作業では、最初のプラグアンドプレイのビジュアルロボットデータ増強ツールキットであるRoboBeengineを紹介します。
初めて、ユーザーは数行のコードで物理学とタスクを意識したロボットシーンを楽に生成できます。
これを実現するために、新しいロボットシーンセグメンテーションデータセット、一般化可能な高品質のロボットセグメンテーションモデル、および微調整されたバックグラウンド生成モデルを紹介します。
Robobeengineを使用して、単一のシーンから収集されたデモンストレーションのみに基づいて、6つのまったく新しいシーンにロボット操作タスクを一般化する機能を実証し、授与なしのベースラインと比較して200%以上のパフォーマンス改善を達成します。
すべてのデータセット、モデルの重み、およびツールキットは公開されます。

要約(オリジナル)

Visual augmentation has become a crucial technique for enhancing the visual robustness of imitation learning. However, existing methods are often limited by prerequisites such as camera calibration or the need for controlled environments (e.g., green screen setups). In this work, we introduce RoboEngine, the first plug-and-play visual robot data augmentation toolkit. For the first time, users can effortlessly generate physics- and task-aware robot scenes with just a few lines of code. To achieve this, we present a novel robot scene segmentation dataset, a generalizable high-quality robot segmentation model, and a fine-tuned background generation model, which together form the core components of the out-of-the-box toolkit. Using RoboEngine, we demonstrate the ability to generalize robot manipulation tasks across six entirely new scenes, based solely on demonstrations collected from a single scene, achieving a more than 200% performance improvement compared to the no-augmentation baseline. All datasets, model weights, and the toolkit will be publicly released.

arxiv情報

著者 Chengbo Yuan,Suraj Joshi,Shaoting Zhu,Hang Su,Hang Zhao,Yang Gao
発行日 2025-03-24 14:46:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | RoboEngine: Plug-and-Play Robot Data Augmentation with Semantic Robot Segmentation and Background Generation はコメントを受け付けていません

Robust Tube-based Control Strategy for Vision-guided Autonomous Vehicles

要約

自律車両の堅牢な制御戦略は、システムの安定性を改善し、ライディングの快適さを高め、運転事故を防ぐことができます。
このホワイトペーパーでは、自律コンピュータービジョンベースの車線キーピングのための新しい補間チューブベースの制約済み反復線形レギュレーター(ITUBE-CILQR)アルゴリズムを紹介します。
アルゴリズムの目標は、タイトなターンでの高速コーナリング中の堅牢性を高めることです。
標準のチューブアプローチに対するitube-cilqrの利点には、システム保守主義の減少と計算速度の向上が含まれます。
提案されたアルゴリズムの実現可能性を調べるために、数値および視覚ベースの実験が実施されました。
提案されているITUBE-CILQRアルゴリズムは、分散CILQRベースの方法やモデル予測制御(MPC)アプローチよりも、車線維持により、古典的なインテリアポイントソルバーを使用してアプローチします。
具体的には、評価実験では、itube-cilqrは3.16ミリ秒の平均実行時間を達成し、自動運転車を導くコントロール信号を生成しました。
ITUBE-MPCは通常、同じタスクを完了するために4.67倍の計算時間を必要としました。
さらに、システムの動作に対する保守主義の影響は、レーンキーピング操作中に提案されたITUBE-CILQRアルゴリズムから派生した補間変数の軌跡を調査することにより調査されました。

要約(オリジナル)

A robust control strategy for autonomous vehicles can improve system stability, enhance riding comfort, and prevent driving accidents. This paper presents a novel interpolation tube-based constrained iterative linear quadratic regulator (itube-CILQR) algorithm for autonomous computer-vision-based vehicle lane-keeping. The goal of the algorithm is to enhance robustness during high-speed cornering on tight turns. The advantages of itube-CILQR over the standard tube-approach include reduced system conservatism and increased computational speed. Numerical and vision-based experiments were conducted to examine the feasibility of the proposed algorithm. The proposed itube-CILQR algorithm is better suited to vehicle lane-keeping than variational CILQR-based methods and model predictive control (MPC) approaches using a classical interior-point solver. Specifically, in evaluation experiments, itube-CILQR achieved an average runtime of 3.16 ms to generate a control signal to guide a self-driving vehicle; itube-MPC typically required a 4.67-times longer computation time to complete the same task. Moreover, the influence of conservatism on system behavior was investigated by exploring the interpolation variable trajectories derived from the proposed itube-CILQR algorithm during lane-keeping maneuvers.

arxiv情報

著者 Der-Hau Lee
発行日 2025-03-24 15:01:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | Robust Tube-based Control Strategy for Vision-guided Autonomous Vehicles はコメントを受け付けていません

Double Oracle Algorithm for Game-Theoretic Robot Allocation on Graphs

要約

2人のプレイヤーがロボットを戦略的に割り当てて、関心のある複数のサイトを競うためにロボットを戦略的に割り当てるゲーム理論ロボット割り当ての問題を調査します。
ロボットは、競合するサイトを引き継ぐために相手を妨害して弱めている攻撃的または防御的な機能を備えています。
この問題は、従来の大佐ブロットゲームに属します。
ロボットの不均一な機能と環境要因を考慮して、サイト間のロボット遷移をキャプチャする不均一なロボットタイプとグラフの制約を組み込むことにより、従来のブロットゲームを一般化します。
次に、ダブルオラクルアルゴリズム(DOA)を使用して、一般化したブロットゲームのナッシュ平衡を解決します。
特に、互いに阻害する周期的ドミナンスの腸ゼーション(CDH)ロボットの場合、任意の2つのロボットタイプの間に新しい変換ルールを定義します。
変換に基づいて、ゲームの結果を定量的に測定するための新しいユーティリティ機能を設計します。
さらに、設計されたユーティリティ関数の正確性を厳密に証明します。
最後に、グラフでの均一、線形不均一、およびCDHロボット割り当てのナッシュ平衡を計算する際のDOAの有効性を実証するために、広範なシミュレーションを実施します。

要約(オリジナル)

We study the problem of game-theoretic robot allocation where two players strategically allocate robots to compete for multiple sites of interest. Robots possess offensive or defensive capabilities to interfere and weaken their opponents to take over a competing site. This problem belongs to the conventional Colonel Blotto Game. Considering the robots’ heterogeneous capabilities and environmental factors, we generalize the conventional Blotto game by incorporating heterogeneous robot types and graph constraints that capture the robot transitions between sites. Then we employ the Double Oracle Algorithm (DOA) to solve for the Nash equilibrium of the generalized Blotto game. Particularly, for cyclic-dominance-heterogeneous (CDH) robots that inhibit each other, we define a new transformation rule between any two robot types. Building on the transformation, we design a novel utility function to measure the game’s outcome quantitatively. Moreover, we rigorously prove the correctness of the designed utility function. Finally, we conduct extensive simulations to demonstrate the effectiveness of DOA on computing Nash equilibrium for homogeneous, linear heterogeneous, and CDH robot allocation on graphs.

arxiv情報

著者 Zijian An,Lifeng Zhou
発行日 2025-03-24 15:57:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Double Oracle Algorithm for Game-Theoretic Robot Allocation on Graphs はコメントを受け付けていません

Autonomous Generation of Sub-goals for Lifelong Learning in Robots

要約

ロボットでの自由な学習の課題の1つは、目標を自律的に発見し、それらを達成するためのスキルを学ぶ必要性です。
ただし、生涯学習設定では、目標へのステッピングストーンとして、明示的な報酬に依存することなく、関連するスキルでサブゴールを生成することが常に望ましいです。
これにより、サブゴールとスキルを再利用して、他の目標を達成することができます。
この作業は、サブゴール生成がこの課題に対処するための2張りのアプローチを提案します。サブゴールは、本質的な動機を使用してそれらを発見する一般的な目標から階層的に導き出されます。
これらの方法は、より一般的な目標を達成する方法として、ロボットがサブゴールを自律的に生成し、チェーンするのに役立ちます。
さらに、彼らは目標のより抽象的な表現を作成し、サブゴールの重複を減らし、スキルの学習をより効率的にするのに役立ちます。
生涯にわたるオープンエンド学習のための既存の認知アーキテクチャ内で実装され、実際のロボットでテストされたこのアプローチは、ロボットの目標を発見して達成し、効率的な方法でサブゴールを生成し、学習スキルを一般化し、明示的な中等度の報酬なしで動的および未知の環境で動作する能力を高めます。

要約(オリジナル)

One of the challenges of open-ended learning in robots is the need to autonomously discover goals and learn skills to achieve them. However, when in lifelong learning settings, it is always desirable to generate sub-goals with their associated skills, without relying on explicit reward, as steppingstones to a goal. This allows sub-goals and skills to be reused to facilitate achieving other goals. This work proposes a two-pronged approach for sub-goal generation to address this challenge: a top-down approach, where sub-goals are hierarchically derived from general goals using intrinsic motivations to discover them, and a bottom-up approach, where sub-goal chains emerge from making latent relationships between goals and perceptual classes that were previously learned in different domains explicit. These methods help the robot to autonomously generate and chain sub-goals as a way to achieve more general goals. Additionally, they create more abstract representations of goals, helping to reduce sub-goal duplication and make the learning of skills more efficient. Implemented within an existing cognitive architecture for lifelong open-ended learning and tested with a real robot, our approach enhances the robot’s ability to discover and achieve goals, generate sub-goals in an efficient manner, generalize learned skills, and operate in dynamic and unknown environments without explicit intermediate rewards.

arxiv情報

著者 Emanuel Fallas Hernández,Sergio Martínez Alonso,Alejandro Romero,Jose A. Becerra Permuy,Richard J. Duro
発行日 2025-03-24 17:26:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Autonomous Generation of Sub-goals for Lifelong Learning in Robots はコメントを受け付けていません

Differentially Private Joint Independence Test

要約

2つ以上のランダムベクター間の共同依存の識別は、データに機密情報または機密情報が含まれる場合がある多くの統計的アプリケーションで重要な役割を果たします。
この論文では、差別的なプライバシーの文脈におけるD変数Hilbert-Schmidt独立基準(DHSIC)を検討します。
DHSICの経験的推定の制限分布は複雑なガウスカオスであることを考えると、非プリバシー体制でテストを構築することは通常、順列とブートストラップに基づいています。
プライバシーの共同依存を検出するために、差別的にプライベートな順列方法論を採用することにより、DHSICベースのテスト手順を提案します。
私たちの方法は、プライバシー保証、有効なレベル、ポイントワイズの一貫性を享受しますが、ブートストラップのカウンターパートは一貫性のない力に苦しみます。
さらに、DHSICメトリックと$ L_2 $メトリックで提案されたテストの均一なパワーを調査します。これは、提案されたテストが異なるプライバシー制度にわたってMinimax最適なパワーを達成することを示しています。
副産物として、我々の結果には、非公式の順列DHSICのポイントワイズと均一なパワーも含まれており、未解決の質問に対処したPfister et al。
(2018)。

要約(オリジナル)

Identification of joint dependence among more than two random vectors plays an important role in many statistical applications, where the data may contain sensitive or confidential information. In this paper, we consider the the d-variable Hilbert-Schmidt independence criterion (dHSIC) in the context of differential privacy. Given the limiting distribution of the empirical estimate of dHSIC is complicated Gaussian chaos, constructing tests in the non-privacy regime is typically based on permutation and bootstrap. To detect joint dependence in privacy, we propose a dHSIC-based testing procedure by employing a differentially private permutation methodology. Our method enjoys privacy guarantee, valid level and pointwise consistency, while the bootstrap counterpart suffers inconsistent power. We further investigate the uniform power of the proposed test in dHSIC metric and $L_2$ metric, indicating that the proposed test attains the minimax optimal power across different privacy regimes. As a byproduct, our results also contain the pointwise and uniform power of the non-private permutation dHSIC, addressing an unsolved question remained in Pfister et al. (2018).

arxiv情報

著者 Xingwei Liu,Yuexin Chen,Wangli Xu
発行日 2025-03-24 14:32:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62G10, 62H20, cs.CR, cs.LG, math.ST, stat.ME, stat.ML, stat.TH | Differentially Private Joint Independence Test はコメントを受け付けていません

Thermalizer: Stable autoregressive neural emulation of spatiotemporal chaos

要約

時空間システムの自己回帰サロゲートモデル(または\ textit {エミュレーター})は、科学と工学全体に広範なアプリケーションを備えた高速で近似予測の道を提供します。
ただし、推論の時点では、これらのモデルは一般に、軌跡の発散につながるエラーの蓄積により、長期間のロールアウトにわたって予測を提供することができません。
本質的に、エミュレーターは分布から動作し、オンライン配信を制御することは大規模な設定で迅速に扱いにくいものになります。
この基本的な問題に対処し、不変の尺度を認める時期システムに焦点を当てるために、拡散モデルを活用して、この不変尺度のスコアの暗黙的な推定器を取得します。
スコア関数のこのモデルを使用して、推論中にオンザフライ除去を適用することにより、自己回帰エミュレータのロールアウトを安定させることができることを示します。
エミュレータのロールアウトの熱化は、乱流と混oticとした挙動を示す複雑なシステムで、安定した予測の時間期間を1桁延長し、神経エミュレーションの文脈で拡散モデルの新しいアプリケーションを開くことが示されています。

要約(オリジナル)

Autoregressive surrogate models (or \textit{emulators}) of spatiotemporal systems provide an avenue for fast, approximate predictions, with broad applications across science and engineering. At inference time, however, these models are generally unable to provide predictions over long time rollouts due to accumulation of errors leading to diverging trajectories. In essence, emulators operate out of distribution, and controlling the online distribution quickly becomes intractable in large-scale settings. To address this fundamental issue, and focusing on time-stationary systems admitting an invariant measure, we leverage diffusion models to obtain an implicit estimator of the score of this invariant measure. We show that this model of the score function can be used to stabilize autoregressive emulator rollouts by applying on-the-fly denoising during inference, a process we call \textit{thermalization}. Thermalizing an emulator rollout is shown to extend the time horizon of stable predictions by an order of magnitude in complex systems exhibiting turbulent and chaotic behavior, opening up a novel application of diffusion models in the context of neural emulation.

arxiv情報

著者 Chris Pedersen,Laure Zanna,Joan Bruna
発行日 2025-03-24 14:38:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Thermalizer: Stable autoregressive neural emulation of spatiotemporal chaos はコメントを受け付けていません