Olympus: A Jumping Quadruped for Planetary Exploration Utilizing Reinforcement Learning for In-Flight Attitude Control

要約

月や火星などの重力が低い惑星体を探索することで、脚のあるロボットがジャンプを効率的な形態の移動として利用することで、探検のための伝統的なローバーよりも貴重な利点を与えます。
この事実に動機付けられているこのペーパーでは、火星の重力に合わせたジャンプする足のロボットであるオリンパスの設計、シミュレーション、および学習ベースの「飛行中」の態度コントロールを紹介します。
まず、設計要件の概要を説明し、その後、シミュレーションがロボットの設計を脚から全体的な構成まで、高い垂直ジャンプ、前方ジャンプ距離、および飛行中の態度の再配向に向けてどのように最適化できるかを詳述します。
その後、希望する飛行中の態度操作を追跡するために使用される強化学習ポリシーが提示されます。
SIM2REALギャップをうまく交差させると、態度の再配向テストの広範な実験的研究が実証されています。

要約(オリジナル)

Exploring planetary bodies with lower gravity, such as the moon and Mars, allows legged robots to utilize jumping as an efficient form of locomotion thus giving them a valuable advantage over traditional rovers for exploration. Motivated by this fact, this paper presents the design, simulation, and learning-based ‘in-flight’ attitude control of Olympus, a jumping legged robot tailored to the gravity of Mars. First, the design requirements are outlined followed by detailing how simulation enabled optimizing the robot’s design – from its legs to the overall configuration – towards high vertical jumping, forward jumping distance, and in-flight attitude reorientation. Subsequently, the reinforcement learning policy used to track desired in-flight attitude maneuvers is presented. Successfully crossing the sim2real gap, extensive experimental studies of attitude reorientation tests are demonstrated.

arxiv情報

著者 Jørgen Anker Olsen,Grzegorz Malczyk,Kostas Alexis
発行日 2025-03-05 15:01:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Olympus: A Jumping Quadruped for Planetary Exploration Utilizing Reinforcement Learning for In-Flight Attitude Control はコメントを受け付けていません

Collaborative motion planning for multi-manipulator systems through Reinforcement Learning and Dynamic Movement Primitives

要約

ロボットタスクでは、タスクの効率と速度を向上させるために複数のマニピュレーターが必要になることがよくありますが、これにより、コラボレーション、衝突回避、および拡張された状態アクションスペースの観点から複雑さが向上します。
これらの課題に対処するために、補強学習(RL)と動的運動プリミティブ(DMP)を組み合わせたマルチレベルのアプローチを提案し、デモンストレーションライブラリを使用して動的環境で新しいタスクの適応型、リアルタイムの軌跡を生成します。
この方法により、衝突のない軌道の生成と効率的な共同運動計画が保証されます。
UR5Eロボットマニピュレーターを使用したPybulletシミュレーション環境での実験を通じてアプローチを検証します。

要約(オリジナル)

Robotic tasks often require multiple manipulators to enhance task efficiency and speed, but this increases complexity in terms of collaboration, collision avoidance, and the expanded state-action space. To address these challenges, we propose a multi-level approach combining Reinforcement Learning (RL) and Dynamic Movement Primitives (DMP) to generate adaptive, real-time trajectories for new tasks in dynamic environments using a demonstration library. This method ensures collision-free trajectory generation and efficient collaborative motion planning. We validate the approach through experiments in the PyBullet simulation environment with UR5e robotic manipulators.

arxiv情報

著者 Siddharth Singh,Tian Xu,Qing Chang
発行日 2025-03-05 15:13:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Collaborative motion planning for multi-manipulator systems through Reinforcement Learning and Dynamic Movement Primitives はコメントを受け付けていません

TeraSim: Uncovering Unknown Unsafe Events for Autonomous Vehicles through Generative Simulation

要約

交通シミュレーションは、自動運転車(AV)開発に不可欠であり、多様な運転条件全体で包括的な安全評価を可能にします。
ただし、従来のルールベースのシミュレーターは、複雑な人間の相互作用をキャプチャするのに苦労していますが、データ駆動型のアプローチは、長期的な行動リアリズムを維持したり、多様な安全性クリティカルなイベントを生成したりすることができないことがよくあります。
これらの課題に対処するために、未知の安全でないイベントを明らかにし、クラッシュレートなどのAV統計パフォーマンスメトリックを効率的に推定するように設計されたオープンソースの高忠実度トラフィックシミュレーションプラットフォームであるTerasimを提案します。
Terasimは、完全なAVシミュレーションシステムを構築するために、サードパーティの物理シミュレータおよびスタンドアロンAVスタックとのシームレスな統合のために設計されています。
実験結果は、静的エージェントと動的エージェントの両方を含む多様な安全性批判的なイベントを生成し、AVシステムの隠された欠陥を特定し、統計的パフォーマンス評価を可能にする際の有効性を示しています。
これらの調査結果は、AVの安全性評価のための実用的なツールとしてのテラシムの可能性を強調し、研究者、開発者、政策立案者に利益をもたらします。
コードはhttps://github.com/mcity/terasimで入手できます。

要約(オリジナル)

Traffic simulation is essential for autonomous vehicle (AV) development, enabling comprehensive safety evaluation across diverse driving conditions. However, traditional rule-based simulators struggle to capture complex human interactions, while data-driven approaches often fail to maintain long-term behavioral realism or generate diverse safety-critical events. To address these challenges, we propose TeraSim, an open-source, high-fidelity traffic simulation platform designed to uncover unknown unsafe events and efficiently estimate AV statistical performance metrics, such as crash rates. TeraSim is designed for seamless integration with third-party physics simulators and standalone AV stacks, to construct a complete AV simulation system. Experimental results demonstrate its effectiveness in generating diverse safety-critical events involving both static and dynamic agents, identifying hidden deficiencies in AV systems, and enabling statistical performance evaluation. These findings highlight TeraSim’s potential as a practical tool for AV safety assessment, benefiting researchers, developers, and policymakers. The code is available at https://github.com/mcity/TeraSim.

arxiv情報

著者 Haowei Sun,Xintao Yan,Zhijie Qiao,Haojie Zhu,Yihao Sun,Jiawei Wang,Shengyin Shen,Darian Hogue,Rajanikant Ananta,Derek Johnson,Greg Stevens,Greg McGuire,Yifan Wei,Wei Zheng,Yong Sun,Yasuo Fukai,Henry X. Liu
発行日 2025-03-05 16:09:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | TeraSim: Uncovering Unknown Unsafe Events for Autonomous Vehicles through Generative Simulation はコメントを受け付けていません

Motion Planning and Control with Unknown Nonlinear Dynamics through Predicted Reachability

要約

未知の非線形ダイナミクスの下での自律運動計画には、重要な課題があります。
エージェントは、システムナビゲーションを適応的に導くために、到達可能性などのプロパティを取得するために、システムのダイナミクスを継続的に探索する必要があります。
この論文では、ターゲットに向けて実行可能な軌道を計算するように設計されたハイブリッド計画制御フレームワークを提案します。
私たちのアプローチでは、状態空間を分割し、制御された制御入力を備えた区分的アフィン(PWA)システムによってシステムを近似することが含まれます。
PWAシステムを指向の加重グラフに抽象化することにより、アフィンシステムの識別とリーチコントロール理論を介してエッジの存在を段階的に更新し、未知のダイナミクスの事前の情報を活用することにより、予測到達可能性条件を導入します。
ヒューリスティックな重みは、その存在が確実であるか、不確定なままであるかに基づいて、エッジに割り当てられます。
その結果、ミッションの実行中にデータを適応的に収集および分析するフレームワークを提案し、予測グラフを継続的に更新し、グラフ検索の結果に基づいてオンラインでコントローラーを合成します。
未知の地形で動作するモバイルロボットを含むシミュレーションシナリオを通じて、そのアプローチの有効性を実証し、その未知のダイナミクスは単一のインテグレーターモデルとして抽象化されています。

要約(オリジナル)

Autonomous motion planning under unknown nonlinear dynamics presents significant challenges. An agent needs to continuously explore the system dynamics to acquire its properties, such as reachability, in order to guide system navigation adaptively. In this paper, we propose a hybrid planning-control framework designed to compute a feasible trajectory toward a target. Our approach involves partitioning the state space and approximating the system by a piecewise affine (PWA) system with constrained control inputs. By abstracting the PWA system into a directed weighted graph, we incrementally update the existence of its edges via affine system identification and reach control theory, introducing a predictive reachability condition by exploiting prior information of the unknown dynamics. Heuristic weights are assigned to edges based on whether their existence is certain or remains indeterminate. Consequently, we propose a framework that adaptively collects and analyzes data during mission execution, continually updates the predictive graph, and synthesizes a controller online based on the graph search outcomes. We demonstrate the efficacy of our approach through simulation scenarios involving a mobile robot operating in unknown terrains, with its unknown dynamics abstracted as a single integrator model.

arxiv情報

著者 Zhiquan Zhang,Gokul Puthumanaillam,Manav Vora,Melkior Ornik
発行日 2025-03-05 16:14:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Motion Planning and Control with Unknown Nonlinear Dynamics through Predicted Reachability はコメントを受け付けていません

Learning Goal-Directed Object Pushing in Cluttered Scenes with Location-Based Attention

要約

典型的なピックアンドプレイステクニックが不十分である複雑なシナリオでは、多くの場合、非摂取的な操作がロボットがそのタスクを満たすことができるようにすることができます。
ただし、非摂食操作は、ハイブリッドダイナミクスを使用した性質が不十分なため、ロボットがオブジェクトの長期的な動作と接触スイッチングについて推論する必要があり、不確実性に接触するのは堅牢です。
ワークスペースに混乱が存在することは、このタスクをさらに複雑にし、望ましくない衝突を避けるために、より高度な空間分析を含める必要性を導入します。
平面上のプッシュのためのマルチモーダルのカテゴリー探索による補強学習に関する以前の作業に基づいて、散らかったシーンで堅牢な操作を可能にするために位置ベースの注意を組み込むことを提案します。
プッシュタスクを回避するこの障害に対処する以前のアプローチとは異なり、私たちのフレームワークは事前定義されたグローバルパスを必要とせず、操作されたオブジェクトの望ましいターゲット方向を考慮します。
シミュレーションの実験結果と実際のクカIIWAロボットアームを使用して、学習したポリシーがオブジェクトをうまく操作し、動的障害物を含む複雑な障害物構成を介した衝突を回避し、目的のターゲットポーズに到達することを示しています。

要約(オリジナル)

In complex scenarios where typical pick-and-place techniques are insufficient, often non-prehensile manipulation can ensure that a robot is able to fulfill its task. However, non-prehensile manipulation is challenging due to its underactuated nature with hybrid-dynamics, where a robot needs to reason about an object’s long-term behavior and contact-switching, while being robust to contact uncertainty. The presence of clutter in the workspace further complicates this task, introducing the need to include more advanced spatial analysis to avoid unwanted collisions. Building upon prior work on reinforcement learning with multimodal categorical exploration for planar pushing, we propose to incorporate location-based attention to enable robust manipulation in cluttered scenes. Unlike previous approaches addressing this obstacle avoiding pushing task, our framework requires no predefined global paths and considers the desired target orientation of the manipulated object. Experimental results in simulation as well as with a real KUKA iiwa robot arm demonstrate that our learned policy manipulates objects successfully while avoiding collisions through complex obstacle configurations, including dynamic obstacles, to reach the desired target pose.

arxiv情報

著者 Nils Dengler,Juan Del Aguila Ferrandis,João Moura,Sethu Vijayakumar,Maren Bennewitz
発行日 2025-03-05 16:29:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning Goal-Directed Object Pushing in Cluttered Scenes with Location-Based Attention はコメントを受け付けていません

Adaptive Negative Damping Control for User-Dependent Multi-Terrain Walking Assistance with a Hip Exoskeleton

要約

ヒップエクソスケルトンは、さまざまなシナリオ全体でユーザーを支援する汎用性で知られています。
ただし、現在の支援戦略は、個々の歩行パターンに対応し、多様な移動環境に適応する柔軟性を欠いていることがよくあります。
この作業では、ヒトエキソスケレトンシステムの機械的インピーダンスを適応させる新しい制御戦略を提示します。
私たちは、適応性のある仮想ネガティブ減衰として股関節支援トルクを設計します。これは、ユーザーがコントロールを維持し、自発的に動きに貢献できるようにしながら、システムにエネルギーを注入することができます。
5人の健康な被験者を使用した実験は、コントローラーが自由歩行(平均7.2%の減少)と比較して代謝の歩行コストを削減し、下肢の運動学を保存することを示しています。
さらに、私たちの方法は、歩行サイクル全体で外骨格からの最小限の電力損失を達成し(総電力から2%未満の機械的パワー)、ユーザーの動きと同期した作用を確保します。
さらに、ベイジアンの最適化を使用して、支援強度を適応させ、マルチテレイン環境全体のシームレスな適応と移行を可能にします。
当社の戦略は、あらゆる条件下で効率的な送電を達成します。
私たちのアプローチは、股関節外骨格の個別化された適応性があり、単純なコントローラーを実証し、実行可能、適応、およびユーザー依存の制御法の開発を進めています。

要約(オリジナル)

Hip exoskeletons are known for their versatility in assisting users across varied scenarios. However, current assistive strategies often lack the flexibility to accommodate for individual walking patterns and adapt to diverse locomotion environments. In this work, we present a novel control strategy that adapts the mechanical impedance of the human-exoskeleton system. We design the hip assistive torques as an adaptive virtual negative damping, which is able to inject energy into the system while allowing the users to remain in control and contribute voluntarily to the movements. Experiments with five healthy subjects demonstrate that our controller reduces the metabolic cost of walking compared to free walking (average reduction of 7.2%), and it preserves the lower-limbs kinematics. Additionally, our method achieves minimal power losses from the exoskeleton across the entire gait cycle (less than 2% negative mechanical power out of the total power), ensuring synchronized action with the users’ movements. Moreover, we use Bayesian Optimization to adapt the assistance strength and allow for seamless adaptation and transitions across multi-terrain environments. Our strategy achieves efficient power transmission under all conditions. Our approach demonstrates an individualized, adaptable, and straightforward controller for hip exoskeletons, advancing the development of viable, adaptive, and user-dependent control laws.

arxiv情報

著者 Giulia Ramella,Auke Ijspeert,Mohamed Bouri
発行日 2025-03-05 16:52:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Adaptive Negative Damping Control for User-Dependent Multi-Terrain Walking Assistance with a Hip Exoskeleton はコメントを受け付けていません

DMVC-Tracker: Distributed Multi-Agent Trajectory Planning for Target Tracking Using Dynamic Buffered Voronoi and Inter-Visibility Cells

要約

この手紙は、マルチエージェントの空中追跡のための分散軌跡計画方法を提示します。
提案された方法は、動的緩衝型ボロノイセル(DBVC)と動的視覚間視覚セル(DIVC)を使用して、分散軌道生成を策定します。
具体的には、DBVCとDIVCは、エージェント間の相互衝突や閉塞を防ぐ時間変動空間であり、動きのターゲットから適切な距離を維持できるようにします。
DBVCとDIVCを、以前の研究よりも保守的でないアプローチに改良された効率的なバーンスタイン多項式プリミティブベースの追跡生成法と組み合わせます。
提案されたアルゴリズムは、Intel i7デスクトップ上の数ミリ秒以内に各エージェントの軌跡を計算できます。
多数の障害物を持つ環境を含む、挑戦的なシナリオでの追跡パフォーマンスを検証します。

要約(オリジナル)

This letter presents a distributed trajectory planning method for multi-agent aerial tracking. The proposed method uses a Dynamic Buffered Voronoi Cell (DBVC) and a Dynamic Inter-Visibility Cell (DIVC) to formulate the distributed trajectory generation. Specifically, the DBVC and the DIVC are time-variant spaces that prevent mutual collisions and occlusions among agents, while enabling them to maintain suitable distances from the moving target. We combine the DBVC and the DIVC with an efficient Bernstein polynomial motion primitive-based tracking generation method, which has been refined into a less conservative approach than in our previous work. The proposed algorithm can compute each agent’s trajectory within several milliseconds on an Intel i7 desktop. We validate the tracking performance in challenging scenarios, including environments with dozens of obstacles.

arxiv情報

著者 Yunwoo Lee,Jungwon Park,H. Jin Kim
発行日 2025-03-05 17:37:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | DMVC-Tracker: Distributed Multi-Agent Trajectory Planning for Target Tracking Using Dynamic Buffered Voronoi and Inter-Visibility Cells はコメントを受け付けていません

DROP: Dexterous Reorientation via Online Planning

要約

人間のような器用さを達成することは、コンタクトリッチシステムの計画と制御の複雑さのために、ロボット工学における長年の課題です。
Renforcement Learning(RL)では、1つの一般的なアプローチが、非常に平行化されたドメインランダム化シミュレーションを使用して、膨大な連絡先条件をめぐるポリシーを学習し、堅牢なSIMからReal転送を可能にすることでした。
リアルタイムの並列シミュレーションの最近の進歩に触発されたこの作業は、代わりに、有名な手元のキューブの再配向タスクを研究することにより、連絡先に豊富な操作のためのオンライン計画方法の実行可能性を考慮しています。
サンプリングベースの予測コントローラーとビジョンベースのポーズ推定器を使用して、オンラインで連絡先の制御アクションを検索するシンプルなアーキテクチャを提案します。
徹底的な実験を実施して、メソッドの実際のパフォーマンス、建築設計の選択、および堅牢性の重要な要因を評価し、単純なサンプリングベースのアプローチが以前のRLベースの作品に匹敵するパフォーマンスを達成することを実証します。
補足資料:https://caltech-amber.github.io/drop。

要約(オリジナル)

Achieving human-like dexterity is a longstanding challenge in robotics, in part due to the complexity of planning and control for contact-rich systems. In reinforcement learning (RL), one popular approach has been to use massively-parallelized, domain-randomized simulations to learn a policy offline over a vast array of contact conditions, allowing robust sim-to-real transfer. Inspired by recent advances in real-time parallel simulation, this work considers instead the viability of online planning methods for contact-rich manipulation by studying the well-known in-hand cube reorientation task. We propose a simple architecture that employs a sampling-based predictive controller and vision-based pose estimator to search for contact-rich control actions online. We conduct thorough experiments to assess the real-world performance of our method, architectural design choices, and key factors for robustness, demonstrating that our simple sampling-based approach achieves performance comparable to prior RL-based works. Supplemental material: https://caltech-amber.github.io/drop.

arxiv情報

著者 Albert H. Li,Preston Culbertson,Vince Kurtz,Aaron D. Ames
発行日 2025-03-05 18:55:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DROP: Dexterous Reorientation via Online Planning はコメントを受け付けていません

Optimal Decision Tree Pruning Revisited: Algorithms and Complexity

要約

意思決定ツリー剪定操作の包括的な古典的およびパラメーター化された複雑さ分析を提示し、小さな決定ツリーを学習する複雑さに関する最近の研究を拡大します。
これにより、解釈可能で効率的な機械学習モデルを開発することの重要な側面である、決定ツリーの簡素化の計算上の課題に関する新しい洞察を提供します。
私たちは、ヒューリスティックで使用されるサブツリーの交換と育成の基本的な剪定操作に焦点を当てています。
驚くべきことに、サブツリー置換のために多項式時間に最適な剪定を実行できますが、問題はサブツリーの飼育ではNP完全です。
したがって、固定パラメーターのトラクション性または硬度につながるパラメーターと組み合わせを特定し、これらの複雑なクラス間の正確な境界線を確立します。
たとえば、サブツリーの上昇は小さなドメインサイズ$ d $または$ d $ of Featureの場合は困難ですが、$ d^{2d} \ cdot | i |^{o(1)} $の時間で解決できます。ここで、$ | i | $は入力サイズです。
予備的な実験結果で理論的発見を補完し、分析の実際的な意味を示しています。

要約(オリジナル)

We present a comprehensive classical and parameterized complexity analysis of decision tree pruning operations, extending recent research on the complexity of learning small decision trees. Thereby, we offer new insights into the computational challenges of decision tree simplification, a crucial aspect of developing interpretable and efficient machine learning models. We focus on fundamental pruning operations of subtree replacement and raising, which are used in heuristics. Surprisingly, while optimal pruning can be performed in polynomial time for subtree replacement, the problem is NP-complete for subtree raising. Therefore, we identify parameters and combinations thereof that lead to fixed-parameter tractability or hardness, establishing a precise borderline between these complexity classes. For example, while subtree raising is hard for small domain size $D$ or number $d$ of features, it can be solved in $D^{2d} \cdot |I|^{O(1)}$ time, where $|I|$ is the input size. We complement our theoretical findings with preliminary experimental results, demonstrating the practical implications of our analysis.

arxiv情報

著者 Juha Harviainen,Frank Sommer,Manuel Sorge,Stefan Szeider
発行日 2025-03-05 15:02:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Optimal Decision Tree Pruning Revisited: Algorithms and Complexity はコメントを受け付けていません

Efficient Neural SDE Training using Wiener-Space Cubature

要約

神経確率的微分方程式(SDE)は、神経ネットワークによってパラメーター化されたドリフトと拡散項を備えたSDEです。
ニューラルSDEのトレーニング手順は、SDEベクトルフィールド(ニューラルネットワーク)パラメーターを最適化して、無限次元のパススペースでの対物的機能の期待値を最小限に抑えることで構成されています。
既存のトレーニング手法は、これらのパラメーターに関して目的機能の経路ごとの勾配を効率的に計算する方法に焦点を当て、これをモンテカルロシミュレーションとペアにして期待を推定し、確率勾配降下を最適化します。
この作業では、モンテカルロシミュレーションをバイパスして改善する新しいトレーニング手法を紹介します。
結果を拡張して、ウィーナー空間キューブの理論を拡張して、決定論的なODEソリューションの加重合計によって予想される目的機能に近似します。
これにより、効率的なODE ADENTメソッドによって勾配を計算できます。
さらに、合理的な近似を達成するために必要なODEソリューションの数を大幅に減らすために、高次組換えスキームを活用します。
このウィナースペースのキューバチュアアプローチが、モンテカルロシミュレーションのO(1/sqrt(n))速度、または準モンテカルロのo(n)/n)レートを上回ることができることを示しています。

要約(オリジナル)

A neural stochastic differential equation (SDE) is an SDE with drift and diffusion terms parametrized by neural networks. The training procedure for neural SDEs consists of optimizing the SDE vector field (neural network) parameters to minimize the expected value of an objective functional on infinite-dimensional path-space. Existing training techniques focus on methods to efficiently compute path-wise gradients of the objective functional with respect to these parameters, then pair this with Monte-Carlo simulation to estimate the expectation, and stochastic gradient descent to optimize. In this work we introduce a novel training technique which bypasses and improves upon Monte-Carlo simulation; we extend results in the theory of Wiener-space cubature to approximate the expected objective functional by a weighted sum of deterministic ODE solutions. This allows us to compute gradients by efficient ODE adjoint methods. Furthermore, we exploit a high-order recombination scheme to drastically reduce the number of ODE solutions necessary to achieve a reasonable approximation. We show that this Wiener-space cubature approach can surpass the O(1/sqrt(n)) rate of Monte-Carlo simulation, or the O(log(n)/n) rate of quasi-Monte-Carlo, to achieve a O(1/n) rate under reasonable assumptions.

arxiv情報

著者 Luke Snow,Vikram Krishnamurthy
発行日 2025-03-05 15:10:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Efficient Neural SDE Training using Wiener-Space Cubature はコメントを受け付けていません