Design and use of devices to assist movement of the upper limb: review of the literature

要約

この記事では、Prismaの方法論に基づいた系統的レビューを通じて、障害のある人の上肢の動きのための支援装置について説明します。
調査対象のデバイスには、装具から高度なロボット工学に至るまでのテクノロジーが含まれ、運動障害の補償または補充を目指しています。
結果は、アプリケーション(リハビリテーション、日常生活活動)、ターゲットを絞った身体セグメント(遠位、近位、またはグローバル)の多様性、および使用される制御メカニズムとインターフェイスを強調しています。
ただし、さまざまな有望なプロトタイプにもかかわらず、市販のデバイスはほとんどなく、エンドユーザーへの実際の影響を制限しています。
既存のテクノロジーは、機能的自律性と生活の質を改善するのに効果的ですが、人間工学、コスト、および携帯性の点で依然として課題に直面しています。
結論として、この記事では、ユーザー中心のアプローチの重要性を強調し、革新的でモジュール化された、アクセス可能な支援デバイスの開発の道を提案しています。

要約(オリジナル)

This article explores assistive devices for upper limb movement in people with disabilities through a systematic review based on the PRISMA methodology. The studied devices encompass technologies ranging from orthoses to advanced robotics, aiming to compensate for or supplement motor impairments. The results highlight the diversity of applications (rehabilitation, daily living activities), targeted body segments (distal, proximal, or global), as well as control mechanisms and interfaces used. However, despite the variety of promising prototypes, few devices are commercially available, limiting their real impact on end users. Existing technologies, while effective in improving functional autonomy and quality of life, still face challenges in terms of ergonomics, cost, and portability. In conclusion, this article emphasizes the importance of a user-centered approach and proposes avenues for the development of innovative, modular, and accessible assistive devices.

arxiv情報

著者 Charlotte Le Goff,Pauline Coignard,Christine Azevedo-Coste,Franck Geffard,Charles Fattal
発行日 2025-04-09 07:32:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Design and use of devices to assist movement of the upper limb: review of the literature はコメントを受け付けていません

Collision avoidance from monocular vision trained with novel view synthesis

要約

衝突回避は、標高マップや占有グリッドなどの明示的な環境モデルで確認できますが、そのようなモデルを移動ポリシーと統合するには、正確な状態推定が必要です。
この作業では、暗黙の環境モデルからの衝突回避の問題を検討します。
単眼のRGB画像を入力として使用し、2Dガウスのスプラッティングによって生成されたフォトリアリスティック画像から衝突検証ポリシーをトレーニングします。
障害のあるインターセプトコースにロボットをもたらす速度コマンドの下で、RealWorld実験で得られたパイプラインを評価します。
我々の結果は、RGB画像が、トレーニングデータが収集された部屋と分散環境の両方で、衝突回避の決定を下すのに十分であることを示唆しています。

要約(オリジナル)

Collision avoidance can be checked in explicit environment models such as elevation maps or occupancy grids, yet integrating such models with a locomotion policy requires accurate state estimation. In this work, we consider the question of collision avoidance from an implicit environment model. We use monocular RGB images as inputs and train a collisionavoidance policy from photorealistic images generated by 2D Gaussian splatting. We evaluate the resulting pipeline in realworld experiments under velocity commands that bring the robot on an intercept course with obstacles. Our results suggest that RGB images can be enough to make collision-avoidance decisions, both in the room where training data was collected and in out-of-distribution environments.

arxiv情報

著者 Valentin Tordjman–Levavasseur,Stéphane Caron
発行日 2025-04-09 07:39:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Collision avoidance from monocular vision trained with novel view synthesis はコメントを受け付けていません

Domain-Conditioned Scene Graphs for State-Grounded Task Planning

要約

最近のロボットタスク計画フレームワークは、GPT-4Vなどの大規模なマルチモーダルモデル(LMM)を統合しています。
このようなモデルの接地問題に対処するために、パイプラインを知覚状態の接地とその後の状態ベースの計画に分割することが提案されています。
この作業で示すように、LMMベースのアプローチの状態の接地能力は、粒状、構造化された、ドメイン固有のシーンの理解の弱点によって依然として制限されています。
この欠点に対処するために、ドメイン条件付けされたシーングラフをシーン表現として特徴とする、より構造化された状態接地フレームワークを開発します。
PDDLなどの古典的な計画言語では、象徴的な状態に直接マッピングできるため、このような表現は本質的に実用的であることを示します。
ドメイン条件付けされたシーングラフ生成が、ドメイン関連のオブジェクト検出の上にドメイン固有の述語を分類する軽量のビジョン言語アプローチで実装される状態接地フレームワークのインスタンス化を提供します。
3つのドメインで評価されたこのアプローチは、以前のLMMベースのアプローチと比較して、状態推定の精度とタスク計画の成功率が大幅に高くなります。

要約(オリジナル)

Recent robotic task planning frameworks have integrated large multimodal models (LMMs) such as GPT-4V. To address grounding issues of such models, it has been suggested to split the pipeline into perceptional state grounding and subsequent state-based planning. As we show in this work, the state grounding ability of LMM-based approaches is still limited by weaknesses in granular, structured, domain-specific scene understanding. To address this shortcoming, we develop a more structured state grounding framework that features a domain-conditioned scene graph as its scene representation. We show that such representation is actionable in nature as it is directly mappable to a symbolic state in classical planning languages such as PDDL. We provide an instantiation of our state grounding framework where the domain-conditioned scene graph generation is implemented with a lightweight vision-language approach that classifies domain-specific predicates on top of domain-relevant object detections. Evaluated across three domains, our approach achieves significantly higher state estimation accuracy and task planning success rates compared to the previous LMM-based approaches.

arxiv情報

著者 Jonas Herzog,Jiangpin Liu,Yue Wang
発行日 2025-04-09 07:51:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Domain-Conditioned Scene Graphs for State-Grounded Task Planning はコメントを受け付けていません

RAMBO: RL-augmented Model-based Optimal Control for Whole-body Loco-manipulation

要約

遺伝子座操作 – オブジェクトとの調整された移動と物理的相互作用 – は、正確な力の相互作用とモデルのダイナミクスに対する堅牢性の両方が必要であるため、足のロボットにとって大きな課題のままです。
モデルベースのコントローラーは、解釈可能なダイナミクスレベルの計画と最適化を提供しますが、モデルの不正確さと計算コストによって制限されます。
対照的に、学習ベースの方法は、相互作用力の正確な変調に苦労しながら、堅牢性を提供します。
RAMBO-A-Gegmented Modelベースの最適制御 – 単純化されたダイナミクスモデルと強化学習で訓練されたフィードバックポリシーを使用してモデルベースの反動力最適化を統合するハイブリッドフレームワークを紹介します。
モデルベースのモジュールは、2次プログラムを解決することによりフィードフォワードトルクを生成しますが、ポリシーは、制御実行の堅牢性を高めるためのフィードバック残差を提供します。
四足動物の両方の両方で、ショッピングカートのプッシュ、プレートのバランス、ソフトオブジェクトを保持するなど、多様な一連の実際のロコ操作タスクを介して、四足動物のロボット上のフレームワークを検証します。
私たちの実験は、ランボが堅牢で動的な移動を達成しながら正確な操作を可能にし、エンドツーエンドスキームで訓練されたポリシーのパフォーマンスを上回ることを示しています。
さらに、この方法により、コンプライアンスを備えたエンドエフェクター追跡精度間の柔軟なトレードオフを可能にします。

要約(オリジナル)

Loco-manipulation — coordinated locomotion and physical interaction with objects — remains a major challenge for legged robots due to the need for both accurate force interaction and robustness to unmodeled dynamics. While model-based controllers provide interpretable dynamics-level planning and optimization, they are limited by model inaccuracies and computational cost. In contrast, learning-based methods offer robustness while struggling with precise modulation of interaction forces. We introduce RAMBO — RL-Augmented Model-Based Optimal Control — a hybrid framework that integrates model-based reaction force optimization using a simplified dynamics model and a feedback policy trained with reinforcement learning. The model-based module generates feedforward torques by solving a quadratic program, while the policy provides feedback residuals to enhance robustness in control execution. We validate our framework on a quadruped robot across a diverse set of real-world loco-manipulation tasks — such as pushing a shopping cart, balancing a plate, and holding soft objects — in both quadrupedal and bipedal walking. Our experiments demonstrate that RAMBO enables precise manipulation while achieving robust and dynamic locomotion, surpassing the performance of policies trained with end-to-end scheme. In addition, our method enables flexible trade-off between end-effector tracking accuracy with compliance.

arxiv情報

著者 Jin Cheng,Dongho Kang,Gabriele Fadini,Guanya Shi,Stelian Coros
発行日 2025-04-09 07:53:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | RAMBO: RL-augmented Model-based Optimal Control for Whole-body Loco-manipulation はコメントを受け付けていません

Dynamic Residual Safe Reinforcement Learning for Multi-Agent Safety-Critical Scenarios Decision-Making

要約

マルチエージェントの安全性クリティカルなシナリオでは、従来の自律的な運転フレームワークは、安全性の制約とタスクのパフォーマンスのバランスをとる上で大きな課題に直面しています。
これらのフレームワークは、動的な相互作用のリスクをリアルタイムで定量化するのに苦労し、手動ルールに大きく依存しているため、計算効率と保守的な戦略が低くなります。
これらの制限に対処するために、安全性が強化されたネットワーク化されたマルコフ決定プロセスに基づいた動的な残留安全補強学習(DRS-RL)フレームワークを提案します。
弱から強い理論がマルチエージェントの意思決定に導入されたのは初めてであり、弱から強い安全補正パラダイムを介して安全境界の軽量動的キャリブレーションを可能にします。
マルチエージェントダイナミック競合ゾーンモデルに基づいて、当社のフレームワークは、不均一な交通参加者の間の時空間結合リスクを正確にキャプチャし、従来の幾何学的規則の静的な制約を上回ります。
さらに、リスク認識の優先順位付けされたエクスペリエンスリプレイメカニズムは、リスクをサンプリングする確率にマッピングすることにより、データ分布バイアスを緩和します。
実験結果は、提案された方法が、安全性、効率、快適性における従来のRLアルゴリズムを大幅に上回ることを明らかにしています。
具体的には、衝突率を最大92.17%削減しますが、安全モデルはメインモデルのパラメーターの27%のみを占めています。

要約(オリジナル)

In multi-agent safety-critical scenarios, traditional autonomous driving frameworks face significant challenges in balancing safety constraints and task performance. These frameworks struggle to quantify dynamic interaction risks in real-time and depend heavily on manual rules, resulting in low computational efficiency and conservative strategies. To address these limitations, we propose a Dynamic Residual Safe Reinforcement Learning (DRS-RL) framework grounded in a safety-enhanced networked Markov decision process. It’s the first time that the weak-to-strong theory is introduced into multi-agent decision-making, enabling lightweight dynamic calibration of safety boundaries via a weak-to-strong safety correction paradigm. Based on the multi-agent dynamic conflict zone model, our framework accurately captures spatiotemporal coupling risks among heterogeneous traffic participants and surpasses the static constraints of conventional geometric rules. Moreover, a risk-aware prioritized experience replay mechanism mitigates data distribution bias by mapping risk to sampling probability. Experimental results reveal that the proposed method significantly outperforms traditional RL algorithms in safety, efficiency, and comfort. Specifically, it reduces the collision rate by up to 92.17%, while the safety model accounts for merely 27% of the main model’s parameters.

arxiv情報

著者 Kaifeng Wang,Yinsong Chen,Qi Liu,Xueyuan Li,Xin Gao
発行日 2025-04-09 08:13:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Dynamic Residual Safe Reinforcement Learning for Multi-Agent Safety-Critical Scenarios Decision-Making はコメントを受け付けていません

Setup-Invariant Augmented Reality for Teaching by Demonstration with Surgical Robots

要約

拡張現実(AR)は、探索的学習と3次元ガイダンスを組み合わせたため、ロボット手術教育における効果的なツールです。
ただし、既存のARシステムには専門家の監督が必要であり、メンターとメンティーのロボット構成の違いを考慮していません。
エキスパートに基づいたガイダンスを受け取りながら初心者が手術室の外でトレーニングできるようにするために、DV-Stear:ExpertとNoviceの間の同一のセットアップジョイントポジションを想定せずにタスクに配置されたエキスパートデモンストレーションを再生するオープンソースシステムを提示します。
ポーズ推定は厳密に定量化され、3.86(SD = 2.01)mmの登録エラーが示されました。
ユーザー調査(n = 24)では、DVステアは、腹腔鏡手術の基礎からのタスクの初心者のパフォーマンスを大幅に改善しました。
片手のリングオーバーワイヤータスクでは、DVステアの完了速度(P = 0.03)の増加(P = 0.03)およびドライラブトレーニングのみと比較して衝突時間(P = 0.01)の短縮(P = 0.01)が増加しました。
ピックアンドプレイスタスク中に、成功率が向上しました(p = 0.004)。
両方のタスクで、DV-Stearを使用している参加者は、よりバランスの取れた手の使用を著しく示し、フラストレーションレベルが低いと報告しました。
この作品は、Da Vinci Research Kitに実装された新しい教育ツールを提示し、初心者を教える上でその有効性を実証し、ロボット支援手術へのさらなるAR統合の基礎を構築します。

要約(オリジナル)

Augmented reality (AR) is an effective tool in robotic surgery education as it combines exploratory learning with three-dimensional guidance. However, existing AR systems require expert supervision and do not account for differences in the mentor and mentee robot configurations. To enable novices to train outside the operating room while receiving expert-informed guidance, we present dV-STEAR: an open-source system that plays back task-aligned expert demonstrations without assuming identical setup joint positions between expert and novice. Pose estimation was rigorously quantified, showing a registration error of 3.86 (SD=2.01)mm. In a user study (N=24), dV-STEAR significantly improved novice performance on tasks from the Fundamentals of Laparoscopic Surgery. In a single-handed ring-over-wire task, dV-STEAR increased completion speed (p=0.03) and reduced collision time (p=0.01) compared to dry-lab training alone. During a pick-and-place task, it improved success rates (p=0.004). Across both tasks, participants using dV-STEAR exhibited significantly more balanced hand use and reported lower frustration levels. This work presents a novel educational tool implemented on the da Vinci Research Kit, demonstrates its effectiveness in teaching novices, and builds the foundation for further AR integration into robot-assisted surgery.

arxiv情報

著者 Alexandre Banks,Richard Cook,Septimiu E. Salcudean
発行日 2025-04-09 08:34:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC, cs.RO, cs.SY, eess.SY, I.4.9 | Setup-Invariant Augmented Reality for Teaching by Demonstration with Surgical Robots はコメントを受け付けていません

SDHN: Skewness-Driven Hypergraph Networks for Enhanced Localized Multi-Robot Coordination

要約

マルチエージェント補強学習は、単純なグラフが通常、ペアワイズの相互作用をモデル化するマルチロボット調整に広く使用されています。
ただし、このような表現は、より高いオーダーのコラボレーションをキャプチャすることができず、複雑なタスクの有効性が制限されます。
ハイパーグラフベースのアプローチは協力を強化しますが、既存の方法はしばしば任意のハイパーグラフ構造を生成し、環境不確実性に対する適応性を欠いています。
これらの課題に対処するために、確率的ベルヌーリハイペレッジを使用して高次のマルチロボット相互作用を明示的にモデル化する歪度駆動型ハイパーグラフネットワーク(SDHN)を提案します。
Sdhnは、歪度損失を導入することにより、小型高級の優性ハイパーグラフで効率的な構造を促進し、ロボットが人間の調整と同様に全体的な情報を遵守しながら局所的な同期を優先することができます。
フォーメーションおよびロボット倉庫タスクの移動剤に関する広範な実験は、SDHNの有効性を検証し、最先端のベースラインよりも優れたパフォーマンスを示しています。

要約(オリジナル)

Multi-Agent Reinforcement Learning is widely used for multi-robot coordination, where simple graphs typically model pairwise interactions. However, such representations fail to capture higher-order collaborations, limiting effectiveness in complex tasks. While hypergraph-based approaches enhance cooperation, existing methods often generate arbitrary hypergraph structures and lack adaptability to environmental uncertainties. To address these challenges, we propose the Skewness-Driven Hypergraph Network (SDHN), which employs stochastic Bernoulli hyperedges to explicitly model higher-order multi-robot interactions. By introducing a skewness loss, SDHN promotes an efficient structure with Small-Hyperedge Dominant Hypergraph, allowing robots to prioritize localized synchronization while still adhering to the overall information, similar to human coordination. Extensive experiments on Moving Agents in Formation and Robotic Warehouse tasks validate SDHN’s effectiveness, demonstrating superior performance over state-of-the-art baselines.

arxiv情報

著者 Delin Zhao,Yanbo Shan,Chang Liu,Shenghang Lin,Yingxin Shou,Bin Xu
発行日 2025-04-09 08:41:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.MA, cs.RO | SDHN: Skewness-Driven Hypergraph Networks for Enhanced Localized Multi-Robot Coordination はコメントを受け付けていません

Accurate Control under Voltage Drop for Rotor Drones

要約

この手紙は、バッテリーの電圧降下によって引き起こされる電圧降下(VD)の妨害に対抗するためのロータードローンの障害防止制御スキームを提案しています。これは、長時間の飛行または攻撃的な操作の一般的なケースです。
第一に、VDの妨害を考慮したロータードローンの洗練されたダイナミクスが提示されます。
ダイナミクスに基づいて、電圧ドロップオブザーバー(VDO)が開発され、ドローンの妨害と状態情報を分離し、従来の妨害観察者の保守性を低下させることにより、VDの妨害を正確に推定します。
その後、制御スキームは、トランスレーショナルループ内のVDOと回転ループ内の固定時間スライドモードオブザーバー(SMO)を統合し、バッテリーの電圧降下によって引き起こされる力とトルクの乱れに対処できるようにします。
VD妨害の下で提案された制御スキームの有効性を実証するために、十分な実際の飛行実験が実施されます。

要約(オリジナル)

This letter proposes an anti-disturbance control scheme for rotor drones to counteract voltage drop (VD) disturbance caused by voltage drop of the battery, which is a common case for long-time flight or aggressive maneuvers. Firstly, the refined dynamics of rotor drones considering VD disturbance are presented. Based on the dynamics, a voltage drop observer (VDO) is developed to accurately estimate the VD disturbance by decoupling the disturbance and state information of the drone, reducing the conservativeness of conventional disturbance observers. Subsequently, the control scheme integrates the VDO within the translational loop and a fixed-time sliding mode observer (SMO) within the rotational loop, enabling it to address force and torque disturbances caused by voltage drop of the battery. Sufficient real flight experiments are conducted to demonstrate the effectiveness of the proposed control scheme under VD disturbance.

arxiv情報

著者 Yuhang Liu,Jindou Jia,Zihan Yang,Kexin Guo
発行日 2025-04-09 09:16:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Accurate Control under Voltage Drop for Rotor Drones はコメントを受け付けていません

Ice-Breakers, Turn-Takers and Fun-Makers: Exploring Robots for Groups with Teenagers

要約

特に、自己同一性と自尊心にとってピアグループが重要であるティーンエイジャーにとって、成功し、楽しいグループの相互作用は、公共および個人的な文脈において重要です。
ソーシャルロボットは、グループの相互作用を積極的に形成する可能性があるように見えますが、関連する(人間の相互作用)文献のみに基づいてロボット行動を設計することでそのような影響を与えることは困難であるようです。
この記事では、ティーンエイジャーがソーシャルロボットの「グループアシスタント」をどのように想定するかを探るために、ユーザー中心のアプローチを取ります。
私たちは、16人のティーンエイジャーをフォーカスグループ、インタビュー、ロボットテストに参加させ、グループのロボットに関する意見や反省を捉えました。
2週間のサマースクールの過程で、参加者はそのようなロボットのためのアクションスペースを共同設計し、10時間以上一緒に作業/ウィザードしました。
この経験は、グループアシスタントとしてロボットを使用するという洞察をさらに変えて深めました。
ロボットグループアシスタントの適用性と使用に関するティーンエイジャーの見解、これらの期待が研究全体でどのように進化したか、およびロボットとの繰り返しの相互作用に関する結果を報告します。
我々の結果は、各グループがロボットの必要性のスペクトルを動かし、状況が要求するように、氷を破る、ターンテイク、そして楽しい作りのためにロボットをより(またはそれ以下)使用することに反映されていることを示しています。

要約(オリジナル)

Successful, enjoyable group interactions are important in public and personal contexts, especially for teenagers whose peer groups are important for self-identity and self-esteem. Social robots seemingly have the potential to positively shape group interactions, but it seems difficult to effect such impact by designing robot behaviors solely based on related (human interaction) literature. In this article, we take a user-centered approach to explore how teenagers envisage a social robot ‘group assistant’. We engaged 16 teenagers in focus groups, interviews, and robot testing to capture their views and reflections about robots for groups. Over the course of a two-week summer school, participants co-designed the action space for such a robot and experienced working with/wizarding it for 10+ hours. This experience further altered and deepened their insights into using robots as group assistants. We report results regarding teenagers’ views on the applicability and use of a robot group assistant, how these expectations evolved throughout the study, and their repeat interactions with the robot. Our results indicate that each group moves on a spectrum of need for the robot, reflected in use of the robot more (or less) for ice-breaking, turn-taking, and fun-making as the situation demanded.

arxiv情報

著者 Sarah Gillet,Katie Winkle,Giulia Belgiovine,Iolanda Leite
発行日 2025-04-09 09:19:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Ice-Breakers, Turn-Takers and Fun-Makers: Exploring Robots for Groups with Teenagers はコメントを受け付けていません

Learning global control of underactuated systems with Model-Based Reinforcement Learning

要約

この短い論文では、ICRA 2025で開催された「RealaigymとのAIオリンピック」コンペティションの第3版のための提案されたソリューションについて説明します。私たちは、さまざまな低次元のロックティックなタスクにわたって並外れたデータ効率で認識されているMBRLアルゴリズムであるMBRLアルゴリズムであるMCH-Carlo確率推論(MC-Pilco)を採用しました。
MC-Pilcoは、インタラクションデータを使用してシステムダイナミクスモデルを最適化し、直接システムデータの最適化ではなく、シミュレーションによるポリシーの改良を可能にします。
このアプローチは、物理システムで非常に効果的であることが証明されており、モデルフリー(MF)の代替案よりもデータ効率が高くなります。
特に、MC-Pilcoは以前、このコンペティションの最初の2つのエディションで優勝しており、シミュレートされた環境と現実世界の両方の環境でその堅牢性を示しています。
アルゴリズムを簡単に確認することに加えて、手元のタスクでのMC-Pilco実装の最も重要な側面について説明します。ペンドボットおよびアクロボットシステムのグローバルポリシーを学習します。

要約(オリジナル)

This short paper describes our proposed solution for the third edition of the ‘AI Olympics with RealAIGym’ competition, held at ICRA 2025. We employed Monte-Carlo Probabilistic Inference for Learning Control (MC-PILCO), an MBRL algorithm recognized for its exceptional data efficiency across various low-dimensional robotic tasks, including cart-pole, ball \& plate, and Furuta pendulum systems. MC-PILCO optimizes a system dynamics model using interaction data, enabling policy refinement through simulation rather than direct system data optimization. This approach has proven highly effective in physical systems, offering greater data efficiency than Model-Free (MF) alternatives. Notably, MC-PILCO has previously won the first two editions of this competition, demonstrating its robustness in both simulated and real-world environments. Besides briefly reviewing the algorithm, we discuss the most critical aspects of the MC-PILCO implementation in the tasks at hand: learning a global policy for the pendubot and acrobot systems.

arxiv情報

著者 Niccolò Turcato,Marco Calì,Alberto Dalla Libera,Giulio Giacomuzzo,Ruggero Carli,Diego Romeres
発行日 2025-04-09 09:20:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Learning global control of underactuated systems with Model-Based Reinforcement Learning はコメントを受け付けていません