PROSKILL: A formal skill language for acting in robotics

要約

演技は、自律的なロボットにとって重要な決定機能です。
演技は、それが監督する活動を実装し、モデル化するスキルに依存しています:洗練、局所回復、時間的派遣、外部非同期イベント、およびコマンドの実行、すべてがオンラインで行われます。
計画とロボットプラットフォームの間に座っている間、演技はしばしばプリミティブのプログラミングとこれらのスキルを実行する通訳に依存しています。
ロボットの機能的コンポーネントをプログラムするための正式なフレームワークを提供した経験に続いて、演技スキルをプログラムするための新しい言語を提案します。
この言語は、正式なモデルに明確にマッピングします。このモデルは、プロパティをオフラインまたは実行するか、より正確に正式な同等物を実行し、ランタイム検証を実行するために使用できます。
この新しい言語でドローンの調査ミッションをプログラムし、プログラム上の正式なプロパティを証明し、ドローン上の正式なモデルを直接実行してミッションを実行する方法を実際の例で説明します。

要約(オリジナル)

Acting is an important decisional function for autonomous robots. Acting relies on skills to implement and to model the activities it oversees: refinement, local recovery, temporal dispatching, external asynchronous events, and commands execution, all done online. While sitting between planning and the robotic platform, acting often relies on programming primitives and an interpreter which executes these skills. Following our experience in providing a formal framework to program the functional components of our robots, we propose a new language, to program the acting skills. This language maps unequivocally into a formal model which can then be used to check properties offline or execute the skills, or more precisely their formal equivalent, and perform runtime verification. We illustrate with a real example how we can program a survey mission for a drone in this new language, prove some formal properties on the program and directly execute the formal model on the drone to perform the mission.

arxiv情報

著者 Félix Ingrand
発行日 2025-02-21 13:30:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SE | PROSKILL: A formal skill language for acting in robotics はコメントを受け付けていません

Shared Control with Black Box Agents using Oracle Queries

要約

共有コントロールの問題には、人間と協力することを学ぶロボットが含まれます。
共有制御ポリシーを学習する場合、エージェント間の短い通信は、実行時間を大幅に短縮し、システムの精度を改善することがよくあります。
共有制御の問題を拡張して、協力エージェントを直接照会する機能を含めます。
クエリに対する2種類の潜在的な応答、すなわちオラクルを検討します。1つは、そのアクションが近視で間違っている可能性がある場合でも、学習者に最良のアクションを提供することができるものと、システムの一部に限定された知識を持つものを持っているものを考慮します。

この追加情報チャネルを考慮して、この作業は、補足する時期を選択するための3つのヒューリスティックをさらに提示します:補強学習ベース、ユーティリティベース、およびエントロピーベース。
これらのヒューリスティックは、システムの全体的な学習コストを削減することを目的としています。
2つの環境での経験的結果は、より良い制御ポリシーを学ぶためのクエリの利点と、提案されたヒューリスティック間のトレードオフを示しています。

要約(オリジナル)

Shared control problems involve a robot learning to collaborate with a human. When learning a shared control policy, short communication between the agents can often significantly reduce running times and improve the system’s accuracy. We extend the shared control problem to include the ability to directly query a cooperating agent. We consider two types of potential responses to a query, namely oracles: one that can provide the learner with the best action they should take, even when that action might be myopically wrong, and one with a bounded knowledge limited to its part of the system. Given this additional information channel, this work further presents three heuristics for choosing when to query: reinforcement learning-based, utility-based, and entropy-based. These heuristics aim to reduce a system’s overall learning cost. Empirical results on two environments show the benefits of querying to learn a better control policy and the tradeoffs between the proposed heuristics.

arxiv情報

著者 Inbal Avraham,Reuth Mirsky
発行日 2025-02-21 14:19:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Shared Control with Black Box Agents using Oracle Queries はコメントを受け付けていません

An Open-Source Reproducible Chess Robot for Human-Robot Interaction Research

要約

AIの最近の進歩により、多用途のロボットデザインの進化が加速されています。
チェスは、人間の行動に対するロボット行動の影響を評価するための標準化された環境を提供します。
この記事では、特に言語的および非言語的相互作用に焦点を当てた、人間とロボットの相互作用(HRI)研究のためのオープンソースチェスロボットを紹介します。
OpenChessrobotは、コンピュータービジョンを使用してチェスピースを認識し、声とロボットのジェスチャーを通じて人間のプレイヤーと対話します。
ソフトウェアの設計について詳しく説明し、ロボットの有効性の定量的評価を提供し、再現性のガイドを提供します。
可能な3つのシナリオでロボットの人々の見解を調べるオンライン調査が597人の参加者とともに実施されました。
ロボットは、ロボット教育とチェスコーチのシナリオで最高の評価を受けましたが、ホームエンターテイメントのシナリオは最低のスコアを獲得しました。
コードとデータセットには、github:https://github.com/renchizhhhh/openchessrobotでアクセスできます

要約(オリジナル)

Recent advancements in AI have accelerated the evolution of versatile robot designs. Chess provides a standardized environment for evaluating the impact of robot behavior on human behavior. This article presents an open-source chess robot for human-robot interaction (HRI) research, specifically focusing on verbal and non-verbal interactions. OpenChessRobot recognizes chess pieces using computer vision, executes moves, and interacts with the human player through voice and robotic gestures. We detail the software design, provide quantitative evaluations of the efficacy of the robot, and offer a guide for its reproducibility. An online survey examining people’s views of the robot in three possible scenarios was conducted with 597 participants. The robot received the highest ratings in the robotics education and the chess coach scenarios, while the home entertainment scenario received the lowest scores. The code and datasets are accessible on GitHub: https://github.com/renchizhhhh/OpenChessRobot

arxiv情報

著者 Renchi Zhang,Joost de Winter,Dimitra Dodou,Harleigh Seyffert,Yke Bauke Eisma
発行日 2025-02-21 14:53:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | An Open-Source Reproducible Chess Robot for Human-Robot Interaction Research はコメントを受け付けていません

Enhanced Probabilistic Collision Detection for Motion Planning Under Sensing Uncertainty

要約

確率的衝突検出(PCD)は、非構造化された環境で動作するロボットの動き計画に不可欠です。
既存のPCDメソッドは、主に簡素化された幾何学モデルを使用し、位置推定エラーのみに対処しました。
このホワイトペーパーでは、2つの重要な進歩を備えた強化されたPCDメソッドを紹介します。(a)より正確な形状近似のためにスーパークアドリックを使用し、(b)センシングの不確実性の下での堅牢性を改善するための位置と方向の推定誤差の両方を説明します。
私たちの方法は、最初に、観測された回転コピーをカプセル化する各オブジェクトの拡大した表面を計算し、それにより方向推定エラーに対処します。
次に、位置推定エラーの下での衝突確率は、緊密な上限で解決される偶然の制約問題として定式化されます。
どちらのステップでも、最近開発された超四方性表面の通常のパラメーター化を活用します。
結果は、PCDメソッドが最良の既存のPCDメソッドとしてモンテカルロサンプリングベースラインに2倍近く、パスの長さをそれぞれ30%削減し、計画時間を37%削減することを示しています。
REAL2SIMパイプラインは、方向推定エラーを考慮することの重要性をさらに検証し、シミュレーションで計画されたパスを実行する衝突確率が2%のみであることを示しています。

要約(オリジナル)

Probabilistic collision detection (PCD) is essential in motion planning for robots operating in unstructured environments, where considering sensing uncertainty helps prevent damage. Existing PCD methods mainly used simplified geometric models and addressed only position estimation errors. This paper presents an enhanced PCD method with two key advancements: (a) using superquadrics for more accurate shape approximation and (b) accounting for both position and orientation estimation errors to improve robustness under sensing uncertainty. Our method first computes an enlarged surface for each object that encapsulates its observed rotated copies, thereby addressing the orientation estimation errors. Then, the collision probability under the position estimation errors is formulated as a chance-constraint problem that is solved with a tight upper bound. Both the two steps leverage the recently developed normal parameterization of superquadric surfaces. Results show that our PCD method is twice as close to the Monte-Carlo sampled baseline as the best existing PCD method and reduces path length by 30% and planning time by 37%, respectively. A Real2Sim pipeline further validates the importance of considering orientation estimation errors, showing that the collision probability of executing the planned path in simulation is only 2%, compared to 9% and 29% when considering only position estimation errors or none at all.

arxiv情報

著者 Xiaoli Wang,Sipu Ruan,Xin Meng,Gregory Chirikjian
発行日 2025-02-21 15:27:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Enhanced Probabilistic Collision Detection for Motion Planning Under Sensing Uncertainty はコメントを受け付けていません

Autonomous helicopter aerial refueling: controller design and performance guarantees

要約

このホワイトペーパーでは、自律ヘリコプターの空中給油の制御設計方法、安定性基準、および性能境界を紹介します。
独立した航空給油は、タンカーの後れ、操作の接触に敏感な性質、ドローグ運動の不確実性との間の空力相互作用のために、特に困難です。
プローブチップはヘリコプターの重力の中心からかなり離れているため、その位置(および速度)はヘリコプターの態度(および角度速度)に強く敏感です。
さらに、ヘリコプターがタンカーの速度に合わせて高速で動作しているという事実は、特定の方向を維持するように強制し、ドッキング操作を特に挑戦的にします。
このホワイトペーパーでは、プローブの位置と速度をフィードバックループに組み込んだ新しい外ループ位置コントローラーを提案します。
プローブチップの位置と速度は、航空機の位置(速度)と態度(角度速度)の両方に依存します。
ドローグ運動の不確実性とヘリコプターの角度加速度の観点から、ドッキングパフォーマンスの分析保証を導き出し、閉ループエラーダイナミクスの最終的な境界特性を使用します。
シミュレーションは、現実的な燃料補給シナリオの提案されたアプローチを検証するために、風の効果の下で高忠実度のドローグモーションを備えた高忠実度UH60ヘリコプターモデルで実行されます。
これらの高忠実度のシミュレーションは、提案された制御方法論が、既存の標準コントローラーと比較して、2ノームのドッキングエラーで36%の改善をもたらすことを明らかにしています。

要約(オリジナル)

In this paper, we present a control design methodology, stability criteria, and performance bounds for autonomous helicopter aerial refueling. Autonomous aerial refueling is particularly difficult due to the aerodynamic interaction between the wake of the tanker, the contact-sensitive nature of the maneuver, and the uncertainty in drogue motion. Since the probe tip is located significantly away from the helicopter’s center-of-gravity, its position (and velocity) is strongly sensitive to the helicopter’s attitude (and angular rates). In addition, the fact that the helicopter is operating at high speeds to match the velocity of the tanker forces it to maintain a particular orientation, making the docking maneuver especially challenging. In this paper, we propose a novel outer-loop position controller that incorporates the probe position and velocity into the feedback loop. The position and velocity of the probe tip depend both on the position (velocity) and on the attitude (angular rates) of the aircraft. We derive analytical guarantees for docking performance in terms of the uncertainty of the drogue motion and the angular acceleration of the helicopter, using the ultimate boundedness property of the closed-loop error dynamics. Simulations are performed on a high-fidelity UH60 helicopter model with a high-fidelity drogue motion under wind effects to validate the proposed approach for realistic refueling scenarios. These high-fidelity simulations reveal that the proposed control methodology yields an improvement of 36% in the 2-norm docking error compared to the existing standard controller.

arxiv情報

著者 Damsara Jayarathne,Santiago Paternain,Sandipan Mishra
発行日 2025-02-21 16:22:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Autonomous helicopter aerial refueling: controller design and performance guarantees はコメントを受け付けていません

Pick-and-place Manipulation Across Grippers Without Retraining: A Learning-optimization Diffusion Policy Approach

要約

現在のロボットピックアンドプレイスポリシーでは、通常、トレーニングと推論全体で一貫したグリッパー構成が必要です。
この制約は、特に新しいエンドエフェクターに適応する際に、特に模倣学習ベースのアプローチに高い再訓練または微調整コストを課します。
この問題を軽減するために、ハイブリッド学習最適化フレームワークを備えた拡散ベースのポリシーを提示し、再訓練ポリシーのための追加のデータ収集なしに、新しいグリッパーへのゼロショット適応を可能にします。
トレーニング中、ポリシーはベースグリッパーを使用して収集されたデモから操作プリミティブを学びます。
推論では、拡散ベースの最適化戦略が運動学的および安全性の制約を動的に強制し、生成された軌道が目に見えないグリッパーの物理的特性と一致するようにします。
これは、衝突回避とタスクの実現可能性を維持しながら、グリッパー固有のパラメーター(たとえば、ツール中心点オフセット、顎の幅)に軌道を適応させる制約された除去手順を通じて達成されます。
3Dプリントされた指先、柔軟なシリコングリッパー、Robotiq 2F-85グリッパーなど、6つのグリッパー構成にわたってフランカパンダロボットのメソッドを検証します。
私たちのアプローチは、グリッパー全体で93.3%の平均タスク成功率(拡散ポリシーベースラインで23.3-26.7%)を達成し、16〜23.5 cmのツールセンターポイントバリエーションと7.5〜11.5 cmの顎幅をサポートします。
結果は、制約された拡散が、模倣学習のサンプル効率を維持しながら、堅牢なクロスグリッパー操作を可能にし、グリッパー固有の再訓練の必要性を排除できることを示しています。
ビデオとコードはhttps://github.com/yaoxt3/gadpで入手できます。

要約(オリジナル)

Current robotic pick-and-place policies typically require consistent gripper configurations across training and inference. This constraint imposes high retraining or fine-tuning costs, especially for imitation learning-based approaches, when adapting to new end-effectors. To mitigate this issue, we present a diffusion-based policy with a hybrid learning-optimization framework, enabling zero-shot adaptation to novel grippers without additional data collection for retraining policy. During training, the policy learns manipulation primitives from demonstrations collected using a base gripper. At inference, a diffusion-based optimization strategy dynamically enforces kinematic and safety constraints, ensuring that generated trajectories align with the physical properties of unseen grippers. This is achieved through a constrained denoising procedure that adapts trajectories to gripper-specific parameters (e.g., tool-center-point offsets, jaw widths) while preserving collision avoidance and task feasibility. We validate our method on a Franka Panda robot across six gripper configurations, including 3D-printed fingertips, flexible silicone gripper, and Robotiq 2F-85 gripper. Our approach achieves a 93.3% average task success rate across grippers (vs. 23.3-26.7% for diffusion policy baselines), supporting tool-center-point variations of 16-23.5 cm and jaw widths of 7.5-11.5 cm. The results demonstrate that constrained diffusion enables robust cross-gripper manipulation while maintaining the sample efficiency of imitation learning, eliminating the need for gripper-specific retraining. Video and code are available at https://github.com/yaoxt3/GADP.

arxiv情報

著者 Xiangtong Yao,Yirui Zhou,Yuan Meng,Liangyu Dong,Lin Hong,Zitao Zhang,Zhenshan Bing,Kai Huang,Fuchun Sun,Alois Knoll
発行日 2025-02-21 17:35:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Pick-and-place Manipulation Across Grippers Without Retraining: A Learning-optimization Diffusion Policy Approach はコメントを受け付けていません

Reduced-Order Model Guided Contact-Implicit Model Predictive Control for Humanoid Locomotion

要約

ヒューマノイドロボットは、人間のために構築された環境で動作する能力のために、実際のアプリケーションにとって大きな可能性がありますが、その展開は、基礎となる高次元の非線形ハイブリッドダイナミクスを制御するという課題によって妨げられています。
ハイブリッド線形反転振り子(HLIP)のような低次モデルはシンプルで計算効率が高いが、全身の表現力を失います。
一方、接触モデル予測制御(CI-MPC)の最近の進歩により、ロボットは複数のハイブリッド接触モードを計画できますが、局所ミニマに対して脆弱であり、重要なチューニングが必要です。
HLIPとCI-MPCの強度を組み合わせた制御フレームワークを提案します。
縮小された次数モデルは名目上の歩行を生成し、CI-MPCは全身のダイナミクスを管理し、必要に応じて連絡先スケジュールを変更します。
このアプローチの有効性は、24回のフリードームの斬新なヒューマノイドロボットであるアキレスを使用してシミュレーションにおいて実証されています。
提案されたフレームワークは、ラフな地形ウォーキング、妨害の回復、モデルおよび状態の不確実性の下での堅牢性を実現し、50 Hzでリアルタイムでオンラインで走りながら、ロボットが環境の障害と対話することができます。

要約(オリジナル)

Humanoid robots have great potential for real-world applications due to their ability to operate in environments built for humans, but their deployment is hindered by the challenge of controlling their underlying high-dimensional nonlinear hybrid dynamics. While reduced-order models like the Hybrid Linear Inverted Pendulum (HLIP) are simple and computationally efficient, they lose whole-body expressiveness. Meanwhile, recent advances in Contact-Implicit Model Predictive Control (CI-MPC) enable robots to plan through multiple hybrid contact modes, but remain vulnerable to local minima and require significant tuning. We propose a control framework that combines the strengths of HLIP and CI-MPC. The reduced-order model generates a nominal gait, while CI-MPC manages the whole-body dynamics and modifies the contact schedule as needed. We demonstrate the effectiveness of this approach in simulation with a novel 24 degree-of-freedom humanoid robot: Achilles. Our proposed framework achieves rough terrain walking, disturbance recovery, robustness under model and state uncertainty, and allows the robot to interact with obstacles in the environment, all while running online in real-time at 50 Hz.

arxiv情報

著者 Sergio A. Esteban,Vince Kurtz,Adrian B. Ghansah,Aaron D. Ames
発行日 2025-02-21 17:57:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Reduced-Order Model Guided Contact-Implicit Model Predictive Control for Humanoid Locomotion はコメントを受け付けていません

A Simulation Pipeline to Facilitate Real-World Robotic Reinforcement Learning Applications

要約

Rehnecortion Learning(RL)は、ロボットアプリケーションの複雑なタスクを解決することに成功したことで牽引力を獲得しています。
ただし、物理的なロボットへの展開は、安全リスクと比較的高いトレーニングコストのために依然として困難です。
これらの問題を回避するために、RLエージェントは多くの場合、シミュレーターでトレーニングされ、シミュレーションと現実のギャップに関連する新しい問題を導入します。
このペーパーでは、現実のギャップを削減し、実際のロボットシステムのRLポリシーの開発と展開を促進するために設計されたRLパイプラインを紹介します。
パイプラインは、RLトレーニングプロセスをシステム識別の初期ステップと、コアシミュレーショントレーニング、高忠実度シミュレーション、実世界の展開の3つのトレーニング段階に整理し、それぞれがSIMからリアルのギャップを減らすためのリアリズムのレベルを追加します。
各トレーニング段階は、入力ポリシーを採用し、改善し、改善されたポリシーを次の段階に渡すか、さらに改善するためにループします。
この反復プロセスは、ポリシーが望ましいパフォーマンスを達成するまで続きます。
パイプラインの有効性は、監視アプリケーションで使用されるボストンダイナミクススポットモバイルロボットを使用したケーススタディを通じて示されています。
ケーススタディでは、各パイプライン段階で行われたステップを提示して、RLエージェントを取得してロボットの位置と向きを制御します。

要約(オリジナル)

Reinforcement learning (RL) has gained traction for its success in solving complex tasks for robotic applications. However, its deployment on physical robots remains challenging due to safety risks and the comparatively high costs of training. To avoid these problems, RL agents are often trained on simulators, which introduces a new problem related to the gap between simulation and reality. This paper presents an RL pipeline designed to help reduce the reality gap and facilitate developing and deploying RL policies for real-world robotic systems. The pipeline organizes the RL training process into an initial step for system identification and three training stages: core simulation training, high-fidelity simulation, and real-world deployment, each adding levels of realism to reduce the sim-to-real gap. Each training stage takes an input policy, improves it, and either passes the improved policy to the next stage or loops it back for further improvement. This iterative process continues until the policy achieves the desired performance. The pipeline’s effectiveness is shown through a case study with the Boston Dynamics Spot mobile robot used in a surveillance application. The case study presents the steps taken at each pipeline stage to obtain an RL agent to control the robot’s position and orientation.

arxiv情報

著者 Jefferson Silveira,Joshua A. Marshall,Sidney N. Givigi Jr
発行日 2025-02-21 18:16:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Simulation Pipeline to Facilitate Real-World Robotic Reinforcement Learning Applications はコメントを受け付けていません

Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture Priors

要約

表現学習型アルゴリズムの一般化エラーの発表と尾の境界を確立します。
境界は、トレーニングから抽出された表現の分布と「テスト」データセットとデータ依存の対称事前、つまりトレーニング用の潜在変数の最小説明長(MDL)との相対的なエントロピーの観点から、トレーニングの最小説明長(MDL)と
テストデータセット。
私たちの境界は、エンコーダーの「構造」と「シンプルさ」を反映し、調査したモデルの既存の少数のものを大幅に改善することが示されています。
次に、適切なデータ依存性の正規者を考案するために、縛られた除外を使用します。
そして、私たちは前の選択の重要な問題を徹底的に調査します。
以前にデータ依存のガウス混合物を同時に学習し、それを正規者として使用するための体系的なアプローチを提案します。
興味深いことに、この手順では、加重注意メカニズムが自然に現れることを示しています。
私たちの実験は、私たちのアプローチが、今では人気のある変異情報ボトルネック(VIB)メソッドと最近のカテゴリ依存性VIB(CDVIB)を上回ることを示しています。

要約(オリジナル)

We establish in-expectation and tail bounds on the generalization error of representation learning type algorithms. The bounds are in terms of the relative entropy between the distribution of the representations extracted from the training and ‘test” datasets and a data-dependent symmetric prior, i.e., the Minimum Description Length (MDL) of the latent variables for the training and test datasets. Our bounds are shown to reflect the ‘structure’ and ‘simplicity” of the encoder and significantly improve upon the few existing ones for the studied model. We then use our in-expectation bound to devise a suitable data-dependent regularizer; and we investigate thoroughly the important question of the selection of the prior. We propose a systematic approach to simultaneously learning a data-dependent Gaussian mixture prior and using it as a regularizer. Interestingly, we show that a weighted attention mechanism emerges naturally in this procedure. Our experiments show that our approach outperforms the now popular Variational Information Bottleneck (VIB) method as well as the recent Category-Dependent VIB (CDVIB).

arxiv情報

著者 Milad Sefidgaran,Abdellatif Zaidi,Piotr Krasnowski
発行日 2025-02-21 15:43:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture Priors はコメントを受け付けていません

The Observational Partial Order of Causal Structures with Latent Variables

要約

目に見える変数の同じセットを持つ2つの因果構造の場合、1つは、最初の変数によって実現可能な可視変数の分布のセットが、2番目で実現可能な可視変数の分布のセットを含む場合、他方を観察的に支配すると言われています。
このような優位性を知ることは、観察データを与えられたこれらの構造間の裁定に役立ちます。
ここでは、観察的支配と比較して潜在変数を持つ因果構造の等価クラスの部分的な順序を決定する問題を検討します。
3つの可視変数の場合の優位性順序の完全な特性評価と、4つの可視変数の場合は部分的な特性評価を提供します。
また、私たちの手法は、どの観測等価クラスが、鐘の不平等と道具的不平等に類似した非自明の不平等制約を特徴とする一連の実現可能な分布を持っているかを特定するのに役立ちます。
目に見える変数の数を増やすと、非重要な不平等制約を満たす等価クラスが遍在するという証拠が見つかります。
(そのようなクラスは、量子的かつ古典的に実現可能な分布に違いがある可能性があるため、これは量子学的なギャップの可能性も遍在することを意味します。)さらに、制約に基づいた因果発見の証拠が見つかります。
条件付きの独立性の制約のみに依存するアルゴリズムは、これらを超えるアルゴリズムよりも観測等価クラスの間で著しく弱い際立能力を持っています
(つまり、ネストされたマルコフの制約と不平等の制約も活用するアルゴリズム)。

要約(オリジナル)

For two causal structures with the same set of visible variables, one is said to observationally dominate the other if the set of distributions over the visible variables realizable by the first contains the set of distributions over the visible variables realizable by the second. Knowing such dominance relations is useful for adjudicating between these structures given observational data. We here consider the problem of determining the partial order of equivalence classes of causal structures with latent variables relative to observational dominance. We provide a complete characterization of the dominance order in the case of three visible variables, and a partial characterization in the case of four visible variables. Our techniques also help to identify which observational equivalence classes have a set of realizable distributions that is characterized by nontrivial inequality constraints, analogous to Bell inequalities and instrumental inequalities. We find evidence that as one increases the number of visible variables, the equivalence classes satisfying nontrivial inequality constraints become ubiquitous. (Because such classes are the ones for which there can be a difference in the distributions that are quantumly and classically realizable, this implies that the potential for quantum-classical gaps is also ubiquitous.) Furthermore, we find evidence that constraint-based causal discovery algorithms that rely solely on conditional independence constraints have a significantly weaker distinguishing power among observational equivalence classes than algorithms that go beyond these (i.e., algorithms that also leverage nested Markov constraints and inequality constraints).

arxiv情報

著者 Marina Maciel Ansanelli,Elie Wolfe,Robert W. Spekkens
発行日 2025-02-21 15:50:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, quant-ph, stat.ML | The Observational Partial Order of Causal Structures with Latent Variables はコメントを受け付けていません