Multi-Contact Inertial Parameters Estimation and Localization in Legged Robots

要約

最適な推定は、ペイロードの慣性パラメーターの推定および複数の接点の存在下でのロボットのローカリゼーションのための有望なツールです。
ロボット工学の利点を活用するには、これらの大きくて挑戦的な最適化の問題を効率的に解決することが重要です。
これに取り組むために、(i)パラメータ化されたリカティの再帰を介して、時間的構造とパラメトリック構造の両方を悪用する複数の射撃ソルバーを開発します。
さらに、我々(ii)は、慣性パラメーターの完全な物理的一貫性を保証し、収束を強化する慣性マニホールドを提案します。
その多様な特異点を処理するために、最適な推定ソルバーにnullspaceアプローチを導入します。
最後に、両方の慣性パラメーター化の接触ダイナミクスの分析誘導体を開発します。
私たちのフレームワークは、ヒューマノイドのブラキオ化などの複雑な操作の推定問題をうまく解決し、従来の最小二乗アプローチよりも高い精度を達成できます。
さまざまなロボットタスクにわたる数値機能と、GO1ロボットでの実験的試験における利点を実証します。

要約(オリジナル)

Optimal estimation is a promising tool for estimation of payloads’ inertial parameters and localization of robots in the presence of multiple contacts. To harness its advantages in robotics, it is crucial to solve these large and challenging optimization problems efficiently. To tackle this, we (i) develop a multiple shooting solver that exploits both temporal and parametric structures through a parametrized Riccati recursion. Additionally, we (ii) propose an inertial manifold that ensures the full physical consistency of inertial parameters and enhances convergence. To handle its manifold singularities, we (iii) introduce a nullspace approach in our optimal estimation solver. Finally, we (iv) develop the analytical derivatives of contact dynamics for both inertial parametrizations. Our framework can successfully solve estimation problems for complex maneuvers such as brachiation in humanoids, achieving higher accuracy than conventional least squares approaches. We demonstrate its numerical capabilities across various robotics tasks and its benefits in experimental trials with the Go1 robot.

arxiv情報

著者 Sergi Martinez,Robert J. Griffin,Carlos Mastalli
発行日 2025-02-20 12:44:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Multi-Contact Inertial Parameters Estimation and Localization in Legged Robots はコメントを受け付けていません

Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control

要約

連続体ソフトロボットの動的モデルを取得することは、ソフトロボットの分析と制御の中心であり、研究者はデータ駆動型のソリューションと第一原理ソリューションの両方を提案するという課題に多くの注意を払っています。
しかし、どちらの道も彼らの限界を示しています。
前者には構造がなく、トレーニングデータの外部データが不十分であるが、後者は実際に使用するために大幅な単純化と広範な専門知識を必要とする必要がある。
このペーパーでは、正確で簡単に解釈しやすい、低次元の物理ベースのモデルを学習するための合理化された方法を紹介します。
イメージデータ(つまり、Shape Evolutions)を使用して、ソフトロボットの動きを説明するために必要な最小限のセグメントを決定するアルゴリズムから始めます。
これに続いて、動的回帰とひずみスパース化アルゴリズムを適用して、関連するひずみを識別し、モデルのダイナミクスを定義します。
さまざまな平面ソフトマニピュレーターを使用したシミュレーションを通じてアプローチを検証し、そのパフォーマンスを他の学習戦略と比較し、モデルが計算効率が高く、トレーニング外の配信入力で25倍の精度があることを示しています。
最後に、物理的に互換性のあるモデルを生成する方法の能力のおかげで、学習モデルをモデルベースの制御ポリシーと簡単に組み合わせることができることを実証します。

要約(オリジナル)

Obtaining dynamic models of continuum soft robots is central to the analysis and control of soft robots, and researchers have devoted much attention to the challenge of proposing both data-driven and first-principle solutions. Both avenues have, however, shown their limitations; the former lacks structure and performs poorly outside training data, while the latter requires significant simplifications and extensive expert knowledge to be used in practice. This paper introduces a streamlined method for learning low-dimensional, physics-based models that are both accurate and easy to interpret. We start with an algorithm that uses image data (i.e., shape evolutions) to determine the minimal necessary segments for describing a soft robot’s movement. Following this, we apply a dynamic regression and strain sparsification algorithm to identify relevant strains and define the model’s dynamics. We validate our approach through simulations with various planar soft manipulators, comparing its performance against other learning strategies, showing that our models are both computationally efficient and 25x more accurate on out-of-training distribution inputs. Finally, we demonstrate that thanks to the capability of the method of generating physically compatible models, the learned models can be straightforwardly combined with model-based control policies.

arxiv情報

著者 Ricardo Valadas,Maximilian Stölzle,Jingyue Liu,Cosimo Della Santina
発行日 2025-02-20 12:49:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control はコメントを受け付けていません

Real-world Troublemaker: A Novel Track Testing Framework for Automated Driving Systems in Safety-critical Interaction Scenarios

要約

トラックテストは、実際のオブジェクトターゲットと安全制御可能な相互作用環境を提供するため、自律運転システム(ADS)の安全評価において重要な役割を果たします。
ただし、既存のトラックテストシナリオは、主にオブジェクトターゲット制御方法の柔軟性が柔軟性であり、インテリジェントなインタラクティブな動作の欠如のために、事前に固定されており、制限されていることがよくあります。
この制限を克服するために、新しいトラックテストフレームワークである実世界のトラブルメーカーを提案します。これにより、敵対的なオブジェクトターゲットモーション軌道を生成し、テスト中の車両とのインテリジェントな相互作用を促進し、よりリアルで動的なテスト環境を作成できます。
柔軟なモーション軌道を有効にするために、クラウド制御テクノロジーを利用して、オブジェクトターゲットをリモートかつ動的に制御して、現実的な交通環境を作成します。
インテリジェントな相互作用を実現するために、ゲーム理論構造内でインタラクティブな具体的なシナリオ生成方法が導入されます。
提案されたフレームワークは、Tongji University Intelligent Connected Vehicle Averuation Baseで正常に実装されています。
フィールドテストの結果は、トラブルメーカーが広告の動的なインタラクティブテストを正確かつ効果的に実行できることを示しています。
従来のトラックテスト方法と比較して、トラブルメーカーはシナリオの繁殖精度を65.2 \%改善し、ターゲット車両相互作用戦略の多様性を約9.2倍増加させ、保護されていない左ターンシナリオで安全性批判シナリオの露出頻度を3.5倍増加させます。

要約(オリジナル)

Track testing plays a critical role in the safety evaluation of autonomous driving systems (ADS), as it provides real-world object targets and a safety-controllable interaction environment. However, existing track testing scenarios are often pre-fixed and limited, primarily due to the inflexibility of object target control methods and the lack of intelligent interactive behaviors. To overcome this limitation, we propose a novel track testing framework, Real-world Troublemaker, which can generate adversarial object target motion trajectories and facilitate intelligent interactions with the vehicle under test (VUT), creating a more realistic and dynamic testing environment. To enable flexible motion trajectories, cloud-controlled technology is utilized to remotely and dynamically control object targets to create a realistic traffic environment. To achieve intelligent interactions, an interactive concrete scenario generation method is introduced within a game-theoretic structure. The proposed framework has been successfully implemented at the Tongji University Intelligent Connected Vehicle Evaluation Base. Field test results demonstrate that Troublemaker can perform dynamic interactive testing of ADS accurately and effectively. Compared to traditional track testing methods, Troublemaker improves scenario reproduction accuracy by 65.2\%, increases the diversity of target vehicle interaction strategies by approximately 9.2 times, and enhances exposure frequency of safety-critical scenarios by 3.5 times in unprotected left-turn scenarios.

arxiv情報

著者 Xinrui Zhang,Lu Xiong,Peizhi Zhang,Junpeng Huang,Yining Ma
発行日 2025-02-20 13:59:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.ET, cs.RO | Real-world Troublemaker: A Novel Track Testing Framework for Automated Driving Systems in Safety-critical Interaction Scenarios はコメントを受け付けていません

TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning

要約

ディープ補強学習(DRL)および大規模な言語モデル(LLM)は、それぞれ自律運転の意思決定の課題に対処することで有望であることを示していますが、DRLはサンプルの複雑さが高いことがよくありますが、LLMはリアルタイムの意思決定を保証することが困難です。
これらの制限に対処するために、教師LLMを統合して注意ベースの学生DRLポリシーを導くハイブリッドフレームワークであるTell-Driveを提案します。
リスクメトリック、歴史的シナリオ検索、およびドメインヒューリスティックをコンテキストが豊富なプロンプトに組み込むことにより、LLMは、考え方の推論を通じて高レベルの運転戦略を生成します。
その後、自己関節メカニズムは、これらの戦略をDRLエージェントの探索と融合し、ポリシーの収束を加速し、多様な運転条件全体で堅牢性を高めます。
複数のトラフィックシナリオで評価された実験結果は、Tell-driveが成功率、平均リターン、リアルタイムの実現可能性の観点から、他のLLMベースのアプローチを含む既存のベースラインメソッドを上回ることを示しています。
アブレーション研究は、各モデルコンポーネントの重要性、特に注意メカニズムとLLM駆動型ガイダンスとの相乗効果を強調しています。
最後に、仮想リアルフュージョンの実験プラットフォームを構築して、リアルタイムのパフォーマンス、堅牢性、および車両のループ実験を通じて実行されるアルゴリズムの信頼性を検証します。

要約(オリジナル)

Although Deep Reinforcement Learning (DRL) and Large Language Models (LLMs) each show promise in addressing decision-making challenges in autonomous driving, DRL often suffers from high sample complexity, while LLMs have difficulty ensuring real-time decision making. To address these limitations, we propose TeLL-Drive, a hybrid framework that integrates a Teacher LLM to guide an attention-based Student DRL policy. By incorporating risk metrics, historical scenario retrieval, and domain heuristics into context-rich prompts, the LLM produces high-level driving strategies through chain-of-thought reasoning. A self-attention mechanism then fuses these strategies with the DRL agent’s exploration, accelerating policy convergence and boosting robustness across diverse driving conditions. The experimental results, evaluated across multiple traffic scenarios, show that TeLL-Drive outperforms existing baseline methods, including other LLM-based approaches, in terms of success rates, average returns, and real-time feasibility. Ablation studies underscore the importance of each model component, especially the synergy between the attention mechanism and LLM-driven guidance. Finally, we build a virtual-real fusion experimental platform to verify the real-time performance, robustness, and reliability of the algorithm running on real vehicles through vehicle-in-loop experiments.

arxiv情報

著者 Chengkai Xu,Jiaqi Liu,Shiyu Fang,Yiming Cui,Dong Chen,Peng Hang,Jian Sun
発行日 2025-02-20 14:09:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning はコメントを受け付けていません

Continuous-Time Line-of-Sight Constrained Trajectory Planning for 6-Degree of Freedom Systems

要約

知覚アルゴリズムは、現代の自律型スタックで遍在しており、現実の世界で動作するために必要な環境情報を提供します。
これらのアルゴリズムの多くは、信頼できる操作のためにロボットの視線(LOS)内に留まる必要があるキーポイントの可視性に依存しています。
このペーパーは、ロボットの動き中にそのようなキーポイントでLOSを維持するという課題に取り組んでいます。
さまざまなセンサーフットプリントへの適用性、任意の非線形システムダイナミクスへの適応性、およびロボットのパス全体でLOSの一定の施行を確保することにより、これらの問題に対処する新しい方法を提案します。
私たちの実験は、提案されたアプローチが、いくつかの代表的で挑戦的なシナリオにおける既存の最先端の方法と比較して、LOS違反とランタイムを大幅に削減することを達成することを示しています。

要約(オリジナル)

Perception algorithms are ubiquitous in modern autonomy stacks, providing necessary environmental information to operate in the real world. Many of these algorithms depend on the visibility of keypoints, which must remain within the robot’s line-of-sight (LoS), for reliable operation. This paper tackles the challenge of maintaining LoS on such keypoints during robot movement. We propose a novel method that addresses these issues by ensuring applicability to various sensor footprints, adaptability to arbitrary nonlinear system dynamics, and constant enforcement of LoS throughout the robot’s path. Our experiments show that the proposed approach achieves significantly reduced LoS violation and runtime compared to existing state-of-the-art methods in several representative and challenging scenarios.

arxiv情報

著者 Christopher R. Hayner,John M. Carson III,Behçet Açıkmeşe,Karen Leung
発行日 2025-02-20 18:10:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | Continuous-Time Line-of-Sight Constrained Trajectory Planning for 6-Degree of Freedom Systems はコメントを受け付けていません

MI-HGNN: Morphology-Informed Heterogeneous Graph Neural Network for Legged Robot Contact Perception

要約

学習ベースの接触知覚のために、形態に基づいた不均一グラフニューラルネットワーク(MI-HGNN)を提示します。
Mi-HGNNのアーキテクチャと接続性は、ノードとエッジがそれぞれロボットジョイントとリンクであるロボットの形態から構築されています。
形態に基づいた制約をニューラルネットワークに組み込むことにより、モデルベースの知識を使用して学習ベースのアプローチを改善します。
提案されたMI-HGNNを2つの接触知覚問題に適用し、2つの四足込んだロボットを使用して収集された現実世界とシミュレーションデータの両方を使用して広範な実験を実施します。
私たちの実験は、有効性、一般化能力、モデル効率、およびサンプル効率の観点から、私たちの方法の優位性を示しています。
私たちのMi-HGNNは、ロボットの形態対称性を8.4%レバレッジし、そのパラメーターのわずか0.21%をレバレッジする最先端のモデルのパフォーマンスを改善しました。
Mi-HGNNは、この作業でレッグされたロボットの接触知覚問題に適用されますが、他のタイプのマルチボディダイナミカルシステムにシームレスに適用でき、他のロボット学習フレームワークを改善する可能性があります。
私たちのコードは、https://github.com/lunarlab-gatech/morphology-nformed-hgnnで公開されています。

要約(オリジナル)

We present a Morphology-Informed Heterogeneous Graph Neural Network (MI-HGNN) for learning-based contact perception. The architecture and connectivity of the MI-HGNN are constructed from the robot morphology, in which nodes and edges are robot joints and links, respectively. By incorporating the morphology-informed constraints into a neural network, we improve a learning-based approach using model-based knowledge. We apply the proposed MI-HGNN to two contact perception problems, and conduct extensive experiments using both real-world and simulated data collected using two quadruped robots. Our experiments demonstrate the superiority of our method in terms of effectiveness, generalization ability, model efficiency, and sample efficiency. Our MI-HGNN improved the performance of a state-of-the-art model that leverages robot morphological symmetry by 8.4% with only 0.21% of its parameters. Although MI-HGNN is applied to contact perception problems for legged robots in this work, it can be seamlessly applied to other types of multi-body dynamical systems and has the potential to improve other robot learning frameworks. Our code is made publicly available at https://github.com/lunarlab-gatech/Morphology-Informed-HGNN.

arxiv情報

著者 Daniel Butterfield,Sandilya Sai Garimella,Nai-Jen Cheng,Lu Gan
発行日 2025-02-20 18:17:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, I.2.6 | MI-HGNN: Morphology-Informed Heterogeneous Graph Neural Network for Legged Robot Contact Perception はコメントを受け付けていません

Planning, scheduling, and execution on the Moon: the CADRE technology demonstration mission

要約

2025/2026で月のライナーガンマ地域への飛行が予定されているNASAの協同組合の自律分散ロボット探査(幹部)ミッションは、月井表面と表面の多象徴的な自律探査を実証するように設計されています。
3つのロボットと基地局のチームは、人間の入力なしで表面の3D再構成に必要なデータをランダー近くの地域を自律的に探索します。
そして、多段階の地面浸透レーダー(GPR)を使用して分散センシングを自律的に実行し、協調的なレーダーサウンドを実行して地下のマップを作成しながら形成を駆動します。
Cadreのソフトウェアアーキテクチャの中核は、新しい自律的な分散計画、スケジューリング、および実行(PS&E)システムです。
このシステムは、ロボットのアクティビティを調整し、複数のロボットの参加を必要とするタスクの計画と実行でありながら、個々のロボットの熱リソースと電力リソースが規定の境界内にとどまり、地上で処方された睡眠覚醒サイクルを尊重することを保証します。
このシステムは、集中計画、分散除去パラダイムを使用し、リーダーの選挙メカニズムは、個々のエージェントの失敗に対する堅牢性を保証します。
この論文では、幹部のPS&Eシステムのアーキテクチャについて説明します。
そのデザインの根拠について話し合う。
月への展開に備えて、Cadreのハードウェア上のシステムの検証と検証(V&V)テストについて報告します。

要約(オリジナル)

NASA’s Cooperative Autonomous Distributed Robotic Exploration (CADRE) mission, slated for flight to the Moon’s Reiner Gamma region in 2025/2026, is designed to demonstrate multi-agent autonomous exploration of the Lunar surface and sub-surface. A team of three robots and a base station will autonomously explore a region near the lander, collecting the data required for 3D reconstruction of the surface with no human input; and then autonomously perform distributed sensing with multi-static ground penetrating radars (GPR), driving in formation while performing coordinated radar soundings to create a map of the subsurface. At the core of CADRE’s software architecture is a novel autonomous, distributed planning, scheduling, and execution (PS&E) system. The system coordinates the robots’ activities, planning and executing tasks that require multiple robots’ participation while ensuring that each individual robot’s thermal and power resources stay within prescribed bounds, and respecting ground-prescribed sleep-wake cycles. The system uses a centralized-planning, distributed-execution paradigm, and a leader election mechanism ensures robustness to failures of individual agents. In this paper, we describe the architecture of CADRE’s PS&E system; discuss its design rationale; and report on verification and validation (V&V) testing of the system on CADRE’s hardware in preparation for deployment on the Moon.

arxiv情報

著者 Gregg Rabideau,Joseph Russino,Andrew Branch,Nihal Dhamani,Tiago Stegun Vaquero,Steve Chien,Jean-Pierre de la Croix,Federico Rossi
発行日 2025-02-20 18:26:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Planning, scheduling, and execution on the Moon: the CADRE technology demonstration mission はコメントを受け付けていません

VB-Com: Learning Vision-Blind Composite Humanoid Locomotion Against Deficient Perception

要約

足の移動のパフォーマンスは、状態観測の精度と包括性と密接に結びついています。
固有受容のみに依存する盲目の政策は、固有受容観察の信頼性のために非常に堅牢であると考えられています。
ただし、これらのポリシーは移動速度を大幅に制限しており、多くの場合、適応するために地形との衝突が必要で​​す。
対照的に、ビジョンポリシーにより、ロボットは事前に動きを計画し、オンライン認識モジュールを使用して非構造化された地形に積極的に対応できます。
ただし、ノイズの多い現実世界の環境、潜在的なセンサーの障害、および動的または変形可能な地形を提示する際の現在のシミュレーションの制限により、知覚はしばしば妥協されます。
自由度が高く、本質的に不安定な形態を持つヒューマノイドロボットは、特に知覚不足からの誤用を受けやすく、挑戦的な動的地形の転倒や終了をもたらす可能性があります。
ビジョンとブラインドポリシーの両方の利点を活用するために、ヒューマノイドロボットがビジョンポリシーに依存するタイミングと知覚不足の下で盲目のポリシーにいつ切り替えるかを決定できる複合フレームワークであるVB-COMを提案します。
VB-COMは、動的な地形や知覚騒音によって引き起こされる知覚の欠陥にもかかわらず、ヒューマノイドロボットが挑戦的な地形と障害を横断することを効果的に可能にすることを実証します。

要約(オリジナル)

The performance of legged locomotion is closely tied to the accuracy and comprehensiveness of state observations. Blind policies, which rely solely on proprioception, are considered highly robust due to the reliability of proprioceptive observations. However, these policies significantly limit locomotion speed and often require collisions with the terrain to adapt. In contrast, Vision policies allows the robot to plan motions in advance and respond proactively to unstructured terrains with an online perception module. However, perception is often compromised by noisy real-world environments, potential sensor failures, and the limitations of current simulations in presenting dynamic or deformable terrains. Humanoid robots, with high degrees of freedom and inherently unstable morphology, are particularly susceptible to misguidance from deficient perception, which can result in falls or termination on challenging dynamic terrains. To leverage the advantages of both vision and blind policies, we propose VB-Com, a composite framework that enables humanoid robots to determine when to rely on the vision policy and when to switch to the blind policy under perceptual deficiency. We demonstrate that VB-Com effectively enables humanoid robots to traverse challenging terrains and obstacles despite perception deficiencies caused by dynamic terrains or perceptual noise.

arxiv情報

著者 Junli Ren,Tao Huang,Huayi Wang,Zirui Wang,Qingwei Ben,Jiangmiao Pang,Ping Luo
発行日 2025-02-20 18:35:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | VB-Com: Learning Vision-Blind Composite Humanoid Locomotion Against Deficient Perception はコメントを受け付けていません

Soft Condorcet Optimization for Ranking of General Agents

要約

AIモデルとエージェントの進捗状況を促進するには、標準化されたベンチマークでのパフォーマンスを比較する必要があります。
一般的なエージェントの場合、個々のパフォーマンスは、潜在的に多種多様な異なるタスクで集約されなければなりません。
このペーパーでは、ソフトコンドルセの最適化(SCO)と呼ばれるソーシャルチョイスフレームワークに触発された新しいランキングスキームについて説明し、エージェントの最適なランキングを計算します。これは、評価データのエージェント比較を予測する際に最も少ない間違いを犯すものです。
この最適なランキングは、評価データ(投票と見なされる)が、コンドルセの元の投票システム基準の解決策であるグラウンドトゥルースランキングからの騒々しいサンプルとして解釈される場合の最尤推定値です。
SCOの評価は、コンドルセの勝者が存在する場合に最大であり、クラシックレーティングシステムELOには必ずしも当てはまるわけではありません。
SCO評価を計算し、その経験的パフォーマンスを評価するための3つの最適化アルゴリズムを提案します。
Kemeny-Youngの投票方法の近似として機能する場合、SCOランキングは、Preflibオープンランキブの865優先プロファイルにわたって正規化されたKendall-Tau距離の最適なランキングから平均0〜0.043離れています。
シミュレートされたノイズの多いトーナメントの設定では、SCOはグラウンドトゥルースランキングの正確な近似を実現し、59%以上の優先データが欠落している場合、いくつかのベースラインの中で最高です。
最後に、SCOランキングは、延べたテストセットで測定された最適なランキングに最適な近似を提供します。

要約(オリジナル)

Driving progress of AI models and agents requires comparing their performance on standardized benchmarks; for general agents, individual performances must be aggregated across a potentially wide variety of different tasks. In this paper, we describe a novel ranking scheme inspired by social choice frameworks, called Soft Condorcet Optimization (SCO), to compute the optimal ranking of agents: the one that makes the fewest mistakes in predicting the agent comparisons in the evaluation data. This optimal ranking is the maximum likelihood estimate when evaluation data (which we view as votes) are interpreted as noisy samples from a ground truth ranking, a solution to Condorcet’s original voting system criteria. SCO ratings are maximal for Condorcet winners when they exist, which we show is not necessarily true for the classical rating system Elo. We propose three optimization algorithms to compute SCO ratings and evaluate their empirical performance. When serving as an approximation to the Kemeny-Young voting method, SCO rankings are on average 0 to 0.043 away from the optimal ranking in normalized Kendall-tau distance across 865 preference profiles from the PrefLib open ranking archive. In a simulated noisy tournament setting, SCO achieves accurate approximations to the ground truth ranking and the best among several baselines when 59\% or more of the preference data is missing. Finally, SCO ranking provides the best approximation to the optimal ranking, measured on held-out test sets, in a problem containing 52,958 human players across 31,049 games of the classic seven-player game of Diplomacy.

arxiv情報

著者 Marc Lanctot,Kate Larson,Michael Kaisers,Quentin Berthet,Ian Gemp,Manfred Diaz,Roberto-Rafael Maura-Rivero,Yoram Bachrach,Anna Koop,Doina Precup
発行日 2025-02-20 16:41:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA | Soft Condorcet Optimization for Ranking of General Agents はコメントを受け付けていません

Internal Incoherency Scores for Constraint-based Causal Discovery Algorithms

要約

因果発見は、観察データまたは実験データから因果グラフを推測することを目的としています。
一般的なPCアルゴリズムなどの方法は、条件付き独立性テストに基づいており、その推論のために、忠実さの仮定などの可能性のある仮定を利用します。
実際には、これらの仮定と、選択した条件付き独立性テストから継承された機能的仮定は、通常、特定のものと見なされ、データに対する有効性についてはそれ以上テストされていません。
この作業では、地上の真理やさらなる統計テストを必要とせずに検出可能な場合、仮定違反と有限のサンプルエラーのテストを可能にする内部コヒーレンシースコアを提案します。
検出可能なエラーと検出不能なエラーの区別を含む、誤った結果の完全な分類を提供し、検出可能な誤った結果をスコアによって測定できることを証明します。
シミュレートされた現実世界のデータセットを使用したPCアルゴリズムのコヒーレンシースコアを説明し、内部コヒーレンシーのテストは、クラシックの仮定を検証するために使用されるように、内部コヒーレンシーのテストが制約ベースの方法を適用する際の標準ツールになる可能性があることを想定しています。
回帰分析。

要約(オリジナル)

Causal discovery aims to infer causal graphs from observational or experimental data. Methods such as the popular PC algorithm are based on conditional independence testing and utilize enabling assumptions, such as the faithfulness assumption, for their inferences. In practice, these assumptions, as well as the functional assumptions inherited from the chosen conditional independence test, are typically taken as a given and not further tested for their validity on the data. In this work, we propose internal coherency scores that allow testing for assumption violations and finite sample errors, whenever detectable without requiring ground truth or further statistical tests. We provide a complete classification of erroneous results, including a distinction between detectable and undetectable errors, and prove that the detectable erroneous results can be measured by our scores. We illustrate our coherency scores on the PC algorithm with simulated and real-world datasets, and envision that testing for internal coherency can become a standard tool in applying constraint-based methods, much like a suite of tests is used to validate the assumptions of classical regression analysis.

arxiv情報

著者 Sofia Faltenbacher,Jonas Wahl,Rebecca Herman,Jakob Runge
発行日 2025-02-20 16:44:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Internal Incoherency Scores for Constraint-based Causal Discovery Algorithms はコメントを受け付けていません