Kinodynamic Trajectory Following with STELA: Simultaneous Trajectory Estimation & Local Adaptation

要約

状態の推定と制御はしばしば個別に対処され、ノイズ、実行エラー、および計画モデルと現実の間の矛盾のために安全でない実行につながります。
これらの課題の統一されたソリューションとして、確率的グラフィカルモデルを使用した同時制御と軌道推定が提案されています。
ただし、以前の研究は、適切なガウス症の事前に大きく依存しており、直線的な時変モデルを備えたホロノミックロボットに限定されています。
現在の研究は、グラフィカルな最適化方法を、同時軌道推定とローカル適応(STELA)を介して、任意の動的モデルを持つ車両に拡張しています。
全体的なアプローチは、運動力学的なサンプリングベースのモーションプランナーを使用して、実行可能な軌跡を初期化します。
次に、同時に次のとおりです。(i)騒々しい観測に基づいて過去の軌跡を推定し、(ii)衝突を回避しながら、計画された実行可能な軌跡からの逸脱を最小限に抑えるために実行されるコントロールを適応させます。
STELAの軌跡の提案された因子グラフ表現は、一次または2次状態更新方程式へのアクセスを考慮して、任意の動的システムに適用でき、最適化変数としての軌跡離散化の2つの状態間の実行期間を導入します。
これらの機能は、軌跡の次の一般化と柔軟性の両方を提供します。
計算効率のターゲティングに加えて、提案された戦略は、ISAMアルゴリズムを使用して因子グラフの増分更新を実行し、時間ウィンドウメカニズムを導入します。
このメカニズムにより、因子グラフを動的に更新して、計画された軌跡の限られた履歴と前後の地平線上で動作します。
これにより、最低10Hzのコントロールのオンライン更新が可能になります。
実験は、STELAが線形ダイナミクスを備えた理想化された車両の以前のフレームワークに少なくとも同等のパフォーマンスを達成することを示しています。[…]

要約(オリジナル)

State estimation and control are often addressed separately, leading to unsafe execution due to sensing noise, execution errors, and discrepancies between the planning model and reality. Simultaneous control and trajectory estimation using probabilistic graphical models has been proposed as a unified solution to these challenges. Previous work, however, relies heavily on appropriate Gaussian priors and is limited to holonomic robots with linear time-varying models. The current research extends graphical optimization methods to vehicles with arbitrary dynamical models via Simultaneous Trajectory Estimation and Local Adaptation (STELA). The overall approach initializes feasible trajectories using a kinodynamic, sampling-based motion planner. Then, it simultaneously: (i) estimates the past trajectory based on noisy observations, and (ii) adapts the controls to be executed to minimize deviations from the planned, feasible trajectory, while avoiding collisions. The proposed factor graph representation of trajectories in STELA can be applied for any dynamical system given access to first or second-order state update equations, and introduces the duration of execution between two states in the trajectory discretization as an optimization variable. These features provide both generalization and flexibility in trajectory following. In addition to targeting computational efficiency, the proposed strategy performs incremental updates of the factor graph using the iSAM algorithm and introduces a time-window mechanism. This mechanism allows the factor graph to be dynamically updated to operate over a limited history and forward horizon of the planned trajectory. This enables online updates of controls at a minimum of 10Hz. Experiments demonstrate that STELA achieves at least comparable performance to previous frameworks on idealized vehicles with linear dynamics.[…]

arxiv情報

著者 Edgar Granados,Sumanth Tangirala,Kostas E. Bekris
発行日 2025-04-28 17:29:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Kinodynamic Trajectory Following with STELA: Simultaneous Trajectory Estimation & Local Adaptation はコメントを受け付けていません

Heterophily-informed Message Passing

要約

グラフニューラルネットワーク(GNNS)は、暗黙の同性愛の仮定により、滑走に対する脆弱性に対して脆弱であることが知られています。
この問題を、メッセージの集約を調節する新しいスキームでこの問題を緩和し、メッセージの低および高周波コンポーネントの両方を保存するメッセージのタイプと範囲を局所的に調整します。
私たちのアプローチは、学習した埋め込みのみに依存しており、補助ラベルの必要性を排除し、より広範なアプリケーション、たとえば生成モデリングに異種の認識埋め込みの利点を拡大します。
さまざまなデータセットとGNNアーキテクチャにわたって実施された実験は、パフォーマンスの強化を実証し、標準分類ベンチマーク全体で異種パターンを明らかにします。
さらに、分子生成への適用により、化学情報学のベンチマークで顕著なパフォーマンスの改善が示されます。

要約(オリジナル)

Graph neural networks (GNNs) are known to be vulnerable to oversmoothing due to their implicit homophily assumption. We mitigate this problem with a novel scheme that regulates the aggregation of messages, modulating the type and extent of message passing locally thereby preserving both the low and high-frequency components of information. Our approach relies solely on learnt embeddings, obviating the need for auxiliary labels, thus extending the benefits of heterophily-aware embeddings to broader applications, e.g., generative modelling. Our experiments, conducted across various data sets and GNN architectures, demonstrate performance enhancements and reveal heterophily patterns across standard classification benchmarks. Furthermore, application to molecular generation showcases notable performance improvements on chemoinformatics benchmarks.

arxiv情報

著者 Haishan Wang,Arno Solin,Vikas Garg
発行日 2025-04-28 13:28:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Heterophily-informed Message Passing はコメントを受け付けていません

Interpretable machine learning-guided design of Fe-based soft magnetic alloys

要約

Fe Rich軟質磁性合金、特にFe-Si-Bシステムの飽和磁化(MS)および強制(HC)を予測するための機械学習ガイド付きアプローチを提示します。
実験データで訓練されたMLモデルは、SiおよびB含有量の増加により、MSが1.81T(DFT〜2.04 T)からFe-SI-Bの〜1.54 T(DFT〜1.56T)に減少することが明らかになり、これは磁気密度と構造修飾の減少に起因します。
MLの実験的検証Fe-1SI-1B(2.09T)、Fe-5SI-5B(2.01T)、Fe-10SI-10b(1.54T)合金組成の磁気飽和度は予測されました。
これらの傾向は、密度汎関数理論(DFT)予測と一致しており、電子障害の増加とバンドの拡大をより低いMS値にリンクします。
選択された合金に関する実験的検証は、MLモデルの予測精度を確認し、組成全体でよく一致します。
予測精度を超えて、特徴の重要性と部分依存分析を介した詳細な不確実性の定量化とモデルの解釈可能性は、MSがFE含有量、早期遷移金属比、アニーリング温度の間の非線形相互作用によって支配されていることを明らかにしていますが、HCはリボンの厚さや熱処理窓などの処理条件により敏感です。
MLフレームワークは、ナノメットに匹敵する磁気特性(Fe84.8SI0.8 P3.5C1)、FINEMET(FE73.53.5B9 CU1NB3)、NANB3)に匹敵する磁気特性を示す擬似質nary組成空間でFe-Si-B/Cr/Cu/Zr/Nb合金にさらに適用されました。
(Fe88Zr7b4cu1)、およびhitperm(fe44Co44Zr7b4cu1。私たちの資金は、高性能、CO-およびNIのない柔らかい磁気材料の加速検索のためのMLフレームワークの可能性を示しています。

要約(オリジナル)

We present a machine-learning guided approach to predict saturation magnetization (MS) and coercivity (HC) in Fe-rich soft magnetic alloys, particularly Fe-Si-B systems. ML models trained on experimental data reveals that increasing Si and B content reduces MS from 1.81T (DFT~2.04 T) to ~1.54 T (DFT~1.56T) in Fe-Si-B, which is attributed to decreased magnetic density and structural modifications. Experimental validation of ML predicted magnetic saturation on Fe-1Si-1B (2.09T), Fe-5Si-5B (2.01T) and Fe-10Si-10B (1.54T) alloy compositions further support our findings. These trends are consistent with density functional theory (DFT) predictions, which link increased electronic disorder and band broadening to lower MS values. Experimental validation on selected alloys confirms the predictive accuracy of the ML model, with good agreement across compositions. Beyond predictive accuracy, detailed uncertainty quantification and model interpretability including through feature importance and partial dependence analysis reveals that MS is governed by a nonlinear interplay between Fe content, early transition metal ratios, and annealing temperature, while HC is more sensitive to processing conditions such as ribbon thickness and thermal treatment windows. The ML framework was further applied to Fe-Si-B/Cr/Cu/Zr/Nb alloys in a pseudo-quaternary compositional space, which shows comparable magnetic properties to NANOMET (Fe84.8Si0.5B9.4Cu0.8 P3.5C1), FINEMET (Fe73.5Si13.5B9 Cu1Nb3), NANOPERM (Fe88Zr7B4Cu1), and HITPERM (Fe44Co44Zr7B4Cu1. Our fundings demonstrate the potential of ML framework for accelerated search of high-performance, Co- and Ni-free, soft magnetic materials.

arxiv情報

著者 Aditi Nachnani,Kai K. Li-Caldwell,Saptarshi Biswas,Prince Sharma,Gaoyuan Ouyang,Prashant Singh
発行日 2025-04-28 13:30:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cond-mat.other, cs.LG | Interpretable machine learning-guided design of Fe-based soft magnetic alloys はコメントを受け付けていません

Dynamic Tsetlin Machine Accelerators for On-Chip Training at the Edge using FPGAs

要約

機械学習(ML)アプリケーションにおけるデータプライバシーとセキュリティの需要の増加により、インターネット(IoT)ノードの効果的なエッジトレーニングに推進力があります。
エッジトレーニングは、ノードのリソース制約内で速度、エネルギー効率、適応性を活用することを目的としています。
ディープニューラルネットワーク(DNNS)ベースのモデルをエッジで展開およびトレーニングすることは、正確ではありますが、DNN層の複雑さ、ビット精度のトレードオフ、および不均一性からの重要な課題を前向きに課します。
このペーパーでは、DNN実装の代替として動的なTsetlinマシン(DTM)トレーニングアクセラレータを紹介します。
DTMは、同じフィールドプログラマブルゲートアレイ(FPGA)パッケージ内で有限状態のオートマトン駆動型学習を使用して、ロジックベースのオンチップ推論を使用します。
バニラと合体されたTsetlinマシンアルゴリズムに支えられているAccelerator Designの動的な側面により、さまざまなデータセット、モデルアーキテクチャ、および再構成なしのモデルサイズをターゲットとするランタイム再構成が可能になります。
これにより、DTMは多変量センサーベースのエッジタスクをターゲットにするのに適しています。
DNNSと比較して、DTM列車は、微分計算がなく、導入計算がない多数の蓄積が少ない列車です。
これは、FPGAトレーニングの実装で効率的なルックアップテーブル(LUT)マッピングと質素なブロックRAM使用量を可能にする論理命題を形成するためにTsetlin Automataを入力データと調整することにより学習するデータ中心のMLアルゴリズムです。
提案されているアクセラレータは、ワットあたり2.54倍のギガ操作を1ワットあたり(wあたりのGOP/s)に提供し、次のベストの同等のデザインよりも6倍少ない電力を使用します。

要約(オリジナル)

The increased demand for data privacy and security in machine learning (ML) applications has put impetus on effective edge training on Internet-of-Things (IoT) nodes. Edge training aims to leverage speed, energy efficiency and adaptability within the resource constraints of the nodes. Deploying and training Deep Neural Networks (DNNs)-based models at the edge, although accurate, posit significant challenges from the back-propagation algorithm’s complexity, bit precision trade-offs, and heterogeneity of DNN layers. This paper presents a Dynamic Tsetlin Machine (DTM) training accelerator as an alternative to DNN implementations. DTM utilizes logic-based on-chip inference with finite-state automata-driven learning within the same Field Programmable Gate Array (FPGA) package. Underpinned on the Vanilla and Coalesced Tsetlin Machine algorithms, the dynamic aspect of the accelerator design allows for a run-time reconfiguration targeting different datasets, model architectures, and model sizes without resynthesis. This makes the DTM suitable for targeting multivariate sensor-based edge tasks. Compared to DNNs, DTM trains with fewer multiply-accumulates, devoid of derivative computation. It is a data-centric ML algorithm that learns by aligning Tsetlin automata with input data to form logical propositions enabling efficient Look-up-Table (LUT) mapping and frugal Block RAM usage in FPGA training implementations. The proposed accelerator offers 2.54x more Giga operations per second per Watt (GOP/s per W) and uses 6x less power than the next-best comparable design.

arxiv情報

著者 Gang Mao,Tousif Rahman,Sidharth Maheshwari,Bob Pattison,Zhuang Shao,Rishad Shafik,Alex Yakovlev
発行日 2025-04-28 13:38:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AR, cs.LG | Dynamic Tsetlin Machine Accelerators for On-Chip Training at the Edge using FPGAs はコメントを受け付けていません

Distributed Multi-Task Learning for Stochastic Bandits with Context Distribution and Stage-wise Constraints

要約

不均一なエージェントとの確率的線形文脈的盗賊で、保守的な分散マルチタスク学習を提示します。
これにより、保守的な線形盗賊が分散型設定に拡張され、Mエージェントがステージワイズのパフォーマンスの制約を順守しながら、さまざまなが関連するタスクに取り組みます。
正確なコンテキストは不明であり、エージェントがコンテキスト分布のみを利用できます。これは、株式市場の予測や天気予報など、コンテキストを推測する予測メカニズムを含む多くの実用的なアプリケーションのように使用できます。
分散された上位信頼バウンド(UCB)アルゴリズム、disc-ucbを提案します。
私たちのアルゴリズムは、各ラウンド中に剪定されたアクションセットを構築して、制約が満たされるようにします。
さらに、適切に構造化された同期ステップを使用して、中央サーバーを介してエージェント間の推定値の同期された共有が含まれます。
アルゴリズムの後悔とコミュニケーションの境界を証明します。
問題は、エージェントがベースライン報酬を知らない設定に拡張します。
この設定では、修正されたアルゴリズムであるdisc-UCB2を提供し、変更されたアルゴリズムが同じ後悔と通信の範囲を達成することを示します。
合成データと実際のMovielens-100Kデータに関するアルゴリズムのパフォーマンスを経験的に検証しました。

要約(オリジナル)

We present conservative distributed multi-task learning in stochastic linear contextual bandits with heterogeneous agents. This extends conservative linear bandits to a distributed setting where M agents tackle different but related tasks while adhering to stage-wise performance constraints. The exact context is unknown, and only a context distribution is available to the agents as in many practical applications that involve a prediction mechanism to infer context, such as stock market prediction and weather forecast. We propose a distributed upper confidence bound (UCB) algorithm, DiSC-UCB. Our algorithm constructs a pruned action set during each round to ensure the constraints are met. Additionally, it includes synchronized sharing of estimates among agents via a central server using well-structured synchronization steps. We prove the regret and communication bounds on the algorithm. We extend the problem to a setting where the agents are unaware of the baseline reward. For this setting, we provide a modified algorithm, DiSC-UCB2, and we show that the modified algorithm achieves the same regret and communication bounds. We empirically validated the performance of our algorithm on synthetic data and real-world Movielens-100K data.

arxiv情報

著者 Jiabin Lin,Shana Moothedath
発行日 2025-04-28 13:42:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA | Distributed Multi-Task Learning for Stochastic Bandits with Context Distribution and Stage-wise Constraints はコメントを受け付けていません

Reactive Orchestration for Hierarchical Federated Learning Under a Communication Cost Budget

要約

コンピューティング連続体(CC)全体に階層的フェデレーション学習(HFL)パイプラインを展開するには、FLクライアントとグローバルFLサーバー間の中間集約ノードを備えた階層構造に参加者を慎重に組織する必要があります。
これは、(i)コストの制約、(ii)さまざまなデータ分布、および(iii)CCの揮発性動作環境のために達成するのが困難です。
これらの課題に応えて、クライアントのチャーンおよびインフラレベルのイベントに反応するように設計されたHFLパイプラインの適応オーケストレーションのフレームワークを提示し、通信コストとMLモデルの精度のバランスを取ります。
私たちのメカニズムは、マルチレベルの監視情報(モデルの精度、リソースの可用性、リソースコスト)に基づいて、実行時にHFL再構成アクションを引き起こすイベントを特定し、反応します。
さらに、私たちのフレームワークでは、さまざまなHFLパフォーマンス基準を最適化するために拡張可能であると同時に、適応アクションの品質を継続的に再評価するために再構成コストを推定するための一般的な方法論を紹介します。
Kubernetesエコシステムを拡張することにより、当社のフレームワークは、営業環境の変化に迅速かつ効果的に反応する能力を示し、利用可能な通信コスト予算を最大限に活用し、実行時にコストとMLのパフォーマンスを効果的にバランスさせます。

要約(オリジナル)

Deploying a Hierarchical Federated Learning (HFL) pipeline across the computing continuum (CC) requires careful organization of participants into a hierarchical structure with intermediate aggregation nodes between FL clients and the global FL server. This is challenging to achieve due to (i) cost constraints, (ii) varying data distributions, and (iii) the volatile operating environment of the CC. In response to these challenges, we present a framework for the adaptive orchestration of HFL pipelines, designed to be reactive to client churn and infrastructure-level events, while balancing communication cost and ML model accuracy. Our mechanisms identify and react to events that cause HFL reconfiguration actions at runtime, building on multi-level monitoring information (model accuracy, resource availability, resource cost). Moreover, our framework introduces a generic methodology for estimating reconfiguration costs to continuously re-evaluate the quality of adaptation actions, while being extensible to optimize for various HFL performance criteria. By extending the Kubernetes ecosystem, our framework demonstrates the ability to react promptly and effectively to changes in the operating environment, making the best of the available communication cost budget and effectively balancing costs and ML performance at runtime.

arxiv情報

著者 Ivan Čilić,Anna Lackinger,Pantelis Frangoudis,Ivana Podnar Žarko,Alireza Furutanpey,Ilir Murturi,Schahram Dustdar
発行日 2025-04-28 13:46:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, cs.NI | Reactive Orchestration for Hierarchical Federated Learning Under a Communication Cost Budget はコメントを受け付けていません

Low degree conjecture implies sharp computational thresholds in stochastic block model

要約

対称確率的ブロックモデルのコンテキストにおける(拡張)低程度の推測(最近[MW23]で正式化された)の意味を調査します。
推測が当てはまると仮定すると、多項式時間アルゴリズムがKesten-Stigum(KS)しきい値の下にコミュニティラベルを弱く回復できることを確立します。
特に、一定の確率で、ランダムよりも大幅に優れている真のコミュニティとの相関を達成するという多項式時間推定器を除外します。
一方、KSのしきい値を超えて、多項式時間アルゴリズムは、高い確率を持つ真のコミュニティと一定の相関を達成することが知られています[MAS14、AS15]。
私たちの知る限り、KSしきい値での多項式時間アルゴリズムの回復率における急激な遷移の最初の厳密な証拠を提供します。
特に、低級の推測の強力なバージョンの下では、ブロックの数が分岐した場合でも、下限は有効なままです。
さらに、我々の結果は、確率的ブロックモデルのパラメーターを学習する際の計算間ギャップの証拠を提供します。
以前の研究とは対照的に、(i)は、低次の推測下で1-O(1)成功確率[Hopkins18、BBK+21A]で仮説テストの多項式時間アルゴリズムを除外するか、(ii)エッジ接続の確率マトリックスを学習するための低級多項式を除外します。
私たちの証明は、[Hopkins18、BBK+21a]の低程度の下限と、グラフの分割と交差検証技術を組み合わせています。
一般的な回復アルゴリズムを除外するために、[HS17]で開発された相関保存投影方法を採用します。

要約(オリジナル)

We investigate implications of the (extended) low-degree conjecture (recently formalized in [MW23]) in the context of the symmetric stochastic block model. Assuming the conjecture holds, we establish that no polynomial-time algorithm can weakly recover community labels below the Kesten-Stigum (KS) threshold. In particular, we rule out polynomial-time estimators that, with constant probability, achieve correlation with the true communities that is significantly better than random. Whereas, above the KS threshold, polynomial-time algorithms are known to achieve constant correlation with the true communities with high probability[Mas14,AS15]. To our knowledge, we provide the first rigorous evidence for the sharp transition in recovery rate for polynomial-time algorithms at the KS threshold. Notably, under a stronger version of the low-degree conjecture, our lower bound remains valid even when the number of blocks diverges. Furthermore, our results provide evidence of a computational-to-statistical gap in learning the parameters of stochastic block models. In contrast to prior work, which either (i) rules out polynomial-time algorithms for hypothesis testing with 1-o(1) success probability [Hopkins18, BBK+21a] under the low-degree conjecture, or (ii) rules out low-degree polynomials for learning the edge connection probability matrix [LG23], our approach provides stronger lower bounds on the recovery and learning problem. Our proof combines low-degree lower bounds from [Hopkins18, BBK+21a] with graph splitting and cross-validation techniques. In order to rule out general recovery algorithms, we employ the correlation preserving projection method developed in [HS17].

arxiv情報

著者 Jingqiu Ding,Yiding Hua,Lucas Slot,David Steurer
発行日 2025-04-28 13:50:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CC, cs.LG, math.ST, stat.CO, stat.TH | Low degree conjecture implies sharp computational thresholds in stochastic block model はコメントを受け付けていません

Digital Twin-based Out-of-Distribution Detection in Autonomous Vessels

要約

自律容器(AV)は、多くの主要な機能を可能にするソフトウェアを備えた複雑なサイバー物理システム(CPS)です。たとえば、ナビゲーションソフトウェアにより、AVは自律的または半自律的にその目的地への道をたどることができます。
このようなAVのデジタルツインは、What-IFシナリオの実行、予測メンテナンスの実行、障害診断の有効化などの高度な機能を可能にします。
技術的な改善により、船舶のリアルタイム操作からの継続的なデータを使用したリアルタイム分析がますます可能になりました。
ただし、この文献では、機械学習技術で構築されたデジタルツインを使用して、AVSのリアルタイムデータの高度な分析の開発をほとんど調査していません。
この目的のために、AVに到達する前にAVの将来の分布(OOD)状態を検出するための新しいデジタルツインベースのアプローチ(Oddit)を提示し、積極的な介入を可能にします。
そのような状態は、注意を必要とする異常(船長による手動修正)を示す可能性があり、シナリオ中心のテストでテスターを支援します。
デジタルツインは、将来の船舶状態を予測する2つの機械学習モデルと、予測された状態がOODになるかどうかで構成されています。
センサーとアクチュエーターの騒音や環境障害など、海洋電流など、ウェイポイントとジグザグ操作を5隻の容器でオッディットを評価しました。
OdditはOOD状態の検出において高い精度を達成し、AUROCとTNR@TPR95スコアは複数の容器で99%に達しました。

要約(オリジナル)

An autonomous vessel (AV) is a complex cyber-physical system (CPS) with software enabling many key functionalities, e.g., navigation software enables an AV to autonomously or semi-autonomously follow a path to its destination. Digital twins of such AVs enable advanced functionalities such as running what-if scenarios, performing predictive maintenance, and enabling fault diagnosis. Due to technological improvements, real-time analyses using continuous data from vessels’ real-time operations have become increasingly possible. However, the literature has little explored developing advanced analyses in real-time data in AVs with digital twins built with machine learning techniques. To this end, we present a novel digital twin-based approach (ODDIT) to detect future out-of-distribution (OOD) states of an AV before reaching them, enabling proactive intervention. Such states may indicate anomalies requiring attention (e.g., manual correction by the ship master) and assist testers in scenario-centered testing. The digital twin consists of two machine-learning models predicting future vessel states and whether the predicted state will be OOD. We evaluated ODDIT with five vessels across waypoint and zigzag maneuvering under simulated conditions, including sensor and actuator noise and environmental disturbances i.e., ocean current. ODDIT achieved high accuracy in detecting OOD states, with AUROC and TNR@TPR95 scores reaching 99\% across multiple vessels.

arxiv情報

著者 Erblin Isaku,Hassan Sartaj,Shaukat Ali
発行日 2025-04-28 14:12:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SE, cs.SY, eess.SY | Digital Twin-based Out-of-Distribution Detection in Autonomous Vessels はコメントを受け付けていません

Sequential Conditional Transport on Probabilistic Graphs for Interpretable Counterfactual Fairness

要約

このホワイトペーパーでは、2つの既存のアプローチをリンクして、反事実を導き出すことです。因果グラフに基づく適応と最適な輸送です。
「Knotheの再配置」と「三角輸送」を確率的グラフィカルモデルに拡張し、シーケンシャルトランスポートと呼ばれるこの反事実的アプローチを使用して、個々のレベルでの公平性を議論します。
提案された方法の理論的基礎を確立した後、合成データセットと実際のデータセットの両方で数値実験を通じてその応用を実証します。

要約(オリジナル)

In this paper, we link two existing approaches to derive counterfactuals: adaptations based on a causal graph, and optimal transport. We extend ‘Knothe’s rearrangement’ and ‘triangular transport’ to probabilistic graphical models, and use this counterfactual approach, referred to as sequential transport, to discuss fairness at the individual level. After establishing the theoretical foundations of the proposed method, we demonstrate its application through numerical experiments on both synthetic and real datasets.

arxiv情報

著者 Agathe Fernandes Machado,Arthur Charpentier,Ewen Gallic
発行日 2025-04-28 14:21:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME | Sequential Conditional Transport on Probabilistic Graphs for Interpretable Counterfactual Fairness はコメントを受け付けていません

Hierarchical Uncertainty-Aware Graph Neural Network

要約

グラフニューラルネットワーク(GNNS)に関する最近の研究では、局所的な不確実性をキャプチャし、グラフ階層を利用してデータのスパースを軽減し、構造特性を活用するメカニズムを調査しました。
ただし、これらの2つのアプローチの相乗的な統合は、既知のままです。
この作業では、新しいアーキテクチャ、階層的な不確実性グラフニューラルネットワーク(HU-GNN)を紹介します。これは、単一のエンドツーエンドフレームワーク内のマルチスケール表現学習、原則的な不確実性の推定、および自己監督の埋め込み多様性を統合します。
具体的には、Hu-Gnnはノードクラスターを適応的に形成し、個々のノードからより高いレベルまでの複数の構造スケールで不確実性を推定します。
これらの不確実性の推定では、ノードレベルとグラフレベルの両方のタスクで予測精度を維持しながら、ノイズと敵対的な摂動を効果的に緩和し、効果的に緩和されたメカニズムと注意の重み付けを導きます。
また、確率的定式化、厳密な不確実性キャリブレーション保証、正式な堅牢性の範囲など、重要な理論的貢献も提供します。
最後に、グラフの対照学習に最近の進歩を組み込むことにより、Hu-Gnnは多様で構造的に忠実な埋め込みを維持します。
標準ベンチマークでの広範な実験は、モデルが最先端の堅牢性と解釈可能性を達成することを示しています。

要約(オリジナル)

Recent research on graph neural networks (GNNs) has explored mechanisms for capturing local uncertainty and exploiting graph hierarchies to mitigate data sparsity and leverage structural properties. However, the synergistic integration of these two approaches remains underexplored. In this work, we introduce a novel architecture, the Hierarchical Uncertainty-Aware Graph Neural Network (HU-GNN), which unifies multi-scale representation learning, principled uncertainty estimation, and self-supervised embedding diversity within a single end-to-end framework. Specifically, HU-GNN adaptively forms node clusters and estimates uncertainty at multiple structural scales from individual nodes to higher levels. These uncertainty estimates guide a robust message-passing mechanism and attention weighting, effectively mitigating noise and adversarial perturbations while preserving predictive accuracy on both node- and graph-level tasks. We also offer key theoretical contributions, including a probabilistic formulation, rigorous uncertainty-calibration guarantees, and formal robustness bounds. Finally, by incorporating recent advances in graph contrastive learning, HU-GNN maintains diverse, structurally faithful embeddings. Extensive experiments on standard benchmarks demonstrate that our model achieves state-of-the-art robustness and interpretability.

arxiv情報

著者 Yoonhyuk Choi,Chong-Kwon Kim
発行日 2025-04-28 14:22:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG | Hierarchical Uncertainty-Aware Graph Neural Network はコメントを受け付けていません