GeoDEx: A Unified Geometric Framework for Tactile Dexterous and Extrinsic Manipulation under Force Uncertainty

要約

ロボットが接触力を検出して相互作用力を測定できるようにする感覚により、脆弱なオブジェクトをつかんだり、ツールを使用したりするなどの挑戦的なタスクを実行できます。
理論的には、触覚センサーはロボットにそのような機能を装備できます。
ただし、測定された力の精度は、潜在的なキャリブレーションの課題とノイズのため、力センサーの精度と同等ではありません。
これにより、これらのセンサーが強制制御を必要とする操作アプリケーションで提供できる値が制限されています。
この論文では、平面、円錐、楕円体などの幾何学的プリミティブを使用した統一された推定、計画、および制御フレームワークであるGeodexを紹介します。
さまざまな実験結果を通じて、触覚センサーからの直接的な不正確でノイズの多い力の測定値に依存すると、不安定または失敗した操作が生じることを示します。
さらに、SOCP(2次コーンプログラミング)を使用した直接の実行最適化と比較して、フレームワークを使用した計画と力の推定は14倍のスピードアップを実現します。

要約(オリジナル)

Sense of touch that allows robots to detect contact and measure interaction forces enables them to perform challenging tasks such as grasping fragile objects or using tools. Tactile sensors in theory can equip the robots with such capabilities. However, accuracy of the measured forces is not on a par with those of the force sensors due to the potential calibration challenges and noise. This has limited the values these sensors can offer in manipulation applications that require force control. In this paper, we introduce GeoDEx, a unified estimation, planning, and control framework using geometric primitives such as plane, cone and ellipsoid, which enables dexterous as well as extrinsic manipulation in the presence of uncertain force readings. Through various experimental results, we show that while relying on direct inaccurate and noisy force readings from tactile sensors results in unstable or failed manipulation, our method enables successful grasping and extrinsic manipulation of different objects. Additionally, compared to directly running optimization using SOCP (Second Order Cone Programming), planning and force estimation using our framework achieves a 14x speed-up.

arxiv情報

著者 Sirui Chen,Sergio Aguilera Marinovic,Soshi Iba,Rana Soltani Zarrin
発行日 2025-05-01 16:40:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | GeoDEx: A Unified Geometric Framework for Tactile Dexterous and Extrinsic Manipulation under Force Uncertainty はコメントを受け付けていません

Robot localization aided by quantum algorithms

要約

ローカライズはモバイルロボット工学の重要な側面であり、ロボットが環境を効率的にナビゲートし、障害を回避できるようにします。
適応モンテカルロローカリゼーション(AMCL)アルゴリズムなどの現在の確率的局在方法は、計算的に集中的であり、大きな地図や高解像度センサーデータに苦労する可能性があります。
このペーパーでは、ロボット工学における量子コンピューティングの適用を調査し、モバイルロボットのローカリゼーションの効率を改善するためにGroverの検索アルゴリズムの使用に焦点を当てています。
Groverのアルゴリズムを2Dマップで利用するための新しいアプローチを提案し、より速く、より効率的なローカリゼーションを可能にします。
現在の物理量子コンピューターの制限にもかかわらず、実験結果は古典的な方法よりも大幅な高速化を示しており、ロボットの局在化を改善する量子コンピューティングの可能性を強調しています。
この作業は、量子コンピューティングとロボット工学の間のギャップを橋渡しし、ロボットローカリゼーションのための実用的なソリューションを提供し、量子ロボット工学の将来の研究への道を開きます。

要約(オリジナル)

Localization is a critical aspect of mobile robotics, enabling robots to navigate their environment efficiently and avoid obstacles. Current probabilistic localization methods, such as the Adaptive-Monte Carlo localization (AMCL) algorithm, are computationally intensive and may struggle with large maps or high-resolution sensor data. This paper explores the application of quantum computing in robotics, focusing on the use of Grover’s search algorithm to improve the efficiency of localization in mobile robots. We propose a novel approach to utilize Grover’s algorithm in a 2D map, enabling faster and more efficient localization. Despite the limitations of current physical quantum computers, our experimental results demonstrate a significant speedup over classical methods, highlighting the potential of quantum computing to improve robotic localization. This work bridges the gap between quantum computing and robotics, providing a practical solution for robotic localization and paving the way for future research in quantum robotics.

arxiv情報

著者 Unai Antero,Basilio Sierra,Jon Oñativia,Alejandra Ruiz,Eneko Osaba
発行日 2025-05-01 16:46:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Robot localization aided by quantum algorithms はコメントを受け付けていません

Multi-Constraint Safe Reinforcement Learning via Closed-form Solution for Log-Sum-Exp Approximation of Control Barrier Functions

要約

トレーニングタスクポリシーの安全性とその後の補強学習(RL)方法を使用した後続のアプリケーションは、安全なRLの分野の焦点となっています。
この分野における中心的な課題は、学習プロセスと展開プロセスの両方の間に、安全のための理論的保証の確立を依然として依然として依然として示しています。
コントロールバリア機能(CBF)ベースの安全戦略の実装が成功したことを考えると、さまざまなコントロールアフィンロボットシステムに基づく安全戦略があり、CBFベースのSAFE RLは、実際のシナリオでの実用的なアプリケーションに大きな約束を示しています。
ただし、これら2つのアプローチを統合すると、いくつかの課題があります。
第一に、RLトレーニングパイプライン内に安全最適化を埋め込むには、最適化出力が入力パラメーターに対して微分可能である必要があります。これは、一般に微分可能な最適化と呼ばれる条件であり、解決するのは自明ではありません。
第二に、微分可能な最適化フレームワークは、特にマルチコンストラリングの問題に対処する場合、重大な効率の問題に直面しています。
これらの課題に対処するために、このペーパーでは、上記の問題を効果的に軽減するCBFベースの安全なRLアーキテクチャを紹介します。
提案されたアプローチは、単一の複合CBFを使用して、複数の制約の連続的および論理近似を構築します。
この近似を活用することにより、RLのポリシーネットワークに対して二次プログラミングの密接な形式ソリューションが導出され、エンドツーエンドの安全なRLパイプライン内の微分可能な最適化の必要性を回避します。
この戦略は、安全保証を維持しながら閉じた形式のソリューションのため、計算の複雑さを大幅に削減します。
シミュレーション結果は、微分可能な最適化に依存する既存のアプローチと比較して、提案された方法がトレーニングの計算コストを大幅に削減し、トレーニングプロセス全体で証明可能な安全性を確保することを示しています。

要約(オリジナル)

The safety of training task policies and their subsequent application using reinforcement learning (RL) methods has become a focal point in the field of safe RL. A central challenge in this area remains the establishment of theoretical guarantees for safety during both the learning and deployment processes. Given the successful implementation of Control Barrier Function (CBF)-based safety strategies in a range of control-affine robotic systems, CBF-based safe RL demonstrates significant promise for practical applications in real-world scenarios. However, integrating these two approaches presents several challenges. First, embedding safety optimization within the RL training pipeline requires that the optimization outputs be differentiable with respect to the input parameters, a condition commonly referred to as differentiable optimization, which is non-trivial to solve. Second, the differentiable optimization framework confronts significant efficiency issues, especially when dealing with multi-constraint problems. To address these challenges, this paper presents a CBF-based safe RL architecture that effectively mitigates the issues outlined above. The proposed approach constructs a continuous AND logic approximation for the multiple constraints using a single composite CBF. By leveraging this approximation, a close-form solution of the quadratic programming is derived for the policy network in RL, thereby circumventing the need for differentiable optimization within the end-to-end safe RL pipeline. This strategy significantly reduces computational complexity because of the closed-form solution while maintaining safety guarantees. Simulation results demonstrate that, in comparison to existing approaches relying on differentiable optimization, the proposed method significantly reduces training computational costs while ensuring provable safety throughout the training process.

arxiv情報

著者 Chenggang Wang,Xinyi Wang,Yutong Dong,Lei Song,Xinping Guan
発行日 2025-05-01 17:22:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Multi-Constraint Safe Reinforcement Learning via Closed-form Solution for Log-Sum-Exp Approximation of Control Barrier Functions はコメントを受け付けていません

Leveraging Partial SMILES Validation Scheme for Enhanced Drug Design in Reinforcement Learning Frameworks

要約

笑顔に基づいた分子の生成は、創薬における強力なアプローチとして浮上しています。
大規模な言語モデル(LLM)を使用したディープ補強学習(RL)が分子生成プロセスに組み込まれており、望ましい分子候補の可能性があるという点で高いマッチングスコアを達成しています。
ただし、このアプローチの重要な課題は、RLフェーズ中の壊滅的な忘却です。この段階では、前脱出中に99%を超える分子妥当性などの知識が大幅に悪化します。
再発明などの創薬に適用された現在のRLアルゴリズムは、リツアン前脱契約の知識のアンカーとして以前のモデルを使用しますが、これらの方法には堅牢な探索メカニズムがありません。
これらの問題に対処するために、調査を奨励しながら壊滅的な忘却を防ぐためにリアルタイムの部分的な笑顔検証を組み込んだ新しいRLアルゴリズムである部分的なSmiles検証-PPO(PSV-PPO)を提案します。
シーケンス全体を生成した後にのみ分子構造を検証する従来のRLアプローチとは異なり、PSV-PPOは各自動回帰ステップで段階的検証を実行し、選択したトークン候補だけでなく、前の部分シーケンスに由来するすべての潜在的な分岐も評価します。
これにより、すべての潜在的なパスにわたって無効な部分的な笑顔を早期に検出できます。
その結果、PSV-PPOは、広大な化学空間の積極的な調査中であっても、高い妥当性率を維持しています。
PMOおよびグアカモールベンチマークデータセットでの実験は、PSV-PPOが競争力のある探索と最適化パフォーマンスを維持しながら、無効な生成構造の数を大幅に削減することを示しています。
私たちの仕事は主に妥当性の維持に焦点を当てていますが、PSV-PPOのフレームワークを将来の研究で拡張して、貴重なドメイン知識の追加形態を組み込むことができ、創薬における強化学習アプリケーションをさらに強化することができます。

要約(オリジナル)

SMILES-based molecule generation has emerged as a powerful approach in drug discovery. Deep reinforcement learning (RL) using large language model (LLM) has been incorporated into the molecule generation process to achieve high matching score in term of likelihood of desired molecule candidates. However, a critical challenge in this approach is catastrophic forgetting during the RL phase, where knowledge such as molecule validity, which often exceeds 99\% during pretraining, significantly deteriorates. Current RL algorithms applied in drug discovery, such as REINVENT, use prior models as anchors to retian pretraining knowledge, but these methods lack robust exploration mechanisms. To address these issues, we propose Partial SMILES Validation-PPO (PSV-PPO), a novel RL algorithm that incorporates real-time partial SMILES validation to prevent catastrophic forgetting while encouraging exploration. Unlike traditional RL approaches that validate molecule structures only after generating entire sequences, PSV-PPO performs stepwise validation at each auto-regressive step, evaluating not only the selected token candidate but also all potential branches stemming from the prior partial sequence. This enables early detection of invalid partial SMILES across all potential paths. As a result, PSV-PPO maintains high validity rates even during aggressive exploration of the vast chemical space. Our experiments on the PMO and GuacaMol benchmark datasets demonstrate that PSV-PPO significantly reduces the number of invalid generated structures while maintaining competitive exploration and optimization performance. While our work primarily focuses on maintaining validity, the framework of PSV-PPO can be extended in future research to incorporate additional forms of valuable domain knowledge, further enhancing reinforcement learning applications in drug discovery.

arxiv情報

著者 Xinyu Wang,Jinbo Bi,Minghu Song
発行日 2025-05-01 13:57:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, q-bio.BM | Leveraging Partial SMILES Validation Scheme for Enhanced Drug Design in Reinforcement Learning Frameworks はコメントを受け付けていません

Emergence of Roles in Robotic Teams with Model Sharing and Limited Communication

要約

学習が単一のエージェントに集中化され、そのモデルが非学習剤の集団に定期的に広まっているマルチエージェント採餌システムで使用するための強化学習戦略を提示します。
マルチエージェント強化学習(MARL)が一般的なアプローチであるドメインでは、このアプローチは、MARLや集中学習モデルなどのアプローチと比較して、計算およびエネルギーの需要を大幅に削減することを目的としています。
高性能の採餌剤を開発することにより、これらのアプローチは、物流、環境監視、自律探査などの現実世界のアプリケーションに翻訳できます。
明示的な指示なしに、エージェント間の役割開発を促進するこのアプローチに報酬機能が組み込まれました。
これにより、エージェント間の動作が区別されました。
役割の差別化の暗黙的な励ましにより、エージェント間の明示的なコミュニケーションを必要とせずに、エージェントが環境との相互作用に依存する役割を変更できる動的アクションが可能になります。

要約(オリジナル)

We present a reinforcement learning strategy for use in multi-agent foraging systems in which the learning is centralised to a single agent and its model is periodically disseminated among the population of non-learning agents. In a domain where multi-agent reinforcement learning (MARL) is the common approach, this approach aims to significantly reduce the computational and energy demands compared to approaches such as MARL and centralised learning models. By developing high performing foraging agents, these approaches can be translated into real-world applications such as logistics, environmental monitoring, and autonomous exploration. A reward function was incorporated into this approach that promotes role development among agents, without explicit directives. This led to the differentiation of behaviours among the agents. The implicit encouragement of role differentiation allows for dynamic actions in which agents can alter roles dependent on their interactions with the environment without the need for explicit communication between agents.

arxiv情報

著者 Ian O’Flynn,Harun Šiljak
発行日 2025-05-01 14:05:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO, cs.SY, eess.SY | Emergence of Roles in Robotic Teams with Model Sharing and Limited Communication はコメントを受け付けていません

KnowEEG: Explainable Knowledge Driven EEG Classification

要約

脳波(EEG)は、疾患の分類から感情の検出、脳コンピューターの界面に至るまで、脳の活動を記録する方法です。
深い学習の最近の進歩により、EEG分類のパフォーマンスが向上しましたが、モデルの説明可能性は依然として問題です。
説明可能性のこの重要な制限に対処するために、Knoweeegを紹介します。
EEG分類のための新しい説明可能な機械学習アプローチ。
Knoweegは、電極ごとの特徴の包括的なセットを抽出し、統計テストを使用してそれらをフィルタリングし、電極間接続統計を統合します。
これらの機能は、森林の木を栽培する際に電極接続性の特徴との間の電極統計のバランスをとる、修正されたランダムフォレストモデル(Fusion Forest)に入力されます。
一般化された時系列とEEG固有のドメインの両方から知識を組み込むことにより、Knoweeegは、5つの異なる分類タスクで最先端の深い学習モデルに匹敵する、またはそれを超えるパフォーマンスを達成します。
高性能に加えて、Knoweegは、理解可能な機能の機能の重要性スコアを通じて、固有の説明可能性を提供します。
目を閉じた/オープン分類タスクの例で、この説明可能性を使用してクラスに関する知識を発見できることを示します。
目のオープン/クローズド分類のためのこの発見された知識は、現在の神経科学の文献によって正しいことが証明されています。
したがって、HealthcareなどのEEGの説明可能性が重要であるドメインにとって、Knoweeegの影響は重要です。

要約(オリジナル)

Electroencephalography (EEG) is a method of recording brain activity that shows significant promise in applications ranging from disease classification to emotion detection and brain-computer interfaces. Recent advances in deep learning have improved EEG classification performance yet model explainability remains an issue. To address this key limitation of explainability we introduce KnowEEG; a novel explainable machine learning approach for EEG classification. KnowEEG extracts a comprehensive set of per-electrode features, filters them using statistical tests, and integrates between-electrode connectivity statistics. These features are then input to our modified Random Forest model (Fusion Forest) that balances per electrode statistics with between electrode connectivity features in growing the trees of the forest. By incorporating knowledge from both the generalized time-series and EEG-specific domains, KnowEEG achieves performance comparable to or exceeding state-of-the-art deep learning models across five different classification tasks: emotion detection, mental workload classification, eyes open/closed detection, abnormal EEG classification, and event detection. In addition to high performance, KnowEEG provides inherent explainability through feature importance scores for understandable features. We demonstrate by example on the eyes closed/open classification task that this explainability can be used to discover knowledge about the classes. This discovered knowledge for eyes open/closed classification was proven to be correct by current neuroscience literature. Therefore, the impact of KnowEEG will be significant for domains where EEG explainability is critical such as healthcare.

arxiv情報

著者 Amarpal Sahota,Navid Mohammadi Foumani,Raul Santos-Rodriguez,Zahraa S. Abdallah
発行日 2025-05-01 14:05:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | KnowEEG: Explainable Knowledge Driven EEG Classification はコメントを受け付けていません

Directly Forecasting Belief for Reinforcement Learning with Delays

要約

感覚の知覚が実際のイベントの背後に遅れているため、遅延を伴う強化学習(RL)は、過去の観察に基づいて環境の実際の状態を推定する必要があります。
通常、最先端の(SOTA)メソッドは、状態の再帰的で段階的な予測を採用しています。
これにより、調合エラーが蓄積される可能性があります。
この問題に取り組むために、信念変圧器(DFBT)を直接予測する我々の新しい信念推定方法は、中間状態を段階的に推定することなく、状態を観測から直接予測します。
DFBTが既存の再帰的予測方法の複合エラーを大幅に減らし、パフォーマンス保証が強化されることを理論的に実証します。
D4RLオフラインデータセットを使用した実験では、DFBTは顕著な予測精度で複合エラーを減らします。
DFBTの状態シーケンスを予測する能力は、マルチステップブートストラップも容易にし、学習効率を大幅に改善します。
Mujoco Benchmarkでは、DFBTベースの方法がSotaベースラインを大幅に上回っています。

要約(オリジナル)

Reinforcement learning (RL) with delays is challenging as sensory perceptions lag behind the actual events: the RL agent needs to estimate the real state of its environment based on past observations. State-of-the-art (SOTA) methods typically employ recursive, step-by-step forecasting of states. This can cause the accumulation of compounding errors. To tackle this problem, our novel belief estimation method, named Directly Forecasting Belief Transformer (DFBT), directly forecasts states from observations without incrementally estimating intermediate states step-by-step. We theoretically demonstrate that DFBT greatly reduces compounding errors of existing recursively forecasting methods, yielding stronger performance guarantees. In experiments with D4RL offline datasets, DFBT reduces compounding errors with remarkable prediction accuracy. DFBT’s capability to forecast state sequences also facilitates multi-step bootstrapping, thus greatly improving learning efficiency. On the MuJoCo benchmark, our DFBT-based method substantially outperforms SOTA baselines.

arxiv情報

著者 Qingyuan Wu,Yuhui Wang,Simon Sinong Zhan,Yixuan Wang,Chung-Wei Lin,Chen Lv,Qi Zhu,Jürgen Schmidhuber,Chao Huang
発行日 2025-05-01 14:20:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Directly Forecasting Belief for Reinforcement Learning with Delays はコメントを受け付けていません

Graph Spectral Filtering with Chebyshev Interpolation for Recommendation

要約

グラフの畳み込みネットワークは最近、推奨事項の共同フィルタリング(CF)で顕著になりました。
ただし、2つの基礎コンポーネントで潜在的なボトルネックを特定します。
第一に、埋め込み層は、局所的に観察されているが潜在的に価値のある好みのパターンを見下ろす容量が限られている潜在スペースにつながります。
また、広く使用されている近隣の集約は、細粒の方法で多様な選好パターンを活用する能力が限られています。
スペクトルグラフ理論に基づいて、これらの制限は、周波数スペクトルのカットオフと制限された線形形態を備えたグラフフィルタリングに起因することを明らかにします。
これらの問題に対処するために、グラフスペクトルフィルタリングに基づいたCFフレームワークであるChebyCFを紹介します。
学習した埋め込みの代わりに、ユーザーの生の相互作用履歴が必要です。
また、Chebyshev補間を採用して、柔軟な非線形グラフフィルターを効果的に近似し、追加の理想的なパスフィルターと度ベースの正規化を使用してさらに強化します。
大規模な実験を通じて、ChebyCFが前述のボトルネックを克服し、複数のベンチマークで最先端のパフォーマンスを達成し、適度に速い推論を達成することを確認します。
私たちのコードは、https://github.com/chanwoo0806/chebycfで入手できます。

要約(オリジナル)

Graph convolutional networks have recently gained prominence in collaborative filtering (CF) for recommendations. However, we identify potential bottlenecks in two foundational components. First, the embedding layer leads to a latent space with limited capacity, overlooking locally observed but potentially valuable preference patterns. Also, the widely-used neighborhood aggregation is limited in its ability to leverage diverse preference patterns in a fine-grained manner. Building on spectral graph theory, we reveal that these limitations stem from graph filtering with a cut-off in the frequency spectrum and a restricted linear form. To address these issues, we introduce ChebyCF, a CF framework based on graph spectral filtering. Instead of a learned embedding, it takes a user’s raw interaction history to utilize the full spectrum of signals contained in it. Also, it adopts Chebyshev interpolation to effectively approximate a flexible non-linear graph filter, and further enhances it by using an additional ideal pass filter and degree-based normalization. Through extensive experiments, we verify that ChebyCF overcomes the aforementioned bottlenecks and achieves state-of-the-art performance across multiple benchmarks and reasonably fast inference. Our code is available at https://github.com/chanwoo0806/ChebyCF.

arxiv情報

著者 Chanwoo Kim,Jinkyu Sung,Yebonn Han,Joonseok Lee
発行日 2025-05-01 14:28:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG | Graph Spectral Filtering with Chebyshev Interpolation for Recommendation はコメントを受け付けていません

Hypothesis-free discovery from epidemiological data by automatic detection and local inference for tree-based nonlinearities and interactions

要約

疫学的環境では、機械学習(ML)は、仮説のないリスク(または保護)要因の発見の人気を獲得しています。
MLは非線形性と相互作用を発見するのに強いものの、この力は現在、信頼できる推論の欠如によって損なわれています。
特徴効果の局所的な測定値は木のアンサンブルと組み合わせることができますが、これらの測定の不確実性の定量化は部分的にのみ入手可能であり、しばしば不十分です。
RuleShapを提案します。これは、個々のレベルで複雑なパターンを検出およびテストする1段階の手順で、まばらなベイジアン回帰、ツリーアンサンブル、およびシャプリーの値を組み合わせたルールベースの仮説のない発見を使用するためのフレームワークを提案します。
計算を容易にするために、設定によりわずかなShapley値をより効率的に計算する式を導き出します。
シミュレートされたデータに関するフレームワークの妥当性を示します。
説明するために、疫学コホートのデータに機械を適用して、年齢、性別、民族、BMI、グルコースレベルなどの特徴間の非線形相互作用効果など、高コレステロールと血圧のいくつかの効果を検出および推測します。

要約(オリジナル)

In epidemiological settings, Machine Learning (ML) is gaining popularity for hypothesis-free discovery of risk (or protective) factors. Although ML is strong at discovering non-linearities and interactions, this power is currently compromised by a lack of reliable inference. Although local measures of feature effect can be combined with tree ensembles, uncertainty quantifications for these measures remain only partially available and oftentimes unsatisfactory. We propose RuleSHAP, a framework for using rule-based, hypothesis-free discovery that combines sparse Bayesian regression, tree ensembles and Shapley values in a one-step procedure that both detects and tests complex patterns at the individual level. To ease computation, we derive a formula that computes marginal Shapley values more efficiently for our setting. We demonstrate the validity of our framework on simulated data. To illustrate, we apply our machinery to data from an epidemiological cohort to detect and infer several effects for high cholesterol and blood pressure, such as nonlinear interaction effects between features like age, sex, ethnicity, BMI and glucose level.

arxiv情報

著者 Giorgio Spadaccini,Marjolein Fokkema,Mark A. van de Wiel
発行日 2025-05-01 14:55:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Hypothesis-free discovery from epidemiological data by automatic detection and local inference for tree-based nonlinearities and interactions はコメントを受け付けていません

Transition States Energies from Machine Learning: An Application to Reverse Water-Gas Shift on Single-Atom Alloys

要約

正確な遷移状態(TS)エネルギーの取得は、TS検索方法のコストが高く、密度汎関数理論(DFT)などの第一原理法のために、複雑な材料と反応ネットワークの計算スクリーニングにおけるボトルネックです。
ここでは、Wasserstein Weisfeiler-Lehman Graph Kernel(WWL-GPR)を使用したガウスプロセス回帰に基づいてTSエネルギーを予測するための機械学習(ML)モデルを提案します。
モデルを適用して、単一原子合金(SAA)触媒での逆水ガスシフト(RWGS)反応に対する吸着とTSエネルギーを予測するために、グラフ表現なしのスケーリング関係またはMLモデルに基づく従来のアプローチと比較して精度を大幅に改善できることを示します。
モデルトレーニングの低コストからさらに利益を得て、WWL-GPRモデルのアンサンブルをトレーニングして、トレーニングデータのサブサンプリングを通じて不確実性を取得し、これらの不確実性がマイクロキネティックモデルのアンサンブルの構築を通じて転換頻度(TOF)予測を伝達する方法を示します。
モデルベースのDFTベースのTOF予測のエラーを比較すると、WWL-GPRモデルがスケーリング関係と比較してほぼ数桁エラーを減らすことを示します。
これは、触媒活性推定に対する正確なエネルギー予測の重要な影響を示しています。
最後に、モデルを適用して新しい材料をスクリーニングし、RWGの有望な触媒を特定します。
この作業は、RWGSなどの複雑な反応のためのスクリーニング触媒のためのDFTおよびマイクロキネティックモデリングと高度なML技術を組み合わせる力を強調し、将来の触媒設計のための堅牢なフレームワークを提供します。

要約(オリジナル)

Obtaining accurate transition state (TS) energies is a bottleneck in computational screening of complex materials and reaction networks due to the high cost of TS search methods and first-principles methods such as density functional theory (DFT). Here we propose a machine learning (ML) model for predicting TS energies based on Gaussian process regression with the Wasserstein Weisfeiler-Lehman graph kernel (WWL-GPR). Applying the model to predict adsorption and TS energies for the reverse water-gas shift (RWGS) reaction on single-atom alloy (SAA) catalysts, we show that it can significantly improve the accuracy compared to traditional approaches based on scaling relations or ML models without a graph representation. Further benefitting from the low cost of model training, we train an ensemble of WWL-GPR models to obtain uncertainties through subsampling of the training data and show how these uncertainties propagate to turnover frequency (TOF) predictions through the construction of an ensemble of microkinetic models. Comparing the errors in model-based vs DFT-based TOF predictions, we show that the WWL-GPR model reduces errors by almost an order of magnitude compared to scaling relations. This demonstrates the critical impact of accurate energy predictions on catalytic activity estimation. Finally, we apply our model to screen new materials, identifying promising catalysts for RWGS. This work highlights the power of combining advanced ML techniques with DFT and microkinetic modeling for screening catalysts for complex reactions like RWGS, providing a robust framework for future catalyst design.

arxiv情報

著者 Raffaele Cheula,Mie Andersen
発行日 2025-05-01 15:01:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.LG | Transition States Energies from Machine Learning: An Application to Reverse Water-Gas Shift on Single-Atom Alloys はコメントを受け付けていません