Conditioning Diffusions Using Malliavin Calculus

要約

確率的最適制御や条件付き生成モデリングでは、中心的な計算タスクは、与えられた終端時間報酬を最大化するように参照拡散過程を修正することである。既存の手法の多くは、この報酬が微分可能であることを必要とし、勾配を用いて拡散を好ましい結果に導く。しかし、拡散ブリッジのような多くの実用的な設定では、報酬は特異であり、ターゲットにヒットすれば無限大の値をとり、そうでなければゼロとなる。我々は、このような特異な報酬に頑健な手法の開発を可能にする、マリアヴィン微積分と部分積分による経路空間積分に基づく新しいフレームワークを紹介する。これにより、本アプローチは、人工的な観測ノイズを必要とせずに、分類、拡散ブリッジ、コンディショニングなどの幅広い応用を扱うことができる。我々は、本アプローチが安定で信頼性の高い学習を提供し、既存の手法を凌駕することを実証する。

要約(オリジナル)

In stochastic optimal control and conditional generative modelling, a central computational task is to modify a reference diffusion process to maximise a given terminal-time reward. Most existing methods require this reward to be differentiable, using gradients to steer the diffusion towards favourable outcomes. However, in many practical settings, like diffusion bridges, the reward is singular, taking an infinite value if the target is hit and zero otherwise. We introduce a novel framework, based on Malliavin calculus and path-space integration by parts, that enables the development of methods robust to such singular rewards. This allows our approach to handle a broad range of applications, including classification, diffusion bridges, and conditioning without the need for artificial observational noise. We demonstrate that our approach offers stable and reliable training, outperforming existing techniques.

arxiv情報

著者 Jakiw Pidstrigach,Elizabeth Baker,Carles Domingo-Enrich,George Deligiannidis,Nikolas Nüsken
発行日 2025-04-04 14:10:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, G.3, math.PR, stat.ML | Conditioning Diffusions Using Malliavin Calculus はコメントを受け付けていません

Generating ensembles of spatially-coherent in-situ forecasts using flow matching

要約

我々は、空間的にコヒーレントかつ多変量である、現場気象予報の後処理のための機械学習ベースの手法を提案する。これまでの研究と比較して、我々のFlow MAtching Postprocessing (FMAP)は観測分布の相関構造をより良く表現し、同時に観測所での限界性能を改善する。FMAPは、基礎となるグリッド予測によってすでにモデル化されているものに縛られない予測を生成し、データから新しい相関構造を推論することができる。その結果、モデルは限られた数の数値シミュレーションから任意の数の予測を生成することができ、低コストの予測システムを可能にする。生成時に複数の学習済みネットワークを使用する他の手法とは対照的に、1回の学習で複数のリードタイムで後処理を実行するのに十分である。本研究では、フローマッチング生成モデリングの枠組みの中で訓練された空間的注意変換器バックボーンを含む、我々の方法論を詳述する。FMAPは、EUPPBenchデータセットを用いた実験において、西ヨーロッパの観測地点における地表面温度と突風値を5日間のリードタイムで予測し、有望な性能を示した。

要約(オリジナル)

We propose a machine-learning-based methodology for in-situ weather forecast postprocessing that is both spatially coherent and multivariate. Compared to previous work, our Flow MAtching Postprocessing (FMAP) better represents the correlation structures of the observations distribution, while also improving marginal performance at the stations. FMAP generates forecasts that are not bound to what is already modeled by the underlying gridded prediction and can infer new correlation structures from data. The resulting model can generate an arbitrary number of forecasts from a limited number of numerical simulations, allowing for low-cost forecasting systems. A single training is sufficient to perform postprocessing at multiple lead times, in contrast with other methods which use multiple trained networks at generation time. This work details our methodology, including a spatial attention transformer backbone trained within a flow matching generative modeling framework. FMAP shows promising performance in experiments on the EUPPBench dataset, forecasting surface temperature and wind gust values at station locations in western Europe up to five-day lead times.

arxiv情報

著者 David Landry,Claire Monteleoni,Anastase Charantonis
発行日 2025-04-04 14:12:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, physics.ao-ph | Generating ensembles of spatially-coherent in-situ forecasts using flow matching はコメントを受け付けていません

Trust Me, I Know the Way: Predictive Uncertainty in the Presence of Shortcut Learning

要約

ニューラルネットワークにおける予測不確実性を定量化する正しい方法は、依然として活発な議論のトピックである。特に、無知と不一致の視点を対立させる議論に照らし合わせると、最先端のエントロピー分解が、モデル、あるいは認識論的不確実性(EU)の意味のある表現につながるかどうかは不明である。我々は、どちらも有効であるが、異なる学習状況から生じるものであると主張することで、相反する視点を調和させることを目指している。特に、EUが不一致として現れるためには、ショートカットの存在が決定的であることを示す。

要約(オリジナル)

The correct way to quantify predictive uncertainty in neural networks remains a topic of active discussion. In particular, it is unclear whether the state-of-the art entropy decomposition leads to a meaningful representation of model, or epistemic, uncertainty (EU) in the light of a debate that pits ignorance against disagreement perspectives. We aim to reconcile the conflicting viewpoints by arguing that both are valid but arise from different learning situations. Notably, we show that the presence of shortcuts is decisive for EU manifesting as disagreement.

arxiv情報

著者 Lisa Wimmer,Bernd Bischl,Ludwig Bothmann
発行日 2025-04-04 14:22:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG | Trust Me, I Know the Way: Predictive Uncertainty in the Presence of Shortcut Learning はコメントを受け付けていません

Asymptotically efficient adaptive identification under saturated output observation

要約

飽和出力観測は実用上どこにでもあるため、このような非線形観測を持つ確率システムの同定は様々な分野にわたる基本的な問題である。本論文では、飽和出力観測を持つ確率力学系の漸近的に効率的な同定問題を研究する。既存の多くの結果とは対照的に、本論文の結果は、システム信号の周期的仮定や独立仮定といった、一般的に用いられるが厳しい条件を必要としないため、確率フィードバックシステムへの応用を排除しない。具体的には、部分的に観測されたサンプルの負の対数尤度に対して、2段階の設計手法を用いた新しい適応的ニュートン型アルゴリズムを導入する。いくつかの一般的な励起データ条件の下で、確率的リアプノフ関数法とマルチンゲールの極限理論を用いることにより、パラメータ推定値が強く矛盾のない漸近正規性を持つことを示す。さらに、推定値の平均二乗誤差が、i.i.dデータ仮定に頼ることなく、漸近的にCramer-Rao境界を達成できることを示す。このことは、提案アルゴリズムの性能が一般に期待される最高のものであることを示している。文献にある既存の関連アルゴリズムに対する我々の新しい適応的アルゴリズムの優位性を説明するために、数値例を提供する。

要約(オリジナル)

As saturated output observations are ubiquitous in practice, identifying stochastic systems with such nonlinear observations is a fundamental problem across various fields. This paper investigates the asymptotically efficient identification problem for stochastic dynamical systems with saturated output observations. In contrast to most of the existing results, our results do not need the commonly used but stringent conditions such as periodic or independent assumptions on the system signals, and thus do not exclude applications to stochastic feedback systems. To be specific, we introduce a new adaptive Newton-type algorithm on the negative log-likelihood of the partially observed samples using a two-step design technique. Under some general excitation data conditions, we show that the parameter estimate is strongly consistent and asymptotically normal by employing the stochastic Lyapunov function method and limit theories for martingales. Furthermore, we show that the mean square error of the estimates can achieve the Cramer-Rao bound asymptotically without resorting to i.i.d data assumptions. This indicates that the performance of the proposed algorithm is the best possible that one can expect in general. A numerical example is provided to illustrate the superiority of our new adaptive algorithm over the existing related ones in the literature.

arxiv情報

著者 Lantian Zhang,Lei Guo
発行日 2025-04-04 14:29:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.SY, eess.SY | Asymptotically efficient adaptive identification under saturated output observation はコメントを受け付けていません

Online Traffic Density Estimation using Physics-Informed Neural Networks

要約

物理情報ニューラルネットワークの交通密度推定への応用に関する最近の研究は、モデル誤差やノイズの多いデータに対するロバスト性から、今後の発展が期待できることを示している。本論文では、プローブ車両からの計測値を用いて交通密度をオンラインで近似する手法を、グリーンシールドモデルを用いた場合と、高忠実度の交通シミュレーションを考慮した場合の2つの設定で紹介する。提案手法は、空間におけるリアルタイムの交通密度を連続的に推定し、新しい計測値の集合ごとにモデル同定を行う。密度推定は勾配降下と適応重みを用いてほぼリアルタイムに更新される。完全なモデル知識の場合、結果として得られるアルゴリズムは古典的なオープンループのものと同様の性能を持つ。しかし、モデル不一致の場合、反復解は閉ループオブザーバとして振る舞い、ベースライン法を上回る。同様に、高忠実度設定においても、提案アルゴリズムはトラフィック特性を正しく再現する。

要約(オリジナル)

Recent works on the application of Physics-Informed Neural Networks to traffic density estimation have shown to be promising for future developments due to their robustness to model errors and noisy data. In this paper, we introduce a methodology for online approximation of the traffic density using measurements from probe vehicles in two settings: one using the Greenshield model and the other considering a high-fidelity traffic simulation. The proposed method continuously estimates the real-time traffic density in space and performs model identification with each new set of measurements. The density estimate is updated in almost real-time using gradient descent and adaptive weights. In the case of full model knowledge, the resulting algorithm has similar performance to the classical open-loop one. However, in the case of model mismatch, the iterative solution behaves as a closed-loop observer and outperforms the baseline method. Similarly, in the high-fidelity setting, the proposed algorithm correctly reproduces the traffic characteristics.

arxiv情報

著者 Dennis Wilkman,Kateryna Morozovska,Karl Henrik Johansson,Matthieu Barreau
発行日 2025-04-04 14:41:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, math.OC | Online Traffic Density Estimation using Physics-Informed Neural Networks はコメントを受け付けていません

Discovering Partially Known Ordinary Differential Equations: a Case Study on the Chemical Kinetics of Cellulose Degradation

要約

重合度(DP)は、電力部品のセルロース断熱材など、ポリマーをベースとした断熱システムの経年劣化を推定する方法のひとつである。ポリマーの主な劣化メカニズムは、加水分解、熱分解、酸化である。これらのメカニズムが組み合わさるとDPが低下する。しかし、この種の問題に対するデータの入手可能性は、通常乏しい。本研究では、電力変圧器から得られたセルロースの劣化データを用いて絶縁体の経年劣化を分析した。電力変圧器内の鉱油に浸漬されたセルロースの経年劣化問題を常微分方程式(ODE)でモデル化した。物理情報ニューラルネットワーク(PINN)とシンボリック回帰を用いて劣化システムの支配方程式を復元する。PINNを適用して、合成データと実際のDP値について、セルロース汚染含有量と温度に関連する材料老化プロセスを記述するEkenstam ODEにおけるアレニウス方程式の未知パラメータを発見する。Ekenstam ODEの修正は、EmsleyのODE系によって与えられ、新しい定式化によってアレニウス方程式で表される速度定数は時間的に減少する。PINNと記号的回帰を用いて、この系のODEの1つの関数形を復元し、未知のパラメータを同定する。

要約(オリジナル)

The degree of polymerization (DP) is one of the methods for estimating the aging of the polymer based insulation systems, such as cellulose insulation in power components. The main degradation mechanisms in polymers are hydrolysis, pyrolysis, and oxidation. These mechanisms combined cause a reduction of the DP. However, the data availability for these types of problems is usually scarce. This study analyzes insulation aging using cellulose degradation data from power transformers. The aging problem for the cellulose immersed in mineral oil inside power transformers is modeled with ordinary differential equations (ODEs). We recover the governing equations of the degradation system using Physics-Informed Neural Networks (PINNs) and symbolic regression. We apply PINNs to discover the Arrhenius equation’s unknown parameters in the Ekenstam ODE describing cellulose contamination content and the material aging process related to temperature for synthetic data and real DP values. A modification of the Ekenstam ODE is given by Emsley’s system of ODEs, where the rate constant expressed by the Arrhenius equation decreases in time with the new formulation. We use PINNs and symbolic regression to recover the functional form of one of the ODEs of the system and to identify an unknown parameter.

arxiv情報

著者 Federica Bragone,Kateryna Morozovska,Tor Laneryd,Khemraj Shukla,Stefano Markidis
発行日 2025-04-04 14:41:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG | Discovering Partially Known Ordinary Differential Equations: a Case Study on the Chemical Kinetics of Cellulose Degradation はコメントを受け付けていません

Gaussian Process Tilted Nonparametric Density Estimation using Fisher Divergence Score Matching

要約

本論文では、低次元密度推定問題に対するガウス過程(GP)ベースのスコアモデルを学習するための3つのフィッシャー発散(FD)最小化アルゴリズムを紹介する。密度は基本多変量正規分布に指数化GP精密化を乗じることで形成されるため、GP傾斜ノンパラメトリック密度と呼ぶ。ランダムフーリエ特徴(RFF)近似を用いてスコアのGP部分を線形関数として表現することにより、全ての学習問題が閉じた形で解けることを示す。これには、フィッシャーダイバージェンスの基本バージョンとノイズ条件付きバージョン、そして変分推論(VI)に基づくノイズ条件付きFDモデルの新しい代替が含まれる。ここでは、フィッシャー変分予測分布を導出する近似事後分布のELBO的最適化を提案する。GPのRFF表現は、コサイン活性化を持つ単層ニューラルネットワークスコアモデルと機能的に等価であり、全ての期待値が閉じた形になるユニークな線形形式を提供する。ガウス基底はVI近似の扱いやすさにも役立つ。我々の3つの学習アルゴリズムと、MAPベースラインアルゴリズムを、いくつかの低次元密度推定問題で実証する。学習問題の閉形式の性質は、反復アルゴリズムへの依存を取り除き、この手法を特に大規模データセットに適したものとする。

要約(オリジナル)

We present three Fisher divergence (FD) minimization algorithms for learning Gaussian process (GP) based score models for lower dimensional density estimation problems. The density is formed by multiplying a base multivariate normal distribution with an exponentiated GP refinement, and so we refer to it as a GP-tilted nonparametric density. By representing the GP part of the score as a linear function using the random Fourier feature (RFF) approximation, we show that all learning problems can be solved in closed form. This includes the basic and noise conditional versions of the Fisher divergence, as well as a novel alternative to noise conditional FD models based on variational inference (VI). Here, we propose using an ELBO-like optimization of the approximate posterior with which we derive a Fisher variational predictive distribution. The RFF representation of the GP, which is functionally equivalent to a single layer neural network score model with cosine activation, provides a unique linear form for which all expectations are in closed form. The Gaussian base also helps with tractability of the VI approximation. We demonstrate our three learning algorithms, as well as a MAP baseline algorithm, on several low dimensional density estimation problems. The closed-form nature of the learning problem removes the reliance on iterative algorithms, making this technique particularly well-suited to large data sets.

arxiv情報

著者 John Paisley,Wei Zhang,Brian Barr
発行日 2025-04-04 14:41:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG | Gaussian Process Tilted Nonparametric Density Estimation using Fisher Divergence Score Matching はコメントを受け付けていません

Diffusion Active Learning: Towards Data-Driven Experimental Design in Computed Tomography

要約

拡散能動学習(Diffusion Active Learning)とは、生成的拡散モデリングとデータ駆動型逐次実験デザインを組み合わせて、逆問題のデータを適応的に取得する新しいアプローチである。広く適用可能であるが、構造化された事前データセットが利用可能であり、データ要件の削減が測定時間の短縮とX線被曝線量の低減に直結する、実験的検証のための科学的コンピュータ断層撮影(CT)に焦点を当てる。まず、領域固有のCT再構成に対して無条件拡散モデルを事前学習する。この拡散モデルは、データに依存し、基礎となるデータ分布の構造を捉える学習済み事前学習として機能し、その後2つの方法で使用される:拡散モデルは能動学習プロセスを駆動し、再構成の質を向上させる。能動学習ループの間、我々は拡散事後サンプリングの変形を採用し、事後分布から条件付きデータサンプルを生成し、現在の測定値との整合性を確保する。これらのサンプルを用いて、現在の推定値の不確実性を定量化し、最も情報量の多い次の測定値を選択する。その結果、データ収集の必要量が大幅に削減され、X線照射量の低減に対応すると同時に、実世界の複数の断層撮影データセットにおいて画像再構成の品質が向上することが示された。

要約(オリジナル)

We introduce Diffusion Active Learning, a novel approach that combines generative diffusion modeling with data-driven sequential experimental design to adaptively acquire data for inverse problems. Although broadly applicable, we focus on scientific computed tomography (CT) for experimental validation, where structured prior datasets are available, and reducing data requirements directly translates to shorter measurement times and lower X-ray doses. We first pre-train an unconditional diffusion model on domain-specific CT reconstructions. The diffusion model acts as a learned prior that is data-dependent and captures the structure of the underlying data distribution, which is then used in two ways: It drives the active learning process and also improves the quality of the reconstructions. During the active learning loop, we employ a variant of diffusion posterior sampling to generate conditional data samples from the posterior distribution, ensuring consistency with the current measurements. Using these samples, we quantify the uncertainty in the current estimate to select the most informative next measurement. Our results show substantial reductions in data acquisition requirements, corresponding to lower X-ray doses, while simultaneously improving image reconstruction quality across multiple real-world tomography datasets.

arxiv情報

著者 Luis Barba,Johannes Kirschner,Tomas Aidukas,Manuel Guizar-Sicairos,Benjamín Béjar
発行日 2025-04-04 14:46:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG | Diffusion Active Learning: Towards Data-Driven Experimental Design in Computed Tomography はコメントを受け付けていません

Optimistic Learning for Communication Networks

要約

AI/MLベースのツールは、通信ネットワークのリソース管理ソリューションの最前線にある。特にディープラーニングは、オフラインで正確なモデルを構築するための代表的な学習データが利用可能な場合、高速で高性能な意思決定を促進する上で非常に効果的である。逆に、オンライン学習ソリューションは、トレーニングを必要とせず、実行時の観測に基づく適応的な意思決定を可能にするが、残念なことに、しばしば過度に保守的である。この広範なチュートリアルでは、最新の通信システムにおけるリソース管理フレームワークのための意思決定エンジンとして、楽観的学習(OpL)の使用を提案する。適切に設計された場合、このようなソリューションは、それぞれのオンライン学習アプローチのロバスト性と性能保証を維持しながら、オフラインで訓練されたモデルに匹敵する、高速で高性能な決定を達成することができる。OpLの基本的な概念、アルゴリズム、結果を紹介し、この理論のルーツについて議論し、楽観主義を定義し達成するための様々なアプローチを紹介する。さらに、分散型O-RANプラットフォームにおけるキャッシング、エッジコンピューティング、ネットワークスライシング、ワークロード割り当てなど、いくつかの重要な問題に対して、OpLが通信ネットワークにおけるリソース管理をどのように強化できるかを紹介する。最後に、この新しいリソース管理手法の可能性を最大限に引き出すために取り組むべき未解決の課題について議論します。

要約(オリジナル)

AI/ML-based tools are at the forefront of resource management solutions for communication networks. Deep learning, in particular, is highly effective in facilitating fast and high-performing decision-making whenever representative training data is available to build offline accurate models. Conversely, online learning solutions do not require training and enable adaptive decisions based on runtime observations, alas are often overly conservative. This extensive tutorial proposes the use of optimistic learning (OpL) as a decision engine for resource management frameworks in modern communication systems. When properly designed, such solutions can achieve fast and high-performing decisions — comparable to offline-trained models — while preserving the robustness and performance guarantees of the respective online learning approaches. We introduce the fundamental concepts, algorithms and results of OpL, discuss the roots of this theory and present different approaches to defining and achieving optimism. We proceed to showcase how OpL can enhance resource management in communication networks for several key problems such as caching, edge computing, network slicing, and workload assignment in decentralized O-RAN platforms. Finally, we discuss the open challenges that must be addressed to unlock the full potential of this new resource management approach.

arxiv情報

著者 George Iosifidis,Naram Mhaisen,Douglas J. Leith
発行日 2025-04-04 14:55:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.NI | Optimistic Learning for Communication Networks はコメントを受け付けていません

Learning Dual-Arm Coordination for Grasping Large Flat Objects

要約

本やキーボードのような大きな平らな物体を水平に把持することは、シングルアームのロボットシステムにとって大きな課題であり、把持を容易にするために物体を壁に押し当てたり、表面の端に移動させたりといった余分な動作が必要になることが多い。対照的に、人間の器用さにヒントを得た双腕操作は、複雑な再配置を必要とせずに、物体を持ち上げて把持するために両腕を直接協調させることで、より洗練された解決策を提供する。本論文では、大きな平面物体を把持するための双腕協調を可能にする、モデルフリーの深層強化学習(DRL)フレームワークを提案する。大規模な把持ポーズ検出モデルをバックボーンとして利用し、入力画像から高次元特徴を抽出し、それを強化学習(RL)モデルの状態表現として利用する。両腕の協調的な把持動作を学習するために、アクター・クリティック層を共有するCNNベースの近接政策最適化(PPO)アルゴリズムを採用する。本システムはIsaac Gymで学習・テストされ、実際のロボットに展開される。実験結果は、我々の方針が、追加の操作を必要とすることなく、大きな平面物体を効果的に把持できることを示している。さらに、本方針は強力な汎化能力を示し、未知の物体の把持に成功した。重要なことは、微調整なしに実際のロボットに直接移植することができ、ベースライン手法を常に凌駕することである。

要約(オリジナル)

Grasping large flat objects, such as books or keyboards lying horizontally, presents significant challenges for single-arm robotic systems, often requiring extra actions like pushing objects against walls or moving them to the edge of a surface to facilitate grasping. In contrast, dual-arm manipulation, inspired by human dexterity, offers a more refined solution by directly coordinating both arms to lift and grasp the object without the need for complex repositioning. In this paper, we propose a model-free deep reinforcement learning (DRL) framework to enable dual-arm coordination for grasping large flat objects. We utilize a large-scale grasp pose detection model as a backbone to extract high-dimensional features from input images, which are then used as the state representation in a reinforcement learning (RL) model. A CNN-based Proximal Policy Optimization (PPO) algorithm with shared Actor-Critic layers is employed to learn coordinated dual-arm grasp actions. The system is trained and tested in Isaac Gym and deployed to real robots. Experimental results demonstrate that our policy can effectively grasp large flat objects without requiring additional maneuvers. Furthermore, the policy exhibits strong generalization capabilities, successfully handling unseen objects. Importantly, it can be directly transferred to real robots without fine-tuning, consistently outperforming baseline methods.

arxiv情報

著者 Yongliang Wang,Hamidreza Kasaei
発行日 2025-04-04 14:55:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO | Learning Dual-Arm Coordination for Grasping Large Flat Objects はコメントを受け付けていません