Towards Effectively Leveraging Execution Traces for Program Repair with Code LLMs

要約

大規模な言語モデル(LLMS)は、自動プログラム修理(APR)を含むさまざまなプログラミングタスクで有望なパフォーマンスを示しています。
ただし、LLMベースのAPRに対するほとんどのアプローチは、ランタイムの動作を無視しながら、プログラムの静的分析に限定されています。
この作業では、知識が熟成したNLPに触発されて、プログラム実行トレースで標準のAPRプロンプトを強化することにより、この潜在的な死角を改善することを目指しています。
3つの一般的なAPRデータセットでモデルのGPTファミリーを使用してアプローチを評価します。
私たちの調査結果は、単に実行トレースをプロンプトに組み込むことで、テストされた6つのデータセット /モデル構成のうち2つだけで、トレースフリーのベースラインよりもパフォーマンスの改善が限られていることを示唆しています。
さらに、APRの実行トレースの有効性は、それらの複雑さが増加するにつれて減少することがわかります。
プロンプトでトレースを活用するためのいくつかの戦略を探り、LLMが最適化されたプロンプトがトレースフリープロンプトをより一貫して上回るのに役立つことを実証します。
さらに、小規模なデータセットでより小さなLLMを微調整するよりも優れていることがトレースベースのプロンプトを示しています。
そして、実行トレースがLLMの推論能力を補完できるという概念を強化する調査研究を実施します。

要約(オリジナル)

Large Language Models (LLMs) show promising performance on various programming tasks, including Automatic Program Repair (APR). However, most approaches to LLM-based APR are limited to the static analysis of the programs, while disregarding their runtime behavior. Inspired by knowledge-augmented NLP, in this work, we aim to remedy this potential blind spot by augmenting standard APR prompts with program execution traces. We evaluate our approach using the GPT family of models on three popular APR datasets. Our findings suggest that simply incorporating execution traces into the prompt provides a limited performance improvement over trace-free baselines, in only 2 out of 6 tested dataset / model configurations. We further find that the effectiveness of execution traces for APR diminishes as their complexity increases. We explore several strategies for leveraging traces in prompts and demonstrate that LLM-optimized prompts help outperform trace-free prompts more consistently. Additionally, we show trace-based prompting to be superior to finetuning a smaller LLM on a small-scale dataset; and conduct probing studies reinforcing the notion that execution traces can complement the reasoning abilities of the LLMs.

arxiv情報

著者 Mirazul Haque,Petr Babkin,Farima Farmahinifarahani,Manuela Veloso
発行日 2025-05-07 14:12:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Towards Effectively Leveraging Execution Traces for Program Repair with Code LLMs はコメントを受け付けていません

Batched Bayesian optimization by maximizing the probability of including the optimum

要約

バッチ付きベイジアン最適化(BO)は、大規模な化学ライブラリーから最高のパフォーマンス化合物を効率的に識別することにより、分子設計を加速できます。
BOのバッチ設計のための既存の買収戦略は、探査と搾取のバランスをとることを目指しています。
これには、多くの場合、非加法バッチ取得機能を最適化し、近視構造および/または多様性ヒューリスティックを介して近似を必要とします。
この作業では、純粋な搾取であるQPO(最適性のマルチポイント確率)によって動機付けられる離散最適化のための買収戦略を提案します。
QPOは、バッチに真の最適を含む確率を最大化します。これは、個々の取得スコアよりも合計として表現され、それによりバッチ取得関数を最適化するという組み合わせ課題を回避します。
提案された戦略を並行トンプソンのサンプリングと区別し、それがどのように多様性を暗黙的に捉えているかを議論します。
最後に、大規模な化学ライブラリのモデルガイド付き探査に方法を適用し、バッチ付きベイジアン最適化における他の最先端の方法を競争し、補完するという経験的証拠を提供します。

要約(オリジナル)

Batched Bayesian optimization (BO) can accelerate molecular design by efficiently identifying top-performing compounds from a large chemical library. Existing acquisition strategies for batch design in BO aim to balance exploration and exploitation. This often involves optimizing non-additive batch acquisition functions, necessitating approximation via myopic construction and/or diversity heuristics. In this work, we propose an acquisition strategy for discrete optimization that is motivated by pure exploitation, qPO (multipoint Probability of Optimality). qPO maximizes the probability that the batch includes the true optimum, which is expressible as the sum over individual acquisition scores and thereby circumvents the combinatorial challenge of optimizing a batch acquisition function. We differentiate the proposed strategy from parallel Thompson sampling and discuss how it implicitly captures diversity. Finally, we apply our method to the model-guided exploration of large chemical libraries and provide empirical evidence that it is competitive with and complements other state-of-the-art methods in batched Bayesian optimization.

arxiv情報

著者 Jenna Fromer,Runzhong Wang,Mrunali Manjrekar,Austin Tripp,José Miguel Hernández-Lobato,Connor W. Coley
発行日 2025-05-07 14:27:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Batched Bayesian optimization by maximizing the probability of including the optimum はコメントを受け付けていません

Hamiltonian Normalizing Flows as kinetic PDE solvers: application to the 1D Vlasov-Poisson Equations

要約

多くの保守的な物理システムは、ハミルトンの形式主義を使用して説明できます。
注目すべき例は、ウラソフポイソン方程式です。これは、自己矛盾する電位の下での衝突のない粒子を表す位相空間密度関数の時間進化を支配する一連の部分微分方程式です。
これらの方程式は、血漿物理学と宇宙論の両方で中心的な役割を果たします。
関係する可能性の複雑さにより、分析ソリューションはめったに利用できず、細胞粒子などの数値的手法の使用が必要です。
この作業では、ハミルトニアンに基づいた正規化フロー、特に固定能力のある神経ハミルトニアン流量のバリアントに基づいた新しいアプローチを紹介します。
私たちの方法は、ハミルトニアンのダイナミクスから派生した一連の反転された体積圧縮変換のシーケンスを使用して、位相空間の初期ガウス分布を最終分布に変換します。
このモデルは、数値シミュレーションを介して生成された固定時間tで初期および最終状態を含むデータセットでトレーニングされています。
トレーニング後、このモデルは、特定の初期状態からの最終分布の迅速なサンプリングを可能にします。
さらに、解釈可能な物理的可能性を自動的に学習することにより、トレーニング中に見られない中間状態に一般化することができ、システムの進化に関する洞察を時間をかけて提供します。

要約(オリジナル)

Many conservative physical systems can be described using the Hamiltonian formalism. A notable example is the Vlasov-Poisson equations, a set of partial differential equations that govern the time evolution of a phase-space density function representing collisionless particles under a self-consistent potential. These equations play a central role in both plasma physics and cosmology. Due to the complexity of the potential involved, analytical solutions are rarely available, necessitating the use of numerical methods such as Particle-In-Cell. In this work, we introduce a novel approach based on Hamiltonian-informed Normalizing Flows, specifically a variant of Fixed-Kinetic Neural Hamiltonian Flows. Our method transforms an initial Gaussian distribution in phase space into the final distribution using a sequence of invertible, volume-preserving transformations derived from Hamiltonian dynamics. The model is trained on a dataset comprising initial and final states at a fixed time T, generated via numerical simulations. After training, the model enables fast sampling of the final distribution from any given initial state. Moreover, by automatically learning an interpretable physical potential, it can generalize to intermediate states not seen during training, offering insights into the system’s evolution across time.

arxiv情報

著者 Vincent Souveton,Sébastien Terrana
発行日 2025-05-07 14:40:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Hamiltonian Normalizing Flows as kinetic PDE solvers: application to the 1D Vlasov-Poisson Equations はコメントを受け付けていません

Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems

要約

推奨システム(RSS)は、さまざまなプラットフォームで広く使用されているユーザーの関心に基づいてパーソナライズされた推奨サービスを提供します。
ただし、消費行動が不足しているためにまばらな関心を持つ多くのユーザーがいます。これにより、推奨の結果が低下します。
この問題は、大規模なRSSで広く普及しており、特に対処するのが困難です。
この挑戦的な問題を解決するために、ユーザー関心拡張(UIE)と呼ばれる革新的なソリューションを提案します。
UIEは、メモリネットワークで保存および更新される複数の観点から同様のユーザーとアイテムの動的なストリーミングクラスタリングに基づいて生成された強化ベクトルと生成されたパーソナライズされた強化ベクトルを活用することにより、ユーザープロファイルやユーザー履歴の動作シーケンスを含むユーザーの関心を高めます。
UIEは、関心がまばらなユーザーのモデルパフォーマンスを著しく改善するだけでなく、他のユーザーに顕著な利益をもたらします。
エンドツーエンドのソリューションとして、UIEは既存のランキングモデルの上に簡単に実装できます。
さらに、同様の方法を使用して、ロングテールアイテムへのアプローチを拡張します。これにより、優れた改善も得られます。
大規模な産業Rsで大規模なオフラインおよびオンライン実験を実施しています。
結果は、私たちのモデルが他の既存のアプローチを大幅に上回っていることを示しています。
UIEは、2022年5月21日に公開された2022年以来、Tencentでいくつかの大規模なRSSに展開されています。さらに、UIEベースの方法は、候補生成、事前ランク、およびコンテキストDNNステージにも成功裏に適用されています。
複数のチームがUIEに基づいてソリューションを開発し、主にクラスタリングアルゴリズムと注意メカニズムの更新に焦点を当てています。
私たちが知る限り、UIEは多くの企業によって展開されています。
UIEの考え、動的なストリーミングクラスタリングと類似性の向上は、その後の関連する作品に影響を与えました。

要約(オリジナル)

Recommender Systems (RSs) provide personalized recommendation service based on user interest, which are widely used in various platforms. However, there are lots of users with sparse interest due to lacking consumption behaviors, which leads to poor recommendation results for them. This problem is widespread in large-scale RSs and is particularly difficult to address. To solve this challenging problem, we propose an innovative solution called User Interest Enhancement (UIE). UIE enhances user interest including user profile and user history behavior sequences by leveraging the enhancement vectors and personalized enhancement vectors generated based on dynamic streaming clustering of similar users and items from multiple perspectives, which are stored and updated in memory networks. UIE not only remarkably improves model performance for users with sparse interest, but also delivers notable gains for other users. As an end-to-end solution, UIE is easy to implement on top of existing ranking models. Furthermore, we extend our approach to long-tail items using similar methods, which also yields excellent improvements. We conduct extensive offline and online experiments in a large-scale industrial RS. The results demonstrate that our model substantially outperforms other existing approaches, especially for users with sparse interest. UIE has been deployed in several large-scale RSs at Tencent since 2022, which was made public on 21 May 2024. In addition, UIE-based methods have also been successfully applied in candidate generation, pre-ranking, and context-DNN stages. Multiple teams have developed solutions based on UIE, focusing primarily on updating clustering algorithms and attention mechanisms. As far as we know, UIE has been deployed by many companies. The thoughts of UIE, dynamic streaming clustering and similarity enhancement, have inspired subsequent relevant works.

arxiv情報

著者 Peng Liu,Nian Wang,Cong Xu,Ming Zhao,Bin Wang,Yi Ren
発行日 2025-05-07 14:43:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG | Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems はコメントを受け付けていません

A Tutorial on Discriminative Clustering and Mutual Information

要約

データをクラスター化することは、サンプルを特徴的なグループに分離することです。これは、理想的にはまとまりのある特性を持つ必要があります。
今日、多数のクラスタリングアルゴリズムが存在し、それらの違いは本質的に「凝集性特性」と知覚できるものにあります。
したがって、クラスターの性質に関する仮説を設定する必要があります。それらは生成的または差別的である可能性があります。
過去10年間で、神経ネットワークが高次元データを頻繁に識別的に処理することを含む深いクラスタリング方法の印象的な成長を目撃しました。
主に識別仮説に集中します。
この論文では、私たちの目的は、差別的クラスタリング方法の進化と、特に差別的モデルの仮定の性質が時間の経過とともにどのように変化したかについてのアクセス可能な歴史的視点を提供することです:決定境界から不変批評家まで。
相互情報が(深い)差別的クラスタリング方法の進歩の歴史的基盤であることを強調しています。
また、相互情報のいくつかの既知の制限と、差別的なクラスタリング方法がそれらを回避しようとした方法を示します。
次に、クラスターの数の選択に関して、識別クラスタリングが直面する課題について説明します。
最後に、識別クラスタリングのために開発した専用のPythonパッケージであるGemclusを使用して、これらの手法を紹介します。

要約(オリジナル)

To cluster data is to separate samples into distinctive groups that should ideally have some cohesive properties. Today, numerous clustering algorithms exist, and their differences lie essentially in what can be perceived as “cohesive properties”. Therefore, hypotheses on the nature of clusters must be set: they can be either generative or discriminative. As the last decade witnessed the impressive growth of deep clustering methods that involve neural networks to handle high-dimensional data often in a discriminative manner; we concentrate mainly on the discriminative hypotheses. In this paper, our aim is to provide an accessible historical perspective on the evolution of discriminative clustering methods and notably how the nature of assumptions of the discriminative models changed over time: from decision boundaries to invariance critics. We notably highlight how mutual information has been a historical cornerstone of the progress of (deep) discriminative clustering methods. We also show some known limitations of mutual information and how discriminative clustering methods tried to circumvent those. We then discuss the challenges that discriminative clustering faces with respect to the selection of the number of clusters. Finally, we showcase these techniques using the dedicated Python package, GemClus, that we have developed for discriminative clustering.

arxiv情報

著者 Louis Ohl,Pierre-Alexandre Mattei,Frédéric Precioso
発行日 2025-05-07 14:54:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62H30, cs.LG, G.3, stat.ML | A Tutorial on Discriminative Clustering and Mutual Information はコメントを受け付けていません

A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance

要約

正規化された線形プログラミング定式化の最近の進歩と確率的近似の古典理論を組み合わせることにより、補強学習を研究します。
ポリシー検査を維持しながらポリシー外データを活用するアルゴリズムを設計するという課題に動機付けられ、正規化されたマルコフ決定プロセス(MDP)を解決するための新規のプライマルデュアル投影勾配降下アルゴリズムであるPGDA-RLを提案します。
PGD​​A-RLは、エクスペリエンスリプレイベースのグラデーション推定と、基礎となるネストされた最適化問題の2回の分解と統合されます。
アルゴリズムは非同期に動作し、相関データの単一の軌跡を介して環境と相互作用し、基礎となるMDPの職業測定に関連する二重変数に応じてオンラインでポリシーを更新します。
PGD​​A-RLが、正規化されたMDPの最適な値関数とポリシーにほぼ確実に収束することを証明します。
収束分析は、確率的近似理論からのツールに依存しており、既存のプライマルデュアルRLアプローチで必要なものよりも弱い仮定の下で保持され、特にシミュレーターまたは固定行動ポリシーの必要性を削除します。

要約(オリジナル)

We study reinforcement learning by combining recent advances in regularized linear programming formulations with the classical theory of stochastic approximation. Motivated by the challenge of designing algorithms that leverage off-policy data while maintaining on-policy exploration, we propose PGDA-RL, a novel primal-dual Projected Gradient Descent-Ascent algorithm for solving regularized Markov Decision Processes (MDPs). PGDA-RL integrates experience replay-based gradient estimation with a two-timescale decomposition of the underlying nested optimization problem. The algorithm operates asynchronously, interacts with the environment through a single trajectory of correlated data, and updates its policy online in response to the dual variable associated with the occupation measure of the underlying MDP. We prove that PGDA-RL converges almost surely to the optimal value function and policy of the regularized MDP. Our convergence analysis relies on tools from stochastic approximation theory and holds under weaker assumptions than those required by existing primal-dual RL approaches, notably removing the need for a simulator or a fixed behavioral policy.

arxiv情報

著者 Axel Friedrich Wolter,Tobias Sutter
発行日 2025-05-07 15:18:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC | A Two-Timescale Primal-Dual Framework for Reinforcement Learning via Online Dual Variable Guidance はコメントを受け付けていません

Provable Accuracy Bounds for Hybrid Dynamical Optimization and Sampling

要約

アナログダイナミカルアクセラレータ(DXS)は、コンピューターアーキテクチャの研究におけるサブフィールドの成長であり、いくつかの機械学習、最適化、サンプリングタスクにおいて、従来のデジタルメソッドよりも電力効率と遅延の順序の増加を提供します。
ただし、限られた容量の加速器には、一般的な世界の問題を解決するためにハイブリッドアナログ/デジタルアルゴリズムが必要であり、一般的に大規模なローカル検索(LNLS)フレームワークを使用しています。
完全なデジタルアルゴリズムとは異なり、ハイブリッドLNLSには非症状の収束保証はなく、特にクロスデバイストレーニングと推論を制限する原則的なハイパーパラメーター選択スキームはありません。
この作業では、Langevin拡散(BLD)アルゴリズムをブロックするために還元することにより、ハイブリッドLNLSの非症状の収束保証を提供します。
古典的なサンプリング理論からツールを適応させると、理想的なDXSを使用したランダム化および環状ブロック選択戦略の指数関数的なKL-divergence収束を証明します。
有限のデバイスの変動により、ステップ持続時間、ノイズ強度、および関数パラメーターの観点から、2ワセルスタインバイアスの明示的な境界を提供します。
BLDモデルは、確立された理論と新規のコンピューティングプラットフォームの間の重要なリンクを提供し、理論的な結果は、デバイスの変化、アルゴリズムハイパーパラメーター、およびパフォーマンスをリンクする閉形式式を提供します。

要約(オリジナル)

Analog dynamical accelerators (DXs) are a growing sub-field in computer architecture research, offering order-of-magnitude gains in power efficiency and latency over traditional digital methods in several machine learning, optimization, and sampling tasks. However, limited-capacity accelerators require hybrid analog/digital algorithms to solve real-world problems, commonly using large-neighborhood local search (LNLS) frameworks. Unlike fully digital algorithms, hybrid LNLS has no non-asymptotic convergence guarantees and no principled hyperparameter selection schemes, particularly limiting cross-device training and inference. In this work, we provide non-asymptotic convergence guarantees for hybrid LNLS by reducing to block Langevin Diffusion (BLD) algorithms. Adapting tools from classical sampling theory, we prove exponential KL-divergence convergence for randomized and cyclic block selection strategies using ideal DXs. With finite device variation, we provide explicit bounds on the 2-Wasserstein bias in terms of step duration, noise strength, and function parameters. Our BLD model provides a key link between established theory and novel computing platforms, and our theoretical results provide a closed-form expression linking device variation, algorithm hyperparameters, and performance.

arxiv情報

著者 Matthew X. Burns,Qingyuan Hou,Michael C. Huang
発行日 2025-05-07 15:32:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 60J60, cs.DS, cs.LG, F.2.0, math.ST, stat.TH | Provable Accuracy Bounds for Hybrid Dynamical Optimization and Sampling はコメントを受け付けていません

Local Steps Speed Up Local GD for Heterogeneous Distributed Logistic Regression

要約

不均一で分離可能なデータを使用して分布したロジスティック回帰に適用された局所勾配降下の2つのバリアントを分析し、$ k $のローカルステップと十分に大きな$ r $通信ラウンドでレート$ o(1/kr)$で収束を表示します。
対照的に、問題に適用されるローカルGDの既存の収束保証はすべて、少なくとも$ \ omega(1/r)$であり、ローカルアップデートの利点を示すことができません。
改善された保証の鍵は、大規模なステップサイズ$ \ eta \ gg 1/k $を使用する場合のロジスティック回帰目標の進捗を示すことですが、事前の分析は$ \ eta \ leq 1/k $に依存します。

要約(オリジナル)

We analyze two variants of Local Gradient Descent applied to distributed logistic regression with heterogeneous, separable data and show convergence at the rate $O(1/KR)$ for $K$ local steps and sufficiently large $R$ communication rounds. In contrast, all existing convergence guarantees for Local GD applied to any problem are at least $\Omega(1/R)$, meaning they fail to show the benefit of local updates. The key to our improved guarantee is showing progress on the logistic regression objective when using a large stepsize $\eta \gg 1/K$, whereas prior analysis depends on $\eta \leq 1/K$.

arxiv情報

著者 Michael Crawshaw,Blake Woodworth,Mingrui Liu
発行日 2025-05-07 15:34:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Local Steps Speed Up Local GD for Heterogeneous Distributed Logistic Regression はコメントを受け付けていません

Mori-Zwanzig latent space Koopman closure for nonlinear autoencoder

要約

Koopmanオペレーターは、非線形システムのグローバルな線形化を実現するための魅力的なアプローチを提示し、複雑なダイナミクスの理解を簡素化するための貴重な方法となっています。
データ駆動型の方法論は、有限のKoopmanオペレーターに近似することで有望を示していますが、観測可能性の賢明な選択、次元低下、複雑なシステムの動作を正確に予測する能力など、さまざまな課題に取り組んでいます。
この研究では、低次元の空間でKoopmanオペレーターを堅牢に近似するために、Mori-Zwanzig Autoencoder(MZ-AE)と呼ばれる新しいアプローチを提示します。
提案された方法は、非線形自動エンコーダーを活用して、有限不変のKoopman部分空間を近似するための重要な観測可能性を抽出し、Mori-Zwanzig形式主義を使用して非マルコビアン補正メカニズムを統合します。
その結果、このアプローチは、非線形自動エンコーダーの潜在マニホールド内のダイナミクスのおおよその閉鎖をもたらし、それによってKoopmanオペレーター近似の精度と安定性を高めます。
デモンストレーションは、シリンダーの周りの流れのための技術の改善された予測機能を紹介します。
また、短期的な予測可能性と堅牢な長期統計パフォーマンスを備えたKuramoto-Sivashinsky(KS)の低次元近似も提供します。
データ駆動型の手法とKoopman理論の数学的基礎の間のギャップを埋めることにより、MZ-AEは、複雑な非線形ダイナミクスの理解と予測の改善のための有望な道を提供します。

要約(オリジナル)

The Koopman operator presents an attractive approach to achieve global linearization of nonlinear systems, making it a valuable method for simplifying the understanding of complex dynamics. While data-driven methodologies have exhibited promise in approximating finite Koopman operators, they grapple with various challenges, such as the judicious selection of observables, dimensionality reduction, and the ability to predict complex system behaviours accurately. This study presents a novel approach termed Mori-Zwanzig autoencoder (MZ-AE) to robustly approximate the Koopman operator in low-dimensional spaces. The proposed method leverages a nonlinear autoencoder to extract key observables for approximating a finite invariant Koopman subspace and integrates a non-Markovian correction mechanism using the Mori-Zwanzig formalism. Consequently, this approach yields an approximate closure of the dynamics within the latent manifold of the nonlinear autoencoder, thereby enhancing the accuracy and stability of the Koopman operator approximation. Demonstrations showcase the technique’s improved predictive capability for flow around a cylinder. It also provides a low dimensional approximation for Kuramoto-Sivashinsky (KS) with promising short-term predictability and robust long-term statistical performance. By bridging the gap between data-driven techniques and the mathematical foundations of Koopman theory, MZ-AE offers a promising avenue for improved understanding and prediction of complex nonlinear dynamics.

arxiv情報

著者 Priyam Gupta,Peter J. Schmid,Denis Sipp,Taraneh Sayadi,Georgios Rigas
発行日 2025-05-07 15:34:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.DS, physics.flu-dyn, stat.ML | Mori-Zwanzig latent space Koopman closure for nonlinear autoencoder はコメントを受け付けていません

Ranked differences Pearson correlation dissimilarity with an application to electricity users time series clustering

要約

時系列のクラスタリングは、時系列データを同様の動作のあるグループに分類するための教師のない学習方法です。
これは、ヘルスケア、金融、経済、エネルギー、気候科学などのアプリケーションで使用されています。
いくつかの時系列クラスタリング方法が導入され、40年以上にわたって使用されています。
それらのほとんどは、時系列間のユークリッド距離または関連性のない測定に焦点を当てています。
この作業では、ランク付けされたピアソン相関の非類似性(RDPC)と呼ばれる新しい非類似度測定を提案します。これは、最大の要素ごとの違いの指定された割合の加重平均を、よく知られたピアソン相関の相関性と組み合わせます。
階層クラスタリングに組み込まれています。
パフォーマンスは評価され、既存のクラスタリングアルゴリズムと比較されます。
結果は、RDPCアルゴリズムが、さまざまな季節パターン、トレンド、ピークを含む複雑なケースで他の人を上回ることを示しています。
最後に、タイの電力消費時系列データセットから顧客のランダムなサンプルを一意の特性を持つ7つのグループにクラスター化することにより、私たちの方法を実証します。

要約(オリジナル)

Time series clustering is an unsupervised learning method for classifying time series data into groups with similar behavior. It is used in applications such as healthcare, finance, economics, energy, and climate science. Several time series clustering methods have been introduced and used for over four decades. Most of them focus on measuring either Euclidean distances or association dissimilarities between time series. In this work, we propose a new dissimilarity measure called ranked Pearson correlation dissimilarity (RDPC), which combines a weighted average of a specified fraction of the largest element-wise differences with the well-known Pearson correlation dissimilarity. It is incorporated into hierarchical clustering. The performance is evaluated and compared with existing clustering algorithms. The results show that the RDPC algorithm outperforms others in complicated cases involving different seasonal patterns, trends, and peaks. Finally, we demonstrate our method by clustering a random sample of customers from a Thai electricity consumption time series dataset into seven groups with unique characteristics.

arxiv情報

著者 Chutiphan Charoensuk,Nathakhun Wiroonsri
発行日 2025-05-07 15:39:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Ranked differences Pearson correlation dissimilarity with an application to electricity users time series clustering はコメントを受け付けていません