Module-based regularization improves Gaussian graphical models when observing noisy data

要約

タイトル:ノイズのあるデータを観測する際に、モジュールベースの正則化はガウスグラフィカルモデルを改善する

要約:
– 研究者は、多変量相関データの関係をガウスグラフィカルモデルを用いて表現することがよくあります。
– これらのモデルを疎にするために正則化が必要です。
– 推定されたネットワークのモジュラー構造をよく研究することが多いことから、過少適合と過剰適合をバランスを取るために交差検証時にモジュール構造を統合することを提案しています。
– 合成データと実データを用いて、グラフィカルラッソ(交差検証時にガウスの対数尤度を用いる標準的なアプローチ)よりも、よりよくノイズのあるデータにおけるモジュール構造を回復し推論することができることを示しています。

※ ガウスグラフィカルモデル:多変量正規分布に基づく、グラフ表現による確率モデルで、全結合のグラフに対し尤度を最大化することで、最適な分布を推定するものです。
※ 疎化:情報が限られた環境下でも高い精度を持つよう、情報量を減らし、係数情報の不要な部分を疎にし、計算量を削減するための処理のことです。
※ 交差検証:学習データとテストデータに分け、テストデータでの予測誤差を測ることでモデルの精度評価をする手法のことです。
※ モジュール:組織や生物などの複雑なシステムを一定の連続体として抜き出し、単純化する方法のことです。このようにすることで複雑なシステムを可視化し、理解することができます。

要約(オリジナル)

Researchers often represent relations in multi-variate correlational data using Gaussian graphical models, which require regularization to sparsify the models. Acknowledging that they often study the modular structure of the inferred network, we suggest integrating it in the cross-validation of the regularization strength to balance under- and overfitting. Using synthetic and real data, we show that this approach allows us to better recover and infer modular structure in noisy data compared with the graphical lasso, a standard approach using the Gaussian log-likelihood when cross-validating the regularization strength.

arxiv情報

著者 Magnus Neuman,Joaquín Calatayud,Viktor Tasselius,Martin Rosvall
発行日 2023-04-04 06:26:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, physics.data-an パーマリンク