Marginalized Beam Search Algorithms for Hierarchical HMMs

要約

一連の測定値から状態シーケンスを推測することは、バイオインフォマティクスと自然言語処理における基本的な問題です。
ビタビ アルゴリズムとビーム検索 (BS) アルゴリズムは一般的な推論方法ですが、外部状態シーケンスに関心がある階層隠れマルコフ モデル (HHMM) に適用すると制限があります。
ビタビ アルゴリズムは内部状態なしでは外部状態を推論できませんが、BS アルゴリズムでは法外に大きな状態空間を周縁化する必要があります。
我々は、これらの制限を克服するために、貪欲な周縁化 BS アルゴリズムとローカル フォーカス BS アルゴリズムという 2 つの新しいアルゴリズムを提案します。
我々は、これらのアルゴリズムがビタビ アルゴリズムよりも高いパフォーマンスで最も可能性の高い外部状態シーケンスを近似することを示し、シミュレーションとナノポア ベース コーリング データを使用して陽的継続時間 HMM 上でこれらのアルゴリズムのパフォーマンスを評価します。

要約(オリジナル)

Inferring a state sequence from a sequence of measurements is a fundamental problem in bioinformatics and natural language processing. The Viterbi and the Beam Search (BS) algorithms are popular inference methods, but they have limitations when applied to Hierarchical Hidden Markov Models (HHMMs), where the interest lies in the outer state sequence. The Viterbi algorithm can not infer outer states without inner states, while the BS algorithm requires marginalization over prohibitively large state spaces. We propose two new algorithms to overcome these limitations: the greedy marginalized BS algorithm and the local focus BS algorithm. We show that they approximate the most likely outer state sequence with higher performance than the Viterbi algorithm, and we evaluate the performance of these algorithms on an explicit duration HMM with simulation and nanopore base calling data.

arxiv情報

著者 Xuechun Xu,Joakim Jaldén
発行日 2023-05-19 15:39:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP, q-bio.QM パーマリンク