要約
細菌特性を支配する因果遺伝的メカニズムをどのように識別できますか?
遺伝子型から表現型を予測するタスクを処理するために機械学習モデルに委託された最初の努力は、高精度スコアを返します。
ただし、予測モデルから意味を抽出しようとする試みは、誤って特定された「因果関係」の特徴によって破損していることがわかります。
パターン認識と相関のみに依存することは信頼できず、高次元性と偽の関連が標準である細菌ゲノミクスの設定ではかなり重要です。
このハードルを克服できるかどうかはまだ明確ではありませんが、潜在的な高リスクの細菌の遺伝的変異を発見するために多大な努力が払われています。
これを考慮して、細菌の全ゲノムデータセットからの表現型の予測を取り巻くオープンな問題を設定し、それらを学習因果効果に拡張し、この性質のデータセットに直面したときにマシンの意思決定の信頼性に影響を与える課題について議論します。
要約(オリジナル)
How can we identify causal genetic mechanisms that govern bacterial traits? Initial efforts entrusting machine learning models to handle the task of predicting phenotype from genotype return high accuracy scores. However, attempts to extract any meaning from the predictive models are found to be corrupted by falsely identified ‘causal’ features. Relying solely on pattern recognition and correlations is unreliable, significantly so in bacterial genomics settings where high-dimensionality and spurious associations are the norm. Though it is not yet clear whether we can overcome this hurdle, significant efforts are being made towards discovering potential high-risk bacterial genetic variants. In view of this, we set up open problems surrounding phenotype prediction from bacterial whole-genome datasets and extending those to learning causal effects, and discuss challenges that impact the reliability of a machine’s decision-making when faced with datasets of this nature.
arxiv情報
著者 | Tamsin James,Ben Williamson,Peter Tino,Nicole Wheeler |
発行日 | 2025-02-11 18:25:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google