要約
タイトル:LogGENE:Deep Healthcare Inference TasksのLossチェックに対するスムーズな代替方法
要約:
– 大規模なデータセットからの採掘と、それらからのキャリブレーションされた予測の取得は、信頼できる深層学習において直ちに関連性と有用性がある。
– 私たちの研究では、Deep Neural Networksに基づく推論方法を、Gene Expressionのようなこのようなデータセットに適用する方法を開発している。
– 典型的なDeep Learning方法とは異なり、私たちの推論技術は、精度において最先端の性能を発揮しながらも、説明を提供し、不確実性の推定も行うことができます。
– 我々は、housekeeping gene expressionsの一連の条件付きquantilesを予測するために、Quantile Regressionフレームワークを採用している。
– 条件付きQuantilesは、予測の豊かな解釈を提供するだけでなく、測定ノイズにも強い。
– 私たちの技術は、パーソナライズドヘルスケア、ターゲットドラッグデザインおよびデリバリーの新時代を導くHigh-throughput Genomicsに特に意義がある。
– ただし、推定プロセスを駆動するQuantile Regressionに使用されるcheck lossは微分可能ではない。私たちは、log-coshをチェックロスのスムーズな代替案として提案している。
– 私たちはGEOマイクロアレイデータセットでこれらの方法を適用しました。また、バイナリ分類設定にもこの手法を拡張しました。
– さらに、損失がスムーズであることの他の影響を追求し、より速い収束を実現しています。
– 私たちは、この分類フレームワークを心臓病、乳がん、糖尿病などの他のヘルスケア推論タスクにも適用しています。
– 当社のフレームワークの一般化能力のテストとして、回帰および分類タスクの非ヘルスケア関連データセットも評価されました。
要約(オリジナル)
Mining large datasets and obtaining calibrated predictions from tem is of immediate relevance and utility in reliable deep learning. In our work, we develop methods for Deep neural networks based inferences in such datasets like the Gene Expression. However, unlike typical Deep learning methods, our inferential technique, while achieving state-of-the-art performance in terms of accuracy, can also provide explanations, and report uncertainty estimates. We adopt the Quantile Regression framework to predict full conditional quantiles for a given set of housekeeping gene expressions. Conditional quantiles, in addition to being useful in providing rich interpretations of the predictions, are also robust to measurement noise. Our technique is particularly consequential in High-throughput Genomics, an area which is ushering a new era in personalized health care, and targeted drug design and delivery. However, check loss, used in quantile regression to drive the estimation process is not differentiable. We propose log-cosh as a smooth-alternative to the check loss. We apply our methods on GEO microarray dataset. We also extend the method to binary classification setting. Furthermore, we investigate other consequences of the smoothness of the loss in faster convergence. We further apply the classification framework to other healthcare inference tasks such as heart disease, breast cancer, diabetes etc. As a test of generalization ability of our framework, other non-healthcare related data sets for regression and classification tasks are also evaluated.
arxiv情報
著者 | Aryaman Jeendgar,Tanmay Devale,Soma S Dhavala,Snehanshu Saha |
発行日 | 2023-04-28 13:17:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI