From Molecules to Mixtures: Learning Representations of Olfactory Mixture Similarity using Inductive Biases

要約

嗅覚 – 分子が人間に対する臭気としてどのように知覚されるかは、あまり理解されていないままです。
最近、単一化合物の嗅覚特性をデジタル化するために、主要な臭気マップ(POM)が導入されました。
しかし、実際の生活の臭いは純粋な単一分子ではなく、分子の複雑な混合物であり、その表現は比較的経験不足のままです。
この作業では、混合物を表すPOMの拡張であるPommixを紹介します。
私たちの表現は、階層的な方法で問題空間の対称性に基づいています:(1)分子埋め込みを構築するためのグラフニューラルネットワーク、(2)分子表現を混合表現に凝集させるための注意メカニズム、および(3)コサイン予測は嗅覚知覚にエンコードするヘッドに向かいます
混合物の埋め込みスペースの距離。
Pommixは、複数のデータセットで最先端の予測パフォーマンスを実現します。
また、目に見えない分子と混合サイズに適用された場合、複数のスプリットでの表現の一般化可能性を評価します。
私たちの仕事は、嗅覚をデジタル化する努力を進め、低データの専門知識の相乗効果と、低データレジームの表現表現を作成する際の深い学習を強調しています。

要約(オリジナル)

Olfaction — how molecules are perceived as odors to humans — remains poorly understood. Recently, the principal odor map (POM) was introduced to digitize the olfactory properties of single compounds. However, smells in real life are not pure single molecules, but complex mixtures of molecules, whose representations remain relatively under-explored. In this work, we introduce POMMix, an extension of the POM to represent mixtures. Our representation builds upon the symmetries of the problem space in a hierarchical manner: (1) graph neural networks for building molecular embeddings, (2) attention mechanisms for aggregating molecular representations into mixture representations, and (3) cosine prediction heads to encode olfactory perceptual distance in the mixture embedding space. POMMix achieves state-of-the-art predictive performance across multiple datasets. We also evaluate the generalizability of the representation on multiple splits when applied to unseen molecules and mixture sizes. Our work advances the effort to digitize olfaction, and highlights the synergy of domain expertise and deep learning in crafting expressive representations in low-data regimes.

arxiv情報

著者 Gary Tom,Cher Tian Ser,Ella M. Rajaonson,Stanley Lo,Hyun Suk Park,Brian K. Lee,Benjamin Sanchez-Lengeling
発行日 2025-01-27 18:05:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク