要約
言語モデルは、構文、意味論、および推論における基本的な能力を示しますが、そのパフォーマンスは処理する入力に大きく依存することがよくあります。
この研究では、t-SMILES フレームワークの不可欠なコンポーネントとして、TSIS (Simplified TSID) とそのバリアントである TSISD (深さ優先検索を備えた TSIS)、TSISO (順番の TSIS)、および TSISR (ランダムの TSIS) を紹介します。
これらの追加によりフレームワークの設計が完成し、分子表現への多様なアプローチが提供されます。
GPT、拡散モデル、強化学習などの深い生成モデルを使用した包括的な分析と実験を通じて、t-SMILES の階層構造が当初の予想よりも解析しやすいことが明らかになりました。
さらに、t-SMILES は SMILES、SELFIES、SAFE などの他の線形表現を常に上回っており、優れた収束速度と強化された汎化機能を示しています。
要約(オリジナル)
Language models demonstrate fundamental abilities in syntax, semantics, and reasoning, though their performance often depends significantly on the inputs they process. This study introduces TSIS (Simplified TSID) and its variants:TSISD (TSIS with Depth-First Search), TSISO (TSIS in Order), and TSISR (TSIS in Random), as integral components of the t-SMILES framework. These additions complete the framework’s design, providing diverse approaches to molecular representation. Through comprehensive analysis and experiments employing deep generative models, including GPT, diffusion models, and reinforcement learning, the findings reveal that the hierarchical structure of t-SMILES is more straightforward to parse than initially anticipated. Furthermore, t-SMILES consistently outperforms other linear representations such as SMILES, SELFIES, and SAFE, demonstrating superior convergence speed and enhanced generalization capabilities.
arxiv情報
著者 | Juan-Ni Wu,Tong Wang,Li-Juan Tang,Hai-Long Wu,Ru-Qin Yu |
発行日 | 2024-11-18 16:01:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google