Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers

要約

現代のハードウェアの設計は、高レベルのロジックゲートによって提供される抽象化から利益を得て、ロジック回路の実装を合理化します。
ロジック合成最適化(LSO)は、電子設計自動化(EDA)ワークフロー内の1つのレベルの抽象化で動作し、最終レイアウトのサイズや速度などのパフォーマンスメトリックに関してロジック回路の改善をターゲットにしています。
この分野の最近の傾向は、特にポリシーベースの強化学習(RL)方法を利用したMLガイド付きロジック合成を通じて、EDAの機械学習(ML)を活用することに関心が高まっていることを示しています。これらの進歩には、既存のモデルが過剰に適合し、限られた一般化などの課題に直面しています。
これらのハードルに対処し、データの希少性の問題に取り組むために、LSOFormerを紹介します。LSoFormerは、自動脱着変圧器モデルと予測SSLを活用して、結果の品質の軌跡を予測する新しいアプローチ(QOR)を紹介します。
Lsoforderは、回路グラフと最適化シーケンスからの洞察をマージするために、クロスアテンションモジュールを統合し、それによりQORメトリックの予測精度を高めます。
実験的研究では、Lsoformerの有効性を検証し、QOR予測タスクのベースラインアーキテクチャよりも優れたパフォーマンスを紹介します。そこでは、EPFL、OABCD、およびProprietary Curcuits Datasetsでそれぞれ5.74%、4.35%、および17.06%の改善を達成します。

要約(オリジナル)

Contemporary hardware design benefits from the abstraction provided by high-level logic gates, streamlining the implementation of logic circuits. Logic Synthesis Optimization (LSO) operates at one level of abstraction within the Electronic Design Automation (EDA) workflow, targeting improvements in logic circuits with respect to performance metrics such as size and speed in the final layout. Recent trends in the field show a growing interest in leveraging Machine Learning (ML) for EDA, notably through ML-guided logic synthesis utilizing policy-based Reinforcement Learning (RL) methods.Despite these advancements, existing models face challenges such as overfitting and limited generalization, attributed to constrained public circuits and the expressiveness limitations of graph encoders. To address these hurdles, and tackle data scarcity issues, we introduce LSOformer, a novel approach harnessing Autoregressive transformer models and predictive SSL to predict the trajectory of Quality of Results (QoR). LSOformer integrates cross-attention modules to merge insights from circuit graphs and optimization sequences, thereby enhancing prediction accuracy for QoR metrics. Experimental studies validate the effectiveness of LSOformer, showcasing its superior performance over baseline architectures in QoR prediction tasks, where it achieves improvements of 5.74%, 4.35%, and 17.06% on the EPFL, OABCD, and proprietary circuits datasets, respectively, in inductive setup.

arxiv情報

著者 Raika Karimi,Faezeh Faez,Yingxue Zhang,Xing Li,Lei Chen,Mingxuan Yuan,Mahdi Biparva
発行日 2025-02-28 16:04:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers はコメントを受け付けていません

AMPLE: Event-Driven Accelerator for Mixed-Precision Inference of Graph Neural Networks

要約

グラフニューラルネットワーク(GNNS)は、非ユークリッドデータのパフォーマンスにより最近注目を集めています。
カスタムハードウェアアーキテクチャの使用は、グラフのまばらな構造に起因する不規則なメモリアクセスパターンのため、GNNにとって特に有益です。
ただし、既存のFPGAアクセラレータは、典型的なグラフデータセットの不規則なノード分布を考慮していない二重バッファリングメカニズムによって制限されています。
これに対処するために、新しいイベント駆動型プログラミングフローを活用するFPGAアクセラレータである\ textbf {ample}(Accelerated Message Passing Logic Engine)を紹介します。
混合アリスメティックアーキテクチャを開発し、GNN推論をノードレベルの粒度で量子化できるようにします。
最後に、データと命令のプリフェッチャーが実装されており、オフチップメモリ​​アクセスを最適化し、ノードの並列性を最大化します。
引用およびソーシャルメディアグラフデータセットの評価$ 2 $ kから$ 700 $ kノードの範囲は、CPUとGPUの対応物に対してそれぞれ243 \ Times $ $ 243 \ Times $と$ 7.2 \ Times $の平均スピードアップを示しました。

要約(オリジナル)

Graph Neural Networks (GNNs) have recently gained attention due to their performance on non-Euclidean data. The use of custom hardware architectures proves particularly beneficial for GNNs due to their irregular memory access patterns, resulting from the sparse structure of graphs. However, existing FPGA accelerators are limited by their double buffering mechanism, which doesn’t account for the irregular node distribution in typical graph datasets. To address this, we introduce \textbf{AMPLE} (Accelerated Message Passing Logic Engine), an FPGA accelerator leveraging a new event-driven programming flow. We develop a mixed-arithmetic architecture, enabling GNN inference to be quantized at a node-level granularity. Finally, prefetcher for data and instructions is implemented to optimize off-chip memory access and maximize node parallelism. Evaluation on citation and social media graph datasets ranging from $2$K to $700$K nodes showed a mean speedup of $243\times$ and $7.2\times$ against CPU and GPU counterparts, respectively.

arxiv情報

著者 Pedro Gimenes,Yiren Zhao,George Constantinides
発行日 2025-02-28 16:14:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.AR, cs.LG | AMPLE: Event-Driven Accelerator for Mixed-Precision Inference of Graph Neural Networks はコメントを受け付けていません

Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation

要約

分子とテキストのクロスモーダル表現学習は、分子表現の品質を高めるための有望な方向として浮上し、それによって創薬や材料科学を含むさまざまな科学分野のパフォーマンスを改善しました。
既存の研究は、さまざまなモダリティから知識を学ぶために、グローバルな整合アプローチを採用しています。
これらのグローバルなアライメントアプローチは、分子断片やそれに対応するテキストの説明など、細粒の情報をキャプチャできません。これは、下流タスクに重要です。
さらに、既存のデータセットからのペアのローカルパーツ注釈データのデータ不足のため、同様のグローバルアライメント戦略を使用してそのような情報をモデル化することはできません。
この論文では、Smiles String and Textの表現を共同で学習するためのマルチモーダル分子表現学習フレームワークであるAtomasを提案します。
階層的適応アライメントモデルを設計して、2つのモダリティ間の細かい断片的な対応を同時に学習し、これらのフラグメントの表現を3つのレベルで整列させます。
さらに、Atomasのエンドツーエンドトレーニングフレームワークには、分子の理解と生成のタスクが組み込まれているため、より広範なダウンストリームタスクがサポートされます。
検索タスクでは、Atomasは堅牢な一般化能力を示し、平均してRecall@1の30.8%のベースラインを上回ります。
生成タスクでは、Atomasは、分子キャプションタスクと分子生成タスクの両方で最先端の結果を達成します。
さらに、階層的適応アライメントモデルの視覚化は、アプローチの化学的重要性をさらに確認します。
私たちのコードは、https://anonymous.4open.science/r/atomas-03c3にあります。

要約(オリジナル)

Molecule-and-text cross-modal representation learning has emerged as a promising direction for enhancing the quality of molecular representation, thereby improving performance in various scientific fields, including drug discovery and materials science. Existing studies adopt a global alignment approach to learn the knowledge from different modalities. These global alignment approaches fail to capture fine-grained information, such as molecular fragments and their corresponding textual description, which is crucial for downstream tasks. Furthermore, it is incapable to model such information using a similar global alignment strategy due to data scarcity of paired local part annotated data from existing datasets. In this paper, we propose Atomas, a multi-modal molecular representation learning framework to jointly learn representations from SMILES string and text. We design a Hierarchical Adaptive Alignment model to concurrently learn the fine-grained fragment correspondence between two modalities and align these representations of fragments in three levels. Additionally, Atomas’s end-to-end training framework incorporates the tasks of understanding and generating molecule, thereby supporting a wider range of downstream tasks. In the retrieval task, Atomas exhibits robust generalization ability and outperforms the baseline by 30.8% of recall@1 on average. In the generation task, Atomas achieves state-of-the-art results in both molecule captioning task and molecule generation task. Moreover, the visualization of the Hierarchical Adaptive Alignment model further confirms the chemical significance of our approach. Our codes can be found at https://anonymous.4open.science/r/Atomas-03C3.

arxiv情報

著者 Yikun Zhang,Geyan Ye,Chaohao Yuan,Bo Han,Long-Kai Huang,Jianhua Yao,Wei Liu,Yu Rong
発行日 2025-02-28 16:19:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, q-bio.QM | Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation はコメントを受け付けていません

ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments

要約

最近の研究では、テスト時間計算をスケーリングすることで、推論タスクに関するLLMパフォーマンスを強化できることが示されています。
特に分解可能な問題を抱える有望なアプローチの1つは、解決策スペースを探索するために変換が実行されるグラフとして中間ソリューションを配置することを伴います。
ただし、以前の作業は、検索されたハイパーパラメーターのセットの対象となる、事前に決定されたタスク固有の変換スケジュールに依存しています。
この作業では、グラフ変換はマルコフの決定プロセスでのアクションと見なされ、根本的な推論LLMエージェントの効果的なアクションポリシーを推進するためのポリシーエージェントを実装します。
特に、別のLLMが思考グラフ環境でポリシーエージェントとして行動する能力を調査し、LLMSを推論するためのマルチエージェントアーキテクチャであるAriesを導入します。
牡羊座では、LLMエージェントが分解されたサブ問題を解決し、Policy LLMエージェントは思考グラフ状態の可視性を維持し、問題解決戦略を動的に適応させます。
広範な実験を通じて、監視された微調整(SFT)のない政策エージェントとして既製のLLMSを使用すると、静的変換スケジュールと比較してHumanvalの最大29ドルの精度が得られ、推論コストを35ドル\%$削減し、検索要件を回避できることがわかります。
また、観測された障害モードの徹底的な分析を実施し、LLMサイズの制限と問題の深さ分解を強調することは、LLMガイドの推論をスケーリングするための課題と見なすことができます。

要約(オリジナル)

Recent research has shown that LLM performance on reasoning tasks can be enhanced by scaling test-time compute. One promising approach, particularly with decomposable problems, involves arranging intermediate solutions as a graph on which transformations are performed to explore the solution space. However, prior works rely on pre-determined, task-specific transformation schedules which are subject to a set of searched hyperparameters. In this work, we view thought graph transformations as actions in a Markov decision process, and implement policy agents to drive effective action policies for the underlying reasoning LLM agent. In particular, we investigate the ability for another LLM to act as a policy agent on thought graph environments and introduce ARIES, a multi-agent architecture for reasoning with LLMs. In ARIES, reasoning LLM agents solve decomposed subproblems, while policy LLM agents maintain visibility of the thought graph states, and dynamically adapt the problem-solving strategy. Through extensive experiments, we observe that using off-the-shelf LLMs as policy agents with no supervised fine-tuning (SFT) can yield up to $29\%$ higher accuracy on HumanEval relative to static transformation schedules, as well as reducing inference costs by $35\%$ and avoid any search requirements. We also conduct a thorough analysis of observed failure modes, highlighting that limitations on LLM sizes and the depth of problem decomposition can be seen as challenges to scaling LLM-guided reasoning.

arxiv情報

著者 Pedro Gimenes,Zeyu Cao,Jeffrey Wong,Yiren Zhao
発行日 2025-02-28 16:28:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments はコメントを受け付けていません

Stochasticity in Motion: An Information-Theoretic Approach to Trajectory Prediction

要約

自律運転では、安全で効率的なモーション計画には、正確なモーション予測が重要です。
安全性を確保するために、プランナーは周囲のエージェントの予測される行動の信頼できる不確実性の推定値を必要としますが、この側面は限られた注目を集めています。
特に、不確実性をそのleatoricと認識論的要素に分解することは、固有の環境ランダム性とモデルの不確実性を区別するために不可欠であり、それにより、より堅牢で情報に基づいた意思決定を可能にします。
このペーパーでは、不確実性の定量化、分解、およびモデル組成の影響を強調する全体的なアプローチで、軌道予測における不確実性モデリングの課題に対処します。
情報理論に基づいた私たちの方法は、不確実性を測定し、それをaleatoricおよび認識論的な要素に分解する理論的に原則的な方法を提供します。
以前の作業とは異なり、私たちのアプローチは最先端のモーション予測因子と互換性があり、より広範な適用性が可能になります。
nuscenesデータセットで広範な実験を実施することにより、その有用性を実証します。これは、異なるアーキテクチャと構成が不確実性の定量化とモデルの堅牢性にどのように影響するかを示します。

要約(オリジナル)

In autonomous driving, accurate motion prediction is crucial for safe and efficient motion planning. To ensure safety, planners require reliable uncertainty estimates of the predicted behavior of surrounding agents, yet this aspect has received limited attention. In particular, decomposing uncertainty into its aleatoric and epistemic components is essential for distinguishing between inherent environmental randomness and model uncertainty, thereby enabling more robust and informed decision-making. This paper addresses the challenge of uncertainty modeling in trajectory prediction with a holistic approach that emphasizes uncertainty quantification, decomposition, and the impact of model composition. Our method, grounded in information theory, provides a theoretically principled way to measure uncertainty and decompose it into aleatoric and epistemic components. Unlike prior work, our approach is compatible with state-of-the-art motion predictors, allowing for broader applicability. We demonstrate its utility by conducting extensive experiments on the nuScenes dataset, which shows how different architectures and configurations influence uncertainty quantification and model robustness.

arxiv情報

著者 Aron Distelzweig,Andreas Look,Eitan Kosman,Faris Janjoš,Jörg Wagner,Abhinav Valada
発行日 2025-02-28 16:28:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Stochasticity in Motion: An Information-Theoretic Approach to Trajectory Prediction はコメントを受け付けていません

Efficiently Learning Probabilistic Logical Models by Cheaply Ranking Mined Rules

要約

確率論的論理モデルは、神経協調反応性AIのコアコンポーネントであり、高い説明可能性を必要とするタスクにとってそれ自体が重要です。
ニューラルネットワークとは異なり、モデルの根底にある論理理論は、ドメインの専門知識を使用して手作りされることが多く、開発に費用がかかり、エラーが発生しやすくなります。
データから論理理論を学習するアルゴリズムがありますが、それらは一般に法外に高価であり、実際の設定での適用性を制限しています。
ここでは、論理ルールの精度とリコールを紹介し、その構成をルールユーティリティとして定義します。これは、論理理論の予測力の費用対効果の高い尺度です。
また、リレーショナルデータから論理理論を学習するためのスケーラブルなフレームワークであるSpectrumも紹介します。
そのスケーラビリティは、データグラフ内の再発サブグラフを採掘する線形時間アルゴリズムと、安価なユーティリティメジャーを使用して、これらのサブグラフから派生したルールを効率的にランク付けする2番目のアルゴリズムに由来します。
最後に、学んだ論理理論の有用性に関する理論的保証を証明します。
その結果、さまざまなタスクにわたって、スペクトルがより大きなデータセットにスケーリングされ、多くの場合、CPUでより正確な論理理論を学習して、GPUでのSOTAニューラルネットワークのランタイムがアプローチすることを示しています。

要約(オリジナル)

Probabilistic logical models are a core component of neurosymbolic AI and are important in their own right for tasks that require high explainability. Unlike neural networks, logical theories that underlie the model are often handcrafted using domain expertise, making their development costly and prone to errors. While there are algorithms that learn logical theories from data, they are generally prohibitively expensive, limiting their applicability in real-world settings. Here, we introduce precision and recall for logical rules and define their composition as rule utility — a cost-effective measure of the predictive power of logical theories. We also introduce SPECTRUM, a scalable framework for learning logical theories from relational data. Its scalability derives from a linear-time algorithm that mines recurrent subgraphs in the data graph along with a second algorithm that, using the cheap utility measure, efficiently ranks rules derived from these subgraphs. Finally, we prove theoretical guarantees on the utility of the learnt logical theory. As a result, we demonstrate across various tasks that SPECTRUM scales to larger datasets, often learning more accurate logical theories on CPUs in < 1% the runtime of SOTA neural network approaches on GPUs.

arxiv情報

著者 Jonathan Feldstein,Dominic Phillips,Efthymia Tsamoura
発行日 2025-02-28 16:29:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Efficiently Learning Probabilistic Logical Models by Cheaply Ranking Mined Rules はコメントを受け付けていません

Transformers Learn to Implement Multi-step Gradient Descent with Chain of Thought

要約

Chain of Thinence(Cot)プロンプトは、特に算術および推論タスクにおいて、大規模な言語モデル(LLMS)のパフォーマンスを大幅に改善することが示されています。
COTの顕著な経験的成功と表現率の向上におけるその理論的利点にもかかわらず、COTトレーニングの根底にあるメカニズムはほとんど未踏のままです。
このホワイトペーパーでは、線形回帰のためのコンテキスト内の体重予測タスクに関するCOT目標を介したトランスのトレーニングダイナミクスを研究します。
COTのない1層の線形トランスは、勾配降下(GD)の単一ステップのみを実装でき、接地真実の重量ベクターの回復に失敗することを証明しますが、COTプロンプトを備えた変圧器はマルチステップGDを自動測定的に実行し、ほぼ抽出回収を達成することを学ぶことができます。
さらに、訓練されたトランスが目に見えないデータに効果的に一般化することを示します。
私たちの手法により、ループしたトランスは、線形回帰のコンテキスト学習をループすることなく、変圧器と比較して最終性能を大幅に改善することも示しています。
経験的には、COTプロンプトが大幅なパフォーマンスの改善をもたらすことを実証します。

要約(オリジナル)

Chain of Thought (CoT) prompting has been shown to significantly improve the performance of large language models (LLMs), particularly in arithmetic and reasoning tasks, by instructing the model to produce intermediate reasoning steps. Despite the remarkable empirical success of CoT and its theoretical advantages in enhancing expressivity, the mechanisms underlying CoT training remain largely unexplored. In this paper, we study the training dynamics of transformers over a CoT objective on an in-context weight prediction task for linear regression. We prove that while a one-layer linear transformer without CoT can only implement a single step of gradient descent (GD) and fails to recover the ground-truth weight vector, a transformer with CoT prompting can learn to perform multi-step GD autoregressively, achieving near-exact recovery. Furthermore, we show that the trained transformer effectively generalizes on the unseen data. With our technique, we also show that looped transformers significantly improve final performance compared to transformers without looping in the in-context learning of linear regression. Empirically, we demonstrate that CoT prompting yields substantial performance improvements.

arxiv情報

著者 Jianhao Huang,Zixuan Wang,Jason D. Lee
発行日 2025-02-28 16:40:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Transformers Learn to Implement Multi-step Gradient Descent with Chain of Thought はコメントを受け付けていません

An Algebraic Framework for Hierarchical Probabilistic Abstraction

要約

抽象化は、多様なフィールド全体のシステムの複雑さを減らすために不可欠ですが、確率的モデルの効果的な抽象化方法論の設計は、確率的行動と不確実性のために本質的に挑戦的です。
現在のアプローチは、しばしば詳細な確率的データを高レベルの要約に蒸留して、扱いやすく解釈可能な分析をサポートしますが、通常、単一層の抽象化を通じてリレーショナルおよび確率的階層を完全に表現するのに苦労しています。
階層的抽象化のための測定理論的基礎を拡張することにより、これらの課題に対処することを目的とした階層的な確率的抽象化フレームワークを紹介します。
このフレームワークは、階層化されたマッピングを介してモジュール式の問題解決を可能にし、詳細なレイヤー固有の分析とまとまりのあるシステム全体の理解の両方を促進します。
このアプローチは、低レベルの知覚データで高レベルの概念化を橋渡しし、解釈可能性を高め、層状分析を可能にします。
私たちのフレームワークは、特にシステム1とシステム2の思考を調整する際に、AIサブフィールド全体の抽象化分析のための堅牢な基盤を提供し、それによって多様な抽象化方法論の開発をサポートします。

要約(オリジナル)

Abstraction is essential for reducing the complexity of systems across diverse fields, yet designing effective abstraction methodology for probabilistic models is inherently challenging due to stochastic behaviors and uncertainties. Current approaches often distill detailed probabilistic data into higher-level summaries to support tractable and interpretable analyses, though they typically struggle to fully represent the relational and probabilistic hierarchies through single-layered abstractions. We introduce a hierarchical probabilistic abstraction framework aimed at addressing these challenges by extending a measure-theoretic foundation for hierarchical abstraction. The framework enables modular problem-solving via layered mappings, facilitating both detailed layer-specific analysis and a cohesive system-wide understanding. This approach bridges high-level conceptualization with low-level perceptual data, enhancing interpretability and allowing layered analysis. Our framework provides a robust foundation for abstraction analysis across AI subfields, particularly in aligning System 1 and System 2 thinking, thereby supporting the development of diverse abstraction methodologies.

arxiv情報

著者 Nijesh Upreti,Vaishak Belle
発行日 2025-02-28 16:47:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | An Algebraic Framework for Hierarchical Probabilistic Abstraction はコメントを受け付けていません

XAIxArts Manifesto: Explainable AI for the Arts

要約

説明可能なAI(XAI)は、AIモデルをより理解しやすくする方法に関係しています。
これまでのところ、これらの説明は主に技術中心のメカニズムまたは生産性志向でした。
このペーパーでは、説明可能なAI for the Arts(Xaixarts)マニフェストを紹介して、テクノセントリックな言説を超えた説明可能性とAIについての新しい考え方を引き起こします。
マニフェストは、アイデアを伝え、前代未聞の声を増幅し、実践に関する熟考を促進する手段を提供します。
Xaixartsマニフェストの共創と改訂をサポートするために、世界のCAF \ ‘Eスタイルディスカッション形式と生きたマニフェストを組み合わせて、4つのコアテーマに疑問を投げかけます。1)エンパワーメント、包摂、および公平性。
2)芸術的実践の評価。
3)ハッキングとグリッチ。
および4)開放性。
インタラクティブなリビングマニフェストエクスペリエンスを通じて、参加者は、CHIコミュニティ内およびそれ以降のこのXiaxartsビジョンの形成に積極的に関与するよう招待します。

要約(オリジナル)

Explainable AI (XAI) is concerned with how to make AI models more understandable to people. To date these explanations have predominantly been technocentric – mechanistic or productivity oriented. This paper introduces the Explainable AI for the Arts (XAIxArts) manifesto to provoke new ways of thinking about explainability and AI beyond technocentric discourses. Manifestos offer a means to communicate ideas, amplify unheard voices, and foster reflection on practice. To supports the co-creation and revision of the XAIxArts manifesto we combine a World Caf\’e style discussion format with a living manifesto to question four core themes: 1) Empowerment, Inclusion, and Fairness; 2) Valuing Artistic Practice; 3) Hacking and Glitches; and 4) Openness. Through our interactive living manifesto experience we invite participants to actively engage in shaping this XIAxArts vision within the CHI community and beyond.

arxiv情報

著者 Nick Bryan-Kinns,Shuoyang Jasper Zheng,Francisco Castro,Makayla Lewis,Jia-Rey Chang,Gabriel Vigliensoni,Terence Broad,Michael Clemens,Elizabeth Wilson
発行日 2025-02-28 16:50:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC | XAIxArts Manifesto: Explainable AI for the Arts はコメントを受け付けていません

SemlaFlow — Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching

要約

構造ベースの薬物設計への潜在的な影響により、最近の3D立体構造とともに分子グラフを共同で生成する方法が最近目立っています。
ただし、現在のアプローチは、サンプリング時間が非常に遅いか、化学的妥当性が低い分子を生成することがよくあります。
これらの制限に対処すると、Semlaは、スケーラブルなE(3)equivariantメッセージの通過アーキテクチャを提案します。
さらに、無条件の3D分子生成モデルであるSemlaflowを導入します。これは、等垂直フローマッチングを使用してトレーニングされ、原子タイプ、座標、結合タイプ、および正式な料金を介したジョイント分布を生成します。
私たちのモデルは、最先端のスピードアップに対応する20個のサンプリングステップで、ベンチマークデータセットで最先端の結果を生成します。
さらに、3D生成の現在の評価方法の制限を強調し、無条件分子発電機の新しいベンチマークメトリックを提案します。
最後に、これらの新しいメトリックを使用して、現在のアプローチに対して高品質のサンプルを生成するモデルの能力を比較し、Semlaflowの強力なパフォーマンスをさらに実証します。

要約(オリジナル)

Methods for jointly generating molecular graphs along with their 3D conformations have gained prominence recently due to their potential impact on structure-based drug design. Current approaches, however, often suffer from very slow sampling times or generate molecules with poor chemical validity. Addressing these limitations, we propose Semla, a scalable E(3)-equivariant message passing architecture. We further introduce an unconditional 3D molecular generation model, SemlaFlow, which is trained using equivariant flow matching to generate a joint distribution over atom types, coordinates, bond types and formal charges. Our model produces state-of-the-art results on benchmark datasets with as few as 20 sampling steps, corresponding to a two order-of-magnitude speedup compared to state-of-the-art. Furthermore, we highlight limitations of current evaluation methods for 3D generation and propose new benchmark metrics for unconditional molecular generators. Finally, using these new metrics, we compare our model’s ability to generate high quality samples against current approaches and further demonstrate SemlaFlow’s strong performance.

arxiv情報

著者 Ross Irwin,Alessandro Tibo,Jon Paul Janet,Simon Olsson
発行日 2025-02-28 16:56:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE | SemlaFlow — Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching はコメントを受け付けていません