On-Device LLMs for SMEs: Challenges and Opportunities

要約

このペーパーでは、ハードウェアとソフトウェアの両方の観点に焦点を当て、中小企業 (SME) のコンテキスト内で大規模言語モデル (LLM) をデバイス上に展開するためのインフラストラクチャ要件を体系的にレビューします。
ハードウェアの観点から、GPU や TPU などのプロセッシング ユニットの利用、効率的なメモリとストレージ ソリューション、効果的な導入戦略について説明し、中小企業環境に特有の限られた計算リソースの課題に対処します。
ソフトウェアの観点から、フレームワークの互換性、オペレーティング システムの最適化、リソースに制約のある環境に合わせた特殊なライブラリの使用について調査します。
このレビューは、まずデバイス上に LLM を導入する際に中小企業が直面する特有の課題を特定し、次にハードウェアの革新とソフトウェアの適応の両方がこれらの障害を克服するために提供する機会を探ることを目的として構成されています。
このような構造化されたレビューは実践的な洞察を提供し、LLM を統合する際の中小企業の技術的回復力を強化することでコミュニティに大きく貢献します。

要約(オリジナル)

This paper presents a systematic review of the infrastructure requirements for deploying Large Language Models (LLMs) on-device within the context of small and medium-sized enterprises (SMEs), focusing on both hardware and software perspectives. From the hardware viewpoint, we discuss the utilization of processing units like GPUs and TPUs, efficient memory and storage solutions, and strategies for effective deployment, addressing the challenges of limited computational resources typical in SME settings. From the software perspective, we explore framework compatibility, operating system optimization, and the use of specialized libraries tailored for resource-constrained environments. The review is structured to first identify the unique challenges faced by SMEs in deploying LLMs on-device, followed by an exploration of the opportunities that both hardware innovations and software adaptations offer to overcome these obstacles. Such a structured review provides practical insights, contributing significantly to the community by enhancing the technological resilience of SMEs in integrating LLMs.

arxiv情報

著者 Jeremy Stephen Gabriel Yee Zhi Wen,Pai Chet Ng,Zhengkui Wang,Ian McLoughlin,Aik Beng Ng,Simon See
発行日 2024-10-21 14:48:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, cs.AI, cs.CL, I.2 | On-Device LLMs for SMEs: Challenges and Opportunities はコメントを受け付けていません

Critical Example Mining for Vehicle Trajectory Prediction using Flow-based Generative Models

要約

自動運転車には、複雑な運転シナリオにおける正確な軌道予測が不可欠です。
実際には、運転シナリオが異なると、軌道予測モデルの難易度も異なります。
ただし、既存の研究のほとんどは、入力シナリオの基礎となる分布を無視して、予測結果の平均精度に焦点を当てています。
この論文では、データ駆動型のアプローチを利用して軌跡の希少性を推定する重要な例のマイニング方法を提案します。
提案された方法は、観測値の希少性推定と軌跡全体を組み合わせることで、特定の予測モデルにデータを入力する前に、予測が比較的困難なデータのサブセットを効果的に識別します。
実験結果は、異なる下流予測モデルに適用すると、マイニングされたサブセットの予測誤差が高く、5% サンプルをマイニングした場合に +108.1% の誤差 (データセットの平均と比較して 2 倍以上) に達することが示されています。
さらなる分析により、マイニングされたクリティカルな例には、急ブレーキやキャンセルされた車線変更などの珍しいケースが含まれていることが示されており、これは予測モデルの理解を深め、パフォーマンスを向上させるのに役立ちます。

要約(オリジナル)

Precise trajectory prediction in complex driving scenarios is essential for autonomous vehicles. In practice, different driving scenarios present varying levels of difficulty for trajectory prediction models. However, most existing research focuses on the average precision of prediction results, while ignoring the underlying distribution of the input scenarios. This paper proposes a critical example mining method that utilizes a data-driven approach to estimate the rareness of the trajectories. By combining the rareness estimation of observations with whole trajectories, the proposed method effectively identifies a subset of data that is relatively hard to predict BEFORE feeding them to a specific prediction model. The experimental results show that the mined subset has higher prediction error when applied to different downstream prediction models, which reaches +108.1% error (greater than two times compared to the average on dataset) when mining 5% samples. Further analysis indicates that the mined critical examples include uncommon cases such as sudden brake and cancelled lane-change, which helps to better understand and improve the performance of prediction models.

arxiv情報

著者 Zhezhang Ding,Huijing Zhao
発行日 2024-10-21 15:02:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI | Critical Example Mining for Vehicle Trajectory Prediction using Flow-based Generative Models はコメントを受け付けていません

Fine-Tuning LLMs for Reliable Medical Question-Answering Services

要約

私たちは、微調整されたラージ言語モデル (LLM) を使用して医療情報の精度と信頼性を向上させる、医療質問応答 (QA) サービスへの高度なアプローチを紹介します。
私たちの研究は、LLaMA-2 や Mistral などのモデルの最適化に焦点を当てており、正確で信頼性の高い医学的回答を提供することに大きな期待が寄せられています。
包括的なデータセットを活用することで、rsDoRA+ や ReRAG などの微調整技術を適用しました。
rsDoRA+ は、分解されたモデルの重み、低ランク行列のさまざまな学習率、およびランクの安定化の組み合わせを通じてモデルのパフォーマンスを強化し、効率の向上につながります。
ReRAG は、オンデマンドの検索と質問の書き換えを統合し、回答の精度をさらに高めます。
このアプローチにより、医療提供者は信頼性の高い情報に迅速にアクセスできるようになり、より効率的な意思決定を支援し、患者の信頼を高めることができます。
私たちの取り組みは、微調整された LLM が医療情報サービスの品質とアクセシビリティを大幅に向上させ、最終的にはすべての人にとってより良い医療成果に貢献する可能性を浮き彫りにしています。

要約(オリジナル)

We present an advanced approach to medical question-answering (QA) services, using fine-tuned Large Language Models (LLMs) to improve the accuracy and reliability of healthcare information. Our study focuses on optimizing models like LLaMA-2 and Mistral, which have shown great promise in delivering precise, reliable medical answers. By leveraging comprehensive datasets, we applied fine-tuning techniques such as rsDoRA+ and ReRAG. rsDoRA+ enhances model performance through a combination of decomposed model weights, varied learning rates for low-rank matrices, and rank stabilization, leading to improved efficiency. ReRAG, which integrates retrieval on demand and question rewriting, further refines the accuracy of the responses. This approach enables healthcare providers to access fast, dependable information, aiding in more efficient decision-making and fostering greater patient trust. Our work highlights the potential of fine-tuned LLMs to significantly improve the quality and accessibility of medical information services, ultimately contributing to better healthcare outcomes for all.

arxiv情報

著者 Ali Anaissi,Ali Braytee,Junaid Akram
発行日 2024-10-21 15:12:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Fine-Tuning LLMs for Reliable Medical Question-Answering Services はコメントを受け付けていません

Multi-Sensor Fusion for UAV Classification Based on Feature Maps of Image and Radar Data

要約

最新の UAV は、独自のコスト、柔軟性、速度、効率性を備えているため、現代社会の多くの用途において魅力的な選択肢となっています。
しかし、これにより報告される悪意のあるインシデントや偶発的なインシデントの数が増え続けており、UAV の検出および分類メカニズムの開発の必要性が不可欠になっています。
すでに処理されたマルチセンサーデータを新しいディープニューラルネットワークに融合して、UAV検出に向けた分類精度を向上させるシステムを開発するための方法論を提案します。
DNN モデルは、熱、光電子、およびレーダー データに関連する個々の物体検出および分類モデルから抽出された高レベルの特徴を融合します。
さらに、モデルの畳み込みニューラル ネットワーク (CNN) ベースのアーキテクチャにも重点が置かれています。これは、熱センサーと光センサーの抽出された画像特徴を積み重ねることによって 3 つのセンサー モダリティの特徴を組み合わせ、各センサー単独よりも高い分類精度を実現します。

要約(オリジナル)

The unique cost, flexibility, speed, and efficiency of modern UAVs make them an attractive choice in many applications in contemporary society. This, however, causes an ever-increasing number of reported malicious or accidental incidents, rendering the need for the development of UAV detection and classification mechanisms essential. We propose a methodology for developing a system that fuses already processed multi-sensor data into a new Deep Neural Network to increase its classification accuracy towards UAV detection. The DNN model fuses high-level features extracted from individual object detection and classification models associated with thermal, optronic, and radar data. Additionally, emphasis is given to the model’s Convolutional Neural Network (CNN) based architecture that combines the features of the three sensor modalities by stacking the extracted image features of the thermal and optronic sensor achieving higher classification accuracy than each sensor alone.

arxiv情報

著者 Nikos Sakellariou,Antonios Lalas,Konstantinos Votis,Dimitrios Tzovaras
発行日 2024-10-21 15:12:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, eess.SP | Multi-Sensor Fusion for UAV Classification Based on Feature Maps of Image and Radar Data はコメントを受け付けていません

Neural Quantum Propagators for Driven-Dissipative Quantum Dynamics

要約

強力なレーザー駆動のオープン量子システムのダイナミクスを記述することは、高度に複雑な運動方程式の解決を必要とする非常に困難なタスクです。
機械学習技術は、個々の量子状態の時間発展をシミュレートするために適用され、ある程度の成功を収めていますが、時間依存演算子 (さまざまな状態を発展させることができる) を近似するための機械学習技術の使用は、ほとんど解明されていないままです。
この研究では、波動関数や密度行列ではなく伝播器を近似することによって駆動散逸量子力学を解決するユニバーサル ニューラル ネットワーク フレームワークである駆動型神経量子伝播器 (NQP) を開発します。
NQP は、はるかに短い時間ウィンドウでトレーニングされた場合でも、任意の初期量子状態を処理し、さまざまな外部フィールドに適応し、長時間のダイナミクスをシミュレートできます。
さらに、外部フィールドを適切に構成することで、訓練された NQP をさまざまなハミルトニアンによって管理されるシステムに転送できます。
スピンボソンと三状態遷移ガンマモデルを研究することで、私たちのアプローチの有効性を実証します。

要約(オリジナル)

Describing the dynamics of strong-laser driven open quantum systems is a very challenging task that requires the solution of highly involved equations of motion. While machine learning techniques are being applied with some success to simulate the time evolution of individual quantum states, their use to approximate time-dependent operators (that can evolve various states) remains largely unexplored. In this work, we develop driven neural quantum propagators (NQP), a universal neural network framework that solves driven-dissipative quantum dynamics by approximating propagators rather than wavefunctions or density matrices. NQP can handle arbitrary initial quantum states, adapt to various external fields, and simulate long-time dynamics, even when trained on far shorter time windows. Furthermore, by appropriately configuring the external fields, our trained NQP can be transferred to systems governed by different Hamiltonians. We demonstrate the effectiveness of our approach by studying the spin-boson and the three-state transition Gamma models.

arxiv情報

著者 Jiaji Zhang,Carlos L. Benavides-Riveros,Lipeng Chen
発行日 2024-10-21 15:13:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, physics.chem-ph, quant-ph | Neural Quantum Propagators for Driven-Dissipative Quantum Dynamics はコメントを受け付けていません

TabSeq: A Framework for Deep Learning on Tabular Data via Sequential Ordering

要約

表形式データの効果的な分析は、深層学習において依然として重大な問題を引き起こしています。これは主に、表形式データセットの特徴が異種であることが多く、関連性のレベルが異なるためです。
この研究では、特徴を順番に並べるための新しいフレームワークである TabSeq を導入し、学習プロセスを最適化するという重要なニーズに対処します。
特徴は常に同じように情報を提供するとは限らず、特定の深層学習モデルでは、そのランダムな配置がモデルの学習能力を妨げる可能性があります。
このような特徴の最適なシーケンス順序を見つけることで、深層学習モデルの学習プロセスを改善できる可能性があります。
この研究で提供する新しい特徴順序付け手法はクラスタリングに基づいており、ローカル順序付けとグローバル順序付けの両方が組み込まれています。
これは、ノイズ除去オートエンコーダー ネットワークでマルチヘッド アテンション メカニズムとともに使用するように設計されています。
私たちのフレームワークはクラスタリングを使用して、同等の機能を調整し、データ構成を改善します。
マルチヘッド アテンションは本質的な特性に焦点を当てますが、ノイズ除去オートエンコーダーは歪んだ入力から再構築することで重要な側面を強調します。
この方法により、冗長性を低下させながら、表形式のデータから学習する機能が向上します。
私たちの研究では、生の抗体マイクロアレイと他の 2 つの実際の生物医学データセットを使用した適切な特徴配列の再配置によるパフォーマンスの向上を実証し、特徴の順序付けの影響を検証しています。
これらの結果は、特徴の順序付けが表形式データの深層学習を改善するための実行可能なアプローチとなり得ることを示しています。

要約(オリジナル)

Effective analysis of tabular data still poses a significant problem in deep learning, mainly because features in tabular datasets are often heterogeneous and have different levels of relevance. This work introduces TabSeq, a novel framework for the sequential ordering of features, addressing the vital necessity to optimize the learning process. Features are not always equally informative, and for certain deep learning models, their random arrangement can hinder the model’s learning capacity. Finding the optimum sequence order for such features could improve the deep learning models’ learning process. The novel feature ordering technique we provide in this work is based on clustering and incorporates both local ordering and global ordering. It is designed to be used with a multi-head attention mechanism in a denoising autoencoder network. Our framework uses clustering to align comparable features and improve data organization. Multi-head attention focuses on essential characteristics, whereas the denoising autoencoder highlights important aspects by rebuilding from distorted inputs. This method improves the capability to learn from tabular data while lowering redundancy. Our research, demonstrating improved performance through appropriate feature sequence rearrangement using raw antibody microarray and two other real-world biomedical datasets, validates the impact of feature ordering. These results demonstrate that feature ordering can be a viable approach to improved deep learning of tabular data.

arxiv情報

著者 Al Zadid Sultan Bin Habib,Kesheng Wang,Mary-Anne Hartley,Gianfranco Doretto,Donald A. Adjeroh
発行日 2024-10-21 15:21:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | TabSeq: A Framework for Deep Learning on Tabular Data via Sequential Ordering はコメントを受け付けていません

Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts)

要約

Explainable AI for the Arts (XAIxArts) に関するこの 2 回目の国際ワークショップでは、HCI、インタラクション デザイン、AI、Explainable AI (XAI)、デジタル アートの研究者コミュニティが集まり、XAI for the Arts の役割を探りました。
米国シカゴの第 16 回 ACM Conference on Creativity and Cognition (C&C 2024) で開催されたワークショップ。

要約(オリジナル)

This second international workshop on explainable AI for the Arts (XAIxArts) brought together a community of researchers in HCI, Interaction Design, AI, explainable AI (XAI), and digital arts to explore the role of XAI for the Arts. Workshop held at the 16th ACM Conference on Creativity and Cognition (C&C 2024), Chicago, USA.

arxiv情報

著者 Nick Bryan-Kinns,Corey Ford,Shuoyang Zheng,Helen Kennedy,Alan Chamberlain,Makayla Lewis,Drew Hemment,Zijin Li,Qiong Wu,Lanxi Xiao,Gus Xia,Jeba Rezwana,Michael Clemens,Gabriel Vigliensoni
発行日 2024-10-21 15:24:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.MM, cs.SD, eess.AS | Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) はコメントを受け付けていません

Feature Mapping in Physics-Informed Neural Networks (PINNs)

要約

この論文では、制限付き共役カーネルとニューラル タンジェント カーネルを介した特徴マッピング層による PINN のトレーニング ダイナミクスを調査し、PINN の収束に光を当てます。
一般的に使用されているフーリエベースの特徴マッピングは大きな成功を収めていますが、いくつかの物理シナリオでは不十分であることが示されています。
これら 2 つのスコープを通じて、条件付き正定放射基底関数をより良い代替手段として提案します。
最後に、ワイド ニューラル ネットワークでの特徴マッピングを数値的に調査します。
私たちの経験的結果は、多様な順方向および逆方向の問題セットにおける私たちの方法の有効性を明らかにしています。
特徴関数を合成することは、表現力と一般化性のトレードオフに対処する実用的な方法であることがわかりました。つまり、カーネルの帯域幅と特徴マッピング関数の全射性を調整することです。
この単純な手法は座標入力に実装でき、広範な PINN 研究に役立ちます。

要約(オリジナル)

In this paper, the training dynamics of PINNs with a feature mapping layer via the limiting Conjugate Kernel and Neural Tangent Kernel is investigated, shedding light on the convergence of PINNs; Although the commonly used Fourier-based feature mapping has achieved great success, we show its inadequacy in some physics scenarios. Via these two scopes, we propose conditionally positive definite Radial Basis Function as a better alternative. Lastly, we explore the feature mapping numerically in wide neural networks. Our empirical results reveal the efficacy of our method in diverse forward and inverse problem sets. Composing feature functions is found to be a practical way to address the expressivity and generalisability trade-off, viz., tuning the bandwidth of the kernels and the surjectivity of the feature mapping function. This simple technique can be implemented for coordinate inputs and benefits the broader PINNs research.

arxiv情報

著者 Chengxi Zeng,Tilo Burghardt,Alberto M Gambaruto
発行日 2024-10-21 15:26:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.LG | Feature Mapping in Physics-Informed Neural Networks (PINNs) はコメントを受け付けていません

Addressing Spectral Bias of Deep Neural Networks by Multi-Grade Deep Learning

要約

ディープ ニューラル ネットワーク (DNN) はスペクトル バイアスに悩まされており、DNN は通常、関数の低周波成分の学習を優先する傾向があり、高周波の特徴を捕捉するのに苦労します。
この文書はこの問題に対処するものです。
低周波成分のみを持つ関数は、少数の層しか持たないネットワークであるシャロー ニューラル ネットワーク (SNN) によって適切に表現できる場合があることに注意してください。
低周波関数の合成が高周波関数を効果的に近似できることを観察することにより、それぞれが与えられたデータから特定の低周波情報を学習する複数の SNN を合成することにより、高周波成分を含む関数を学習することを提案します。
提案されたアイデアは、マルチグレード ディープ ラーニング (MGDL) モデルを利用して実装されます。MGDL モデルは、DNN を学年ごとに段階的にトレーニングし、前の学年の残りから現在の学年を学習し、SNN で構成された SNN のみを学習する最近導入されたモデルです。
前の学年で特徴として訓練されました。
MGDL を合成、多様体、カラー画像、および MNIST データセットに適用します。これらはすべて、高周波特徴の存在によって特徴付けられます。
私たちの調査では、MGDL が高周波情報を含む関数の表現に優れていることが明らかになりました。
具体的には、各学年で学習したニューラル ネットワークは一部の低周波情報を適切に捕捉し、前の学年で学習した SNN と組み合わせて高周波の特徴を効果的に表現することができます。
私たちの実験結果は、DNN に固有のスペクトル バイアスに対処する際の MGDL の有効性を強調しています。
MGDL を活用することで、DNN のスペクトル バイアス制限を克服するための洞察を提供し、それによって高周波情報の表現を必要とするタスクにおける深層学習モデルのパフォーマンスと適用性を強化します。
この研究は、提案された方法が DNN のスペクトル バイアスに対処するための有望な解決策を提供することを確認しています。

要約(オリジナル)

Deep neural networks (DNNs) suffer from the spectral bias, wherein DNNs typically exhibit a tendency to prioritize the learning of lower-frequency components of a function, struggling to capture its high-frequency features. This paper is to address this issue. Notice that a function having only low frequency components may be well-represented by a shallow neural network (SNN), a network having only a few layers. By observing that composition of low frequency functions can effectively approximate a high-frequency function, we propose to learn a function containing high-frequency components by composing several SNNs, each of which learns certain low-frequency information from the given data. We implement the proposed idea by exploiting the multi-grade deep learning (MGDL) model, a recently introduced model that trains a DNN incrementally, grade by grade, a current grade learning from the residue of the previous grade only an SNN composed with the SNNs trained in the preceding grades as features. We apply MGDL to synthetic, manifold, colored images, and MNIST datasets, all characterized by presence of high-frequency features. Our study reveals that MGDL excels at representing functions containing high-frequency information. Specifically, the neural networks learned in each grade adeptly capture some low-frequency information, allowing their compositions with SNNs learned in the previous grades effectively representing the high-frequency features. Our experimental results underscore the efficacy of MGDL in addressing the spectral bias inherent in DNNs. By leveraging MGDL, we offer insights into overcoming spectral bias limitation of DNNs, thereby enhancing the performance and applicability of deep learning models in tasks requiring the representation of high-frequency information. This study confirms that the proposed method offers a promising solution to address the spectral bias of DNNs.

arxiv情報

著者 Ronglong Fang,Yuesheng Xu
発行日 2024-10-21 15:34:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Addressing Spectral Bias of Deep Neural Networks by Multi-Grade Deep Learning はコメントを受け付けていません

SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation

要約

有向非巡回グラフ (DAG) の条件付き生成のための半自己回帰拡散モデルである SeaDAG を紹介します。
固有の層ごとの構造を考慮して、層ごとに異なるノイズ除去速度を設計することにより、層ごとの自己回帰生成をシミュレートします。
グローバルなグラフ構造ビューを持たない従来の自己回帰生成とは異なり、私たちの方法は各拡散ステップで完全なグラフ構造を維持し、完全なグラフ構造を必要とするプロパティ制御などの操作を可能にします。
この機能を利用して、グラフ プロパティ デコーダーを使用してトレーニング中に DAG プロパティを評価します。
条件損失を伴うグラフ条件付けを学習するようにモデルを明示的にトレーニングします。これにより、現実的で指定されたプロパティに合わせたグラフを生成する拡散モデルの能力が強化されます。
我々は、2 つの代表的な条件付き DAG 生成タスクでメソッドを評価します。(1) 回路機能を実現するには正確な DAG 構造が重要である真理値表からの回路生成、および (2) 量子特性に基づく分子生成です。
私たちのアプローチは有望な結果を示し、特定の条件に厳密に一致する高品質で現実的な DAG を生成します。

要約(オリジナル)

We introduce SeaDAG, a semi-autoregressive diffusion model for conditional generation of Directed Acyclic Graphs (DAGs). Considering their inherent layer-wise structure, we simulate layer-wise autoregressive generation by designing different denoising speed for different layers. Unlike conventional autoregressive generation that lacks a global graph structure view, our method maintains a complete graph structure at each diffusion step, enabling operations such as property control that require the full graph structure. Leveraging this capability, we evaluate the DAG properties during training by employing a graph property decoder. We explicitly train the model to learn graph conditioning with a condition loss, which enhances the diffusion model’s capacity to generate graphs that are both realistic and aligned with specified properties. We evaluate our method on two representative conditional DAG generation tasks: (1) circuit generation from truth tables, where precise DAG structures are crucial for realizing circuit functionality, and (2) molecule generation based on quantum properties. Our approach demonstrates promising results, generating high-quality and realistic DAGs that closely align with given conditions.

arxiv情報

著者 Xinyi Zhou,Xing Li,Yingzhao Lian,Yiwen Wang,Lei Chen,Mingxuan Yuan,Jianye Hao,Guangyong Chen,Pheng Ann Heng
発行日 2024-10-21 15:47:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation はコメントを受け付けていません