要約
拡散モデル (DM) の強力な生成機能を活用して意思決定エージェントを構築することは、大きな成功を収めています。
しかし、DM ベースの意思決定アルゴリズムのカスタマイズされた効率的な開発を提供する、使いやすくモジュール化されたオープンソース ライブラリに対する需要は依然として存在します。
この作業では、意思決定アルゴリズム用に特別に設計された初の DM ライブラリである CleanDiffuser を紹介します。
意思決定ドメインにおける DM の役割を再検討することで、CleanDiffuser の中核を構成する一連の重要なサブモジュールを特定し、シンプルで柔軟な構成要素を備えたさまざまな DM アルゴリズムの実装を可能にします。
CleanDiffuser の信頼性と柔軟性を実証するために、広範囲のタスクにわたって CleanDiffuser で実装されたさまざまな DM アルゴリズムの包括的な評価を実施します。
分析実験は、豊富な貴重な設計の選択肢と洞察を提供し、機会と課題を明らかにし、将来の研究のための強固な基礎を築きます。
CleanDiffuser は、意思決定コミュニティに長期的なサポートを提供し、再現性を高め、より堅牢なソリューションの開発を促進します。
CleanDiffuser のコードとドキュメントは、https://github.com/CleanDiffuserTeam/CleanDiffuser でオープンソース化されています。
要約(オリジナル)
Leveraging the powerful generative capability of diffusion models (DMs) to build decision-making agents has achieved extensive success. However, there is still a demand for an easy-to-use and modularized open-source library that offers customized and efficient development for DM-based decision-making algorithms. In this work, we introduce CleanDiffuser, the first DM library specifically designed for decision-making algorithms. By revisiting the roles of DMs in the decision-making domain, we identify a set of essential sub-modules that constitute the core of CleanDiffuser, allowing for the implementation of various DM algorithms with simple and flexible building blocks. To demonstrate the reliability and flexibility of CleanDiffuser, we conduct comprehensive evaluations of various DM algorithms implemented with CleanDiffuser across an extensive range of tasks. The analytical experiments provide a wealth of valuable design choices and insights, reveal opportunities and challenges, and lay a solid groundwork for future research. CleanDiffuser will provide long-term support to the decision-making community, enhancing reproducibility and fostering the development of more robust solutions. The code and documentation of CleanDiffuser are open-sourced on the https://github.com/CleanDiffuserTeam/CleanDiffuser.
arxiv情報
著者 | Zibin Dong,Yifu Yuan,Jianye Hao,Fei Ni,Yi Ma,Pengyi Li,Yan Zheng |
発行日 | 2024-06-13 18:00:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google