要約
状態空間モデル(SSM)は、人気のある変圧器ベースのモデルの有望な代替品として浮上しており、ますます注目を集めています。
トランスと比較して、SSMSは順次データまたはより長いコンテキストを備えたタスクで優れており、有意な効率性の高いパフォーマンスを示しています。
この調査では、理論的動機、数学的定式化、既存のモデルクラスとの比較、さまざまなアプリケーションなど、SSMのコヒーレントで体系的な概要を提供します。
SSMシリーズを3つの主要なセクションに分割し、元のSSM、S4で表される構造化されたSSM、およびMAMBAに代表される選択的SSMの詳細な紹介を提供します。
技術に重点を置き、SSMの有効性と効率に対処するために導入されたさまざまな重要な技術を強調します。
この原稿が、研究者がSSMの理論的基盤を探求するための紹介として役立つことを願っています。
要約(オリジナル)
State Space Models (SSMs) have emerged as a promising alternative to the popular transformer-based models and have been increasingly gaining attention. Compared to transformers, SSMs excel at tasks with sequential data or longer contexts, demonstrating comparable performances with significant efficiency gains. In this survey, we provide a coherent and systematic overview for SSMs, including their theoretical motivations, mathematical formulations, comparison with existing model classes, and various applications. We divide the SSM series into three main sections, providing a detailed introduction to the original SSM, the structured SSM represented by S4, and the selective SSM typified by Mamba. We put an emphasis on technicality, and highlight the various key techniques introduced to address the effectiveness and efficiency of SSMs. We hope this manuscript serves as an introduction for researchers to explore the theoretical foundations of SSMs.
arxiv情報
著者 | Xingtai Lv,Youbang Sun,Kaiyan Zhang,Shang Qu,Xuekai Zhu,Yuchen Fan,Yi Wu,Ermo Hua,Xinwei Long,Ning Ding,Bowen Zhou |
発行日 | 2025-03-14 09:20:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google