Multiple Linked Tensor Factorization

要約

生物医学研究およびその他の分野では、マルチソースとマルチウェイの両方である高いコンテンツデータを生成することが一般的です。
マルチソースデータはさまざまなハイスループットテクノロジーから収集され、マルチウェイデータは複数の寸法で収集され、複数のテンソルアレイが生成されます。
これらのデータセットの統合分析は、例えば、複雑な生物学的システムのさまざまな側面をキャプチャして合成するために必要です。
ただし、マルチソースおよびマルチウェイ因数分解技術への関心が高まっているにもかかわらず、マルチソースとマルチウェイの両方のデータを処理できる方法は限られています。
この作業では、CandComp/Parafac(CP)分解を拡張する複数のリンクされたテンソル因子化(MultiFAC)メソッドを提案して、複数のマルチウェイアレイの次元と近似基本信号の次元を減少させます。
最初に、潜在因子にL2ペナルティを備えたCP因数分解のバージョンを導入し、ランクスパースにつながります。
複数のリンクされたテンソルに拡張されると、この方法は、各データソースにデータソースまたは個別に共有される潜在コンポーネントを自動的に明らかにします。
また、分解アルゴリズムをその期待最大化(EM)バージョンに拡張して、不完全なデータを代入して処理します。
マルチファックの能力を実証するために、広範なシミュレーション研究が実施され、(i)根本的な信号を近似し、(ii)共有構造と非共有構造を特定し、(iii)欠落データを帰属させる。
このアプローチは、初期の鉄欠乏に関する研究のために、マルチウェイマルチオミクスデータの解釈可能な分解をもたらします。

要約(オリジナル)

In biomedical research and other fields, it is now common to generate high content data that are both multi-source and multi-way. Multi-source data are collected from different high-throughput technologies while multi-way data are collected over multiple dimensions, yielding multiple tensor arrays. Integrative analysis of these data sets is needed, e.g., to capture and synthesize different facets of complex biological systems. However, despite growing interest in multi-source and multi-way factorization techniques, methods that can handle data that are both multi-source and multi-way are limited. In this work, we propose a Multiple Linked Tensors Factorization (MULTIFAC) method extending the CANDECOMP/PARAFAC (CP) decomposition to simultaneously reduce the dimension of multiple multi-way arrays and approximate underlying signal. We first introduce a version of the CP factorization with L2 penalties on the latent factors, leading to rank sparsity. When extended to multiple linked tensors, the method automatically reveals latent components that are shared across data sources or individual to each data source. We also extend the decomposition algorithm to its expectation-maximization (EM) version to handle incomplete data with imputation. Extensive simulation studies are conducted to demonstrate MULTIFAC’s ability to (i) approximate underlying signal, (ii) identify shared and unshared structures, and (iii) impute missing data. The approach yields an interpretable decomposition on multi-way multi-omics data for a study on early-life iron deficiency.

arxiv情報

著者 Zhiyu Kang,Raghavendra B. Rao,Eric F. Lock
発行日 2025-02-27 17:12:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO, stat.ME, stat.ML | Multiple Linked Tensor Factorization はコメントを受け付けていません

Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization

要約

マルチエージェント強化学習(MARL)タスクは、分散型実行(CTDE)フレームワークを使用した集中トレーニングを利用します。
Qmixは、グローバルバリュー関数からローカルバリュー関数を導き出すためのクレジット割り当て関数を学習する成功したCTDEメソッドです。
ただし、QMIXは探査戦略が不十分であることを妨げられています。
最大エントロピー補強学習(RL)は、確率的ポリシーを通じてより良い調査を促進しますが、QMIXのクレジット割り当てプロセスは最大エントロピー目標と分散化された実行要件と競合し、最大エントロピーRLに適していません。
この論文では、最大エントロピーRLフレームワーク内に追加のローカルQ値学習方法を組み込むことにより、QMIXの強化を提案します。
私たちのアプローチは、ローカルQ値の推定値を制約して、すべてのアクションの正しい順序を維持します。
QMIX値関数の単調性により、これらの更新により、局所的に最適なアクションがグローバルに最適なアクションと一致することが保証されます。
理論的には、最適なソリューションへの方法の単調な改善と収束を証明します。
実験的に、マトリックスゲーム、マルチエージェント粒子環境のアルゴリズムを検証し、SMAC-V2で最先端のパフォーマンスを実証します。

要約(オリジナル)

Multi-agent reinforcement learning (MARL) tasks often utilize a centralized training with decentralized execution (CTDE) framework. QMIX is a successful CTDE method that learns a credit assignment function to derive local value functions from a global value function, defining a deterministic local policy. However, QMIX is hindered by its poor exploration strategy. While maximum entropy reinforcement learning (RL) promotes better exploration through stochastic policies, QMIX’s process of credit assignment conflicts with the maximum entropy objective and the decentralized execution requirement, making it unsuitable for maximum entropy RL. In this paper, we propose an enhancement to QMIX by incorporating an additional local Q-value learning method within the maximum entropy RL framework. Our approach constrains the local Q-value estimates to maintain the correct ordering of all actions. Due to the monotonicity of the QMIX value function, these updates ensure that locally optimal actions align with globally optimal actions. We theoretically prove the monotonic improvement and convergence of our method to an optimal solution. Experimentally, we validate our algorithm in matrix games, Multi-Agent Particle Environment and demonstrate state-of-the-art performance in SMAC-v2.

arxiv情報

著者 Wentse Chen,Shiyu Huang,Jeff Schneider
発行日 2025-02-27 17:16:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization はコメントを受け付けていません

Scalable Graph Attention-based Instance Selection via Mini-Batch Sampling and Hierarchical Hashing

要約

インスタンスの選択(IS)は、重要な特性を維持しながらデータセットサイズを削減するために機械学習において重要です。
電流は、多くの場合、高次元の空間で複雑な関係をキャプチャするのに苦労し、大きなデータセットを使用してスケーリングします。
このペーパーでは、グラフ表現における構造的関係を通じて、注意メカニズムを使用して有益なインスタンスを特定するグラフ注意ベースのインスタンス選択(GAIS)メソッドを紹介します。
スケーラブルなグラフ構造のための2つのアプローチを提示します。戦略的バッチ処理を介した計算を削減する距離ベースのミニバッチサンプリング手法と、ランダム投影を介した効率的な類似性計算を可能にする階層ハッシュアプ​​ローチです。
ミニバッチアプローチは、層別サンプリングを通じてクラスの分布を維持し、階層ハッシュメソッドは、単一レベル、マルチレベル、およびマルチビューバリアントを通じて複数の粒度での関係をキャプチャします。
39のデータセットの実験では、GAIが最先端のISメソッドと比較してモデルのパフォーマンスを維持または改善しながら、96 \%を超える削減率を達成することが示されています。
調査結果は、距離ベースのミニバッチアプローチが大規模なデータセットの効率と有効性の最適なバランスを提供し、マルチビューバリアントは複雑で高次元のデータに対して優れたパフォーマンスを提供し、注意に基づく重要性のスコアリングが、網羅的なペアワイズ比較を必要とせずに意思決定境界を維持するために重要なインスタンスを効果的に識別できることを示しています。

要約(オリジナル)

Instance selection (IS) is important in machine learning for reducing dataset size while keeping key characteristics. Current IS methods often struggle with capturing complex relationships in high-dimensional spaces and scale with large datasets. This paper introduces a graph attention-based instance selection (GAIS) method that uses attention mechanisms to identify informative instances through their structural relationships in graph representations. We present two approaches for scalable graph construction: a distance-based mini-batch sampling technique that reduces computation through strategic batch processing, and a hierarchical hashing approach that allows for efficient similarity computation through random projections. The mini-batch approach keeps class distributions through stratified sampling, while the hierarchical hashing method captures relationships at multiple granularities through single-level, multi-level, and multi-view variants. Experiments across 39 datasets show that GAIS achieves reduction rates above 96\% while maintaining or improving model performance relative to state-of-the-art IS methods. The findings shows that the distance-based mini-batch approach offers an optimal balance of efficiency and effectiveness for large-scale datasets, while multi-view variants provide superior performance for complex, high-dimensional data, demonstrating that attention-based importance scoring can effectively identify instances crucial for maintaining decision boundaries without requiring exhaustive pairwise comparisons.

arxiv情報

著者 Zahiriddin Rustamov,Ayham Zaitouny,Nazar Zaki
発行日 2025-02-27 17:17:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Scalable Graph Attention-based Instance Selection via Mini-Batch Sampling and Hierarchical Hashing はコメントを受け付けていません

Uncertainty Herding: One Active Learning Method for All Label Budgets

要約

ほとんどのアクティブな学習研究は、多くのラベルが利用可能な場合にうまく機能する方法に焦点を当てていますが、ラベルの予算が小さい場合はランダム選択よりも劇的に悪化する可能性があります。
他の方法は低予算体制に焦点を合わせていますが、ラベルの予算が増加するにつれて不十分に行います。
「低」と「高」予算の境界線は問題によって異なるため、これは実際には深刻な問題です。
不確実性のカバレッジを提案します。これは、さまざまな低予算および高予算の目標を一般的に一般化する目的、および低予算体制と高予算体制の間をスムーズに補間するための自然なハイパーパラメーター光の方法です。
推定不確実性の群れの貪欲な最適化を呼び出します。
この単純な方法は計算高速であり、流通レベルのカバレッジをほぼ最適化することを証明します。
さまざまなアクティブな学習タスクにわたる実験的検証において、私たちの提案は、本質的にすべての場合に最先端のパフォーマンスに一致するか、打ち負かします。
これは、低予算と高予算の両方の設定で確実にうまく機能することを認識している唯一の方法です。

要約(オリジナル)

Most active learning research has focused on methods which perform well when many labels are available, but can be dramatically worse than random selection when label budgets are small. Other methods have focused on the low-budget regime, but do poorly as label budgets increase. As the line between ‘low’ and ‘high’ budgets varies by problem, this is a serious issue in practice. We propose uncertainty coverage, an objective which generalizes a variety of low- and high-budget objectives, as well as natural, hyperparameter-light methods to smoothly interpolate between low- and high-budget regimes. We call greedy optimization of the estimate Uncertainty Herding; this simple method is computationally fast, and we prove that it nearly optimizes the distribution-level coverage. In experimental validation across a variety of active learning tasks, our proposal matches or beats state-of-the-art performance in essentially all cases; it is the only method of which we are aware that reliably works well in both low- and high-budget settings.

arxiv情報

著者 Wonho Bae,Gabriel L. Oliveira,Danica J. Sutherland
発行日 2025-02-27 17:33:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Uncertainty Herding: One Active Learning Method for All Label Budgets はコメントを受け付けていません

Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications

要約

航空交通管制(ATC)における効果的なコミュニケーションは、航空の安全性を維持するために重要ですが、アクセントされた英語によってもたらされる課題は、自動音声認識(ASR)システムではほとんど対処されていないままです。
既存のモデルは、特に騒々しいATC環境で、東南アジアのアクセント(海洋アクセント)スピーチの転写精度と格闘しています。
この研究では、新しく作成されたデータセットを使用して、東南アジアのアクセント専用に微調整されたASRモデルの開発を示しています。
私たちの研究は大幅な改善を達成し、0.0982または9.82%の単語エラー率(WER)を達成しました。
さらに、このペーパーでは、地域固有のデータセットとアクセント中心のトレーニングの重要性を強調し、リソースに制約のある軍事作戦にASRシステムを展開するための経路を提供します。
調査結果は、ATC通信における非西洋アクセントの転写精度を改善するために、ノイズロビートレーニング技術と地域固有のデータセットの必要性を強調しています。

要約(オリジナル)

Effective communication in Air Traffic Control (ATC) is critical to maintaining aviation safety, yet the challenges posed by accented English remain largely unaddressed in Automatic Speech Recognition (ASR) systems. Existing models struggle with transcription accuracy for Southeast Asian-accented (SEA-accented) speech, particularly in noisy ATC environments. This study presents the development of ASR models fine-tuned specifically for Southeast Asian accents using a newly created dataset. Our research achieves significant improvements, achieving a Word Error Rate (WER) of 0.0982 or 9.82% on SEA-accented ATC speech. Additionally, the paper highlights the importance of region-specific datasets and accent-focused training, offering a pathway for deploying ASR systems in resource-constrained military operations. The findings emphasize the need for noise-robust training techniques and region-specific datasets to improve transcription accuracy for non-Western accents in ATC communications.

arxiv情報

著者 Marcus Yu Zhe Wee,Justin Juin Hng Wong,Lynus Lim,Joe Yu Wei Tan,Prannaya Gupta,Dillion Lim,En Hao Tew,Aloysius Keng Siew Han,Yong Zhi Lim
発行日 2025-02-27 17:35:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SD, eess.AS | Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications はコメントを受け付けていません

Adversarial Robustness in Parameter-Space Classifiers

要約

暗黙の神経表現(INR)は最近、主にコンパクトで継続的な方法で大規模で複雑なデータを表現する能力のために、さまざまな研究分野への関心の高まりを獲得しています。
過去の作業はさらに、多数の一般的な下流タスクをINRパラメータースペースで直接実行できることを示しました。
そうすることで、ネイティブドメインで表現されたデータを処理するために必要な計算リソースを大幅に削減できます。
現代の機械学習アプローチを使用することの主な困難は、敵対的な攻撃に対する感受性が高いことです。これは、幅広い設定でのそのような方法の信頼性と適用性を大幅に制限することが示されています。
この作業では、分類のためにトレーニングされたパラメーター空間モデルは、堅牢なトレーニングを必要とせずに、本質的に敵対的な攻撃に対して堅牢であることを示します。
私たちの主張をサポートするために、パラメーター空間分類子をターゲットとする一連の敵対的な攻撃を開発し、さらに攻撃パラメーター空間分類子の実用的な考慮事項を分析します。
すべての実験を再現するためのコードと提案されたすべての方法の実装は、公開時にリリースされます。

要約(オリジナル)

Implicit Neural Representations (INRs) have been recently garnering increasing interest in various research fields, mainly due to their ability to represent large, complex data in a compact and continuous manner. Past work further showed that numerous popular downstream tasks can be performed directly in the INR parameter-space. Doing so can substantially reduce the computational resources required to process the represented data in their native domain. A major difficulty in using modern machine-learning approaches, is their high susceptibility to adversarial attacks, which have been shown to greatly limit the reliability and applicability of such methods in a wide range of settings. In this work, we show that parameter-space models trained for classification are inherently robust to adversarial attacks — without the need of any robust training. To support our claims, we develop a novel suite of adversarial attacks targeting parameter-space classifiers, and furthermore analyze practical considerations of attacking parameter-space classifiers. Code for reproducing all experiments and implementation of all proposed methods will be released upon publication.

arxiv情報

著者 Tamir Shor,Ethan Fetaya,Chaim Baskin,Alex Bronstein
発行日 2025-02-27 17:41:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Adversarial Robustness in Parameter-Space Classifiers はコメントを受け付けていません

Impilict Runge-Kutta based sparse identification of governing equations in biologically motivated systems

要約

データセットから物理システムおよび生物学的システムの統治方程式を特定することは、さまざまな科学分野にわたる長年の課題であり、複雑なシステムの進化に関する機械的洞察を提供します。
非線形ダイナミクス(SINDY)のまばらな識別などの一般的な方法は、多くの場合、正確な派生的推定に依存しており、データの希少性と騒音に対して脆弱になります。
この研究では、高次の暗黙的なRunge-Kuttaメソッド(IRK)とIRK-SINDYと呼ばれるまばらな識別と統合することにより、新しいデータ駆動型フレームワークを提示します。
フレームワークは、Irksのより低いステップサイズの制約を活用することにより、データの希少性とノイズに対する顕著な堅牢性を示します。
irkをまばらな回帰に組み込むための2つの方法が導入されています。1つは、方程式の非線形代数システムを数値的に解くための反復スキームを使用し、もう1つは深いニューラルネットワークを利用してIRKの段階値を予測します。
IRK-SINDYのパフォーマンスは、線形および非線形発振器、ロレンツシステム、および捕食者とプレーのダイナミクス、ロジスティック成長、フィッツハフ – ナグモモデルなどのさまざまな動的動作のベンチマーク問題に関する数値実験を通じて実証されています。
結果は、IRK-SINDYが従来のシンディとRK4-SINDYフレームワーク、特に極端なデータ不足と騒音の条件下で、解釈可能で一般化可能なモデルを生み出すことを示しています。

要約(オリジナル)

Identifying governing equations in physical and biological systems from datasets remains a long-standing challenge across various scientific disciplines, providing mechanistic insights into complex system evolution. Common methods like sparse identification of nonlinear dynamics (SINDy) often rely on precise derivative estimations, making them vulnerable to data scarcity and noise. This study presents a novel data-driven framework by integrating high order implicit Runge-Kutta methods (IRKs) with the sparse identification, termed IRK-SINDy. The framework exhibits remarkable robustness to data scarcity and noise by leveraging the lower stepsize constraint of IRKs. Two methods for incorporating IRKs into sparse regression are introduced: one employs iterative schemes for numerically solving nonlinear algebraic system of equations, while the other utilizes deep neural networks to predict stage values of IRKs. The performance of IRK-SINDy is demonstrated through numerical experiments on benchmark problems with varied dynamical behaviors, including linear and nonlinear oscillators, the Lorenz system, and biologically relevant models like predator-prey dynamics, logistic growth, and the FitzHugh-Nagumo model. Results indicate that IRK-SINDy outperforms conventional SINDy and the RK4-SINDy framework, particularly under conditions of extreme data scarcity and noise, yielding interpretable and generalizable models.

arxiv情報

著者 Mehrdad Anvari,Hamidreza Marasi,Hossein Kheiri
発行日 2025-02-27 17:44:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 37N25, 65K05, 68T07, 92C42, 93B30, cs.LG, cs.NA, math.DS, math.NA, q-bio.QM | Impilict Runge-Kutta based sparse identification of governing equations in biologically motivated systems はコメントを受け付けていません

Safety Representations for Safer Policy Learning

要約

補強学習アルゴリズムは通常、最適なポリシーを見つけるために、状態空間を広​​範囲に探求する必要があります。
ただし、安全性が批判的なアプリケーションでは、そのような調査に関連するリスクは壊滅的な結果につながる可能性があります。
既存の安全な探査方法は、制約を課すことでこれを軽減しようとします。これは、しばしば過度に保守的な行動と非効率的な学習をもたらすことができます。
早期制約違反に対する重い罰則は、地元のオプティマにエージェントを閉じ込め、国家空間の危険でありながら高報酬地域の探求を阻止することができます。
これに対処するために、州で条件付けされた安全表現を明示的に学習する方法を紹介します。
これらの安全表現で国家の特徴を強化することにより、私たちのアプローチは、過度に注意を払うことなく、より安全な探索を自然に奨励し、安全性が批判的なシナリオでより効率的で安全な政策学習をもたらします。
多様な環境にわたる経験的評価は、私たちの方法がタスクのパフォーマンスを大幅に改善しながら、トレーニング中の制約違反を減らし、調査と安全性とのバランスをとる際のその有効性を強調することを示しています。

要約(オリジナル)

Reinforcement learning algorithms typically necessitate extensive exploration of the state space to find optimal policies. However, in safety-critical applications, the risks associated with such exploration can lead to catastrophic consequences. Existing safe exploration methods attempt to mitigate this by imposing constraints, which often result in overly conservative behaviours and inefficient learning. Heavy penalties for early constraint violations can trap agents in local optima, deterring exploration of risky yet high-reward regions of the state space. To address this, we introduce a method that explicitly learns state-conditioned safety representations. By augmenting the state features with these safety representations, our approach naturally encourages safer exploration without being excessively cautious, resulting in more efficient and safer policy learning in safety-critical scenarios. Empirical evaluations across diverse environments show that our method significantly improves task performance while reducing constraint violations during training, underscoring its effectiveness in balancing exploration with safety.

arxiv情報

著者 Kaustubh Mani,Vincent Mai,Charlie Gauthier,Annie Chen,Samer Nashed,Liam Paull
発行日 2025-02-27 18:10:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Safety Representations for Safer Policy Learning はコメントを受け付けていません

Improving the Efficiency of a Deep Reinforcement Learning-Based Power Management System for HPC Clusters Using Curriculum Learning

要約

高エネルギー消費量は、高性能コンピューティング(HPC)システムの重要な課題であり、多くの場合、アイドルモードやスタンバイモードでも大きなパワーを引き出す数百または数千のノードを備えています。
未使用のノードを電源で動作させるとエネルギー効率が向上する可能性がありますが、そうするために間違った時間を選択すると、ジョブの実行を遅らせることでサービス品質を低下させる可能性があります。
機械学習、特に強化学習(RL)は、ノードをオンまたはオフにするための最適な時間を決定することを約束しています。
この研究では、カリキュラム学習(CL)を統合することにより、HPC電力管理のディープ補強学習(DRL)エージェントのパフォーマンスを強化します。これは、徐々に困難を増やすタスクを導入するトレーニングアプローチです。
Batsim-Pyシミュレーションフレームワークを使用して、提案されたCLベースのエージェントをベースラインDRLメソッド(CLなし)と従来の固定タイムタイムアウト戦略の両方と比較します。
実験結果は、無駄なエネルギー使用量を削減するという点で、ハードが簡単なカリキュラムが他のトレーニング注文を上回ることを確認しています。
ベストエージェントは、ベースラインDRLメソッドよりも3.73%のエネルギー削減を達成し、最適なタイムアウト構成(アイドル時間の15分ごとにシャットダウン)と比較して4.66%の改善を達成します。
さらに、平均雇用待ち時間を9.24%削減し、より高い求人速度を維持し、より効果的なリソースの利用率を示しています。
さまざまなスイッチオン期間、パワーレベル、クラスターサイズにわたる感度テストにより、再訓練なしでシステムパラメーターの変更に対するエージェントの適応性がさらに明らかになります。
これらの調査結果は、カリキュラム学習がHPCのDRLベースの電力管理を大幅に改善し、エネルギー節約、サービスの質、多様な構成への堅牢性を大幅に改善できることを示しています。

要約(オリジナル)

High energy consumption remains a key challenge in high-performance computing (HPC) systems, which often feature hundreds or thousands of nodes drawing substantial power even in idle or standby modes. Although powering down unused nodes can improve energy efficiency, choosing the wrong time to do so can degrade quality of service by delaying job execution. Machine learning, in particular reinforcement learning (RL), has shown promise in determining optimal times to switch nodes on or off. In this study, we enhance the performance of a deep reinforcement learning (DRL) agent for HPC power management by integrating curriculum learning (CL), a training approach that introduces tasks with gradually increasing difficulty. Using the Batsim-py simulation framework, we compare the proposed CL-based agent to both a baseline DRL method (without CL) and the conventional fixed-time timeout strategy. Experimental results confirm that an easy-to-hard curriculum outperforms other training orders in terms of reducing wasted energy usage. The best agent achieves a 3.73% energy reduction over the baseline DRL method and a 4.66% improvement compared to the best timeout configuration (shutdown every 15 minutes of idle time). In addition, it reduces average job waiting time by 9.24% and maintains a higher job-filling rate, indicating more effective resource utilization. Sensitivity tests across various switch-on durations, power levels, and cluster sizes further reveal the agent’s adaptability to changing system parameters without retraining. These findings demonstrate that curriculum learning can significantly improve DRL-based power management in HPC, balancing energy savings, quality of service, and robustness to diverse configurations.

arxiv情報

著者 Thomas Budiarjo,Santana Yuda Pradata,Kadek Gemilang Santiyuda,Muhammad Alfian Amrizal,Reza Pulungan,Hiroyuki Takizawa
発行日 2025-02-27 18:19:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG | Improving the Efficiency of a Deep Reinforcement Learning-Based Power Management System for HPC Clusters Using Curriculum Learning はコメントを受け付けていません

Geometric Machine Learning on EEG Signals

要約

Brain-Computer Interfaces(BCIS)は変革の可能性を提供しますが、神経信号を解読することは重要な課題をもたらします。
この論文の中核的な前提は、下流のBCI関連ニューラル分類タスクを支援するために、高次元の脳波データに存在する基礎となる低次元の幾何学的構造を解明する方法の実証方法を中心に構築されています。
脳波(EEG)信号処理に関連する2つのパイプラインを示します。(1)個々のEEGチャネルからノイズを除去する予備パイプライン、および(2)EEGチャネルのネットワーク全体で幾何学的構造を発見する下流のマニホールド学習パイプライン。
2つのEEGデータセットを使用して予備検証を実施し、BCI関連の想像上の桁デコード問題のコンテキストでデモンストレーションを配置します。
予備のパイプラインは、注意ベースのEEGろ過ネットワークを使用して、個々のEEGチャネルからクリーン信号を抽出します。
私たちの主要なパイプラインは、高速フーリエ変換、ラプラシアン固有マップ、リッチーの曲率のオリビエの概念によるリッチの流れの離散類似体、および正規化可能なダウンストリーム分類のために高次元マルチチャンネルEEGデータの次元削減を実行するグ​​ラフ畳み込みネットワークを使用します。
当社のシステムは、既存の信号処理と分類ベンチマークで競争力のあるパフォーマンスを実現します。
半合成ニューラル除去で2 dBで0.95を> 0.95の平均検定相関係数と、Digit-and disit-inding-indigit-entingの識別で0.97の下流のEEGベースの分類精度を示します。
結果は予備的であり、幾何学的な機械学習パイプラインは、より広範なフォローアップ研究によって検証されるべきです。
これらの結果をより大きな被験者間サンプルサイズ、異なるハードウェアシステム、およびより広範なユースケースに一般化することが重要です。

要約(オリジナル)

Brain-computer interfaces (BCIs) offer transformative potential, but decoding neural signals presents significant challenges. The core premise of this paper is built around demonstrating methods to elucidate the underlying low-dimensional geometric structure present in high-dimensional brainwave data in order to assist in downstream BCI-related neural classification tasks. We demonstrate two pipelines related to electroencephalography (EEG) signal processing: (1) a preliminary pipeline removing noise from individual EEG channels, and (2) a downstream manifold learning pipeline uncovering geometric structure across networks of EEG channels. We conduct preliminary validation using two EEG datasets and situate our demonstration in the context of the BCI-relevant imagined digit decoding problem. Our preliminary pipeline uses an attention-based EEG filtration network to extract clean signal from individual EEG channels. Our primary pipeline uses a fast Fourier transform, a Laplacian eigenmap, a discrete analog of Ricci flow via Ollivier’s notion of Ricci curvature, and a graph convolutional network to perform dimensionality reduction on high-dimensional multi-channel EEG data in order to enable regularizable downstream classification. Our system achieves competitive performance with existing signal processing and classification benchmarks; we demonstrate a mean test correlation coefficient of >0.95 at 2 dB on semi-synthetic neural denoising and a downstream EEG-based classification accuracy of 0.97 on distinguishing digit- versus non-digit- thoughts. Results are preliminary and our geometric machine learning pipeline should be validated by more extensive follow-up studies; generalizing these results to larger inter-subject sample sizes, different hardware systems, and broader use cases will be crucial.

arxiv情報

著者 Benjamin J. Choi
発行日 2025-02-27 18:19:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Geometric Machine Learning on EEG Signals はコメントを受け付けていません