Nearly Optimal Sample Complexity for Learning with Label Proportions

要約

ラベルの割合(LLP)からの学習を調査します。これは、トレーニングセットの例がバッグにグループ化され、各バッグの集計ラベル値のみが利用可能な部分情報設定です。
部分的な観察性にもかかわらず、目標は、個々の例のレベルでまだ少し後悔することです。
平方損失下でのLLPのサンプルの複雑さについて結果を示し、サンプルの複雑さが本質的に最適であることを示しています。
アルゴリズムの観点から、経験的リスク最小化の慎重に設計されたバリアントと、アドホック分散削減技術と組み合わせた確率勾配降下アルゴリズムに依存しています。
一方では、私たちの理論的結果は、LLPの既存の文献、特にサンプルの複雑さがバッグのサイズに依存する方法で重要な方法で改善します。
一方、いくつかのデータセットでアルゴリズムソリューションを検証し、最近のベースラインに対する経験的パフォーマンスの改善(より少ないサンプルの精度)を示しています。

要約(オリジナル)

We investigate Learning from Label Proportions (LLP), a partial information setting where examples in a training set are grouped into bags, and only aggregate label values in each bag are available. Despite the partial observability, the goal is still to achieve small regret at the level of individual examples. We give results on the sample complexity of LLP under square loss, showing that our sample complexity is essentially optimal. From an algorithmic viewpoint, we rely on carefully designed variants of Empirical Risk Minimization, and Stochastic Gradient Descent algorithms, combined with ad hoc variance reduction techniques. On one hand, our theoretical results improve in important ways on the existing literature on LLP, specifically in the way the sample complexity depends on the bag size. On the other hand, we validate our algorithmic solutions on several datasets, demonstrating improved empirical performance (better accuracy for less samples) against recent baselines.

arxiv情報

著者 Robert Busa-Fekete,Travis Dick,Claudio Gentile,Haim Kaplan,Tomer Koren,Uri Stemmer
発行日 2025-05-08 15:45:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Nearly Optimal Sample Complexity for Learning with Label Proportions はコメントを受け付けていません

From Sleep Staging to Spindle Detection: Evaluating End-to-End Automated Sleep Analysis

要約

マクロ構造(睡眠段階)と微細構造(睡眠スピンドルなど)の両方の要素を含む睡眠分析の自動化は、大規模な睡眠研究を可能にし、評価者間の不一致による分散を減らすことを約束します。
睡眠のステージングやスピンドル検出などの個々のステップは個別に研究されていますが、マルチステップ睡眠分析の自動化の実現可能性は不明のままです。
ここでは、睡眠段階(RobustSleepnet)およびその後のスピンドル検出(SUMOV2)の最先端の機械学習モデルを使用した完全に自動化された分析が、双極性障害の専門家ベースの研究からの所見を再現できるかどうかを評価します。
自動化された分析では、双極性患者と健康なコントロールの間の高速紡錘体密度の有意差を含む、専門家ベースの研究から重要な調査結果を定性的に再現し、数分で手動で完了するのに数ヶ月かかったものを達成しました。
自動分析の結果は、おそらく専門家の評価者間、または評価者とモデル間のバイアスにより、専門家ベースの研究と定量的に異なりましたが、モデルは、睡眠段階とスピンドル検出の両方で評価者間合意以上で個別に実行されました。
私たちの結果は、完全に自動化されたアプローチが大規模な睡眠研究を促進する可能性があることを示しています。
コードを共有し、プライバシーを提供する睡眠分析プラットフォームであるSomnobotを紹介することにより、自動分析で使用されるツールへの公開アクセスを提供しています。

要約(オリジナル)

Automation of sleep analysis, including both macrostructural (sleep stages) and microstructural (e.g., sleep spindles) elements, promises to enable large-scale sleep studies and to reduce variance due to inter-rater incongruencies. While individual steps, such as sleep staging and spindle detection, have been studied separately, the feasibility of automating multi-step sleep analysis remains unclear. Here, we evaluate whether a fully automated analysis using state-of-the-art machine learning models for sleep staging (RobustSleepNet) and subsequent spindle detection (SUMOv2) can replicate findings from an expert-based study of bipolar disorder. The automated analysis qualitatively reproduced key findings from the expert-based study, including significant differences in fast spindle densities between bipolar patients and healthy controls, accomplishing in minutes what previously took months to complete manually. While the results of the automated analysis differed quantitatively from the expert-based study, possibly due to biases between expert raters or between raters and the models, the models individually performed at or above inter-rater agreement for both sleep staging and spindle detection. Our results demonstrate that fully automated approaches have the potential to facilitate large-scale sleep research. We are providing public access to the tools used in our automated analysis by sharing our code and introducing SomnoBot, a privacy-preserving sleep analysis platform.

arxiv情報

著者 Niklas Grieger,Siamak Mehrkanoon,Philipp Ritter,Stephan Bialonski
発行日 2025-05-08 16:07:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP, q-bio.NC | From Sleep Staging to Spindle Detection: Evaluating End-to-End Automated Sleep Analysis はコメントを受け付けていません

Denoising Diffusion Probabilistic Models for Coastal Inundation Forecasting

要約

沿岸の洪水は、コミュニティに重大なリスクをもたらし、潜在的な損傷を軽減するために迅速かつ正確な予測方法を必要とします。
この問題にアプローチするために、拡散モデルの除去に基づいて設計された確率的時空予測法であるDiff-floodを提示します。
diff-floodは、空間的コンテキストと時間的コンテキストの両方を考慮に入れることにより、場所での浸水レベルを予測します。
近隣の場所での浸水レベルとデジタル標高データを空間的コンテキストとして利用します。
コンテキストのタイムウィンドウからの浸水履歴と追加の共変量は、時間的コンテキストとして使用されます。
その後、畳み込みニューラルネットワークと分析メカニズムを使用して、データ内の時空間的ダイナミクスをキャプチャします。
私たちは、沿岸の洪水の影響を強いる地域であるバージニア州東海岸からの沿岸浸水データに関するdiff-floodを訓練し、テストしました。
我々の結果は、DIFF-FLOODは、予測パフォーマンス(2つのパフォーマンスメトリックの点で6%〜64%の改善)とスケーラビリティに関して、既存の予測方法を上回ることを示しています。

要約(オリジナル)

Coastal flooding poses significant risks to communities, necessitating fast and accurate forecasting methods to mitigate potential damage. To approach this problem, we present DIFF-FLOOD, a probabilistic spatiotemporal forecasting method designed based on denoising diffusion models. DIFF-FLOOD predicts inundation level at a location by taking both spatial and temporal context into account. It utilizes inundation levels at neighboring locations and digital elevation data as spatial context. Inundation history from a context time window, together with additional co-variates are used as temporal context. Convolutional neural networks and cross-attention mechanism are then employed to capture the spatiotemporal dynamics in the data. We trained and tested DIFF-FLOOD on coastal inundation data from the Eastern Shore of Virginia, a region highly impacted by coastal flooding. Our results show that, DIFF-FLOOD outperforms existing forecasting methods in terms of prediction performance (6% to 64% improvement in terms of two performance metrics) and scalability.

arxiv情報

著者 Kazi Ashik Islam,Zakaria Mehrab,Mahantesh Halappanavar,Henning Mortveit,Sridhar Katragadda,Jon Derek Loftis,Madhav Marathe
発行日 2025-05-08 16:13:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Denoising Diffusion Probabilistic Models for Coastal Inundation Forecasting はコメントを受け付けていません

On-device Anomaly Detection in Conveyor Belt Operations

要約

コンベアベルトは、生産性に直接影響する長距離にわたってバルク材料の連続的かつ効率的な動きを可能にすることにより、マイニング操作において重要です。
特定のコンベアベルト成分の異常の検出が広く研究されていますが、生産条件の変化や演算子エラーなど、これらの障害の根本原因を特定することは依然として重要です。
マイニングコンベアベルト作業サイクルの継続的な監視はまだ初期段階であり、堅牢なソリューションが必要です。
最近、マイニングコンベアベルトのデューティサイクル操作のための異常検出方法が提案されています。
この研究は、その限られたパフォーマンスと平均化されていない長期的な適切な操作に基づいて、正常および異常な義務サイクルを分類するための2つの新しい方法を提案しています。
提案されているアプローチは、しきい値ベースのデューティサイクル検出メカニズム、手動で抽出された機能、パターンマッチング、および監視された小さな機械学習モデルを使用するパターン認識システムです。
探索された低コンパートルモデルには、意思決定ツリー、ランダムフォレスト、余分な木、極端な勾配ブースト、ガウスナイーブベイズ、多層パーセプロンが含まれます。
前者と提案されたアプローチの包括的な評価は、2つのデータセットで実行されます。
両方の提案された方法は、以前の方法よりも優れており、最良のパフォーマンスアプローチはデータセット依存です。
ヒューリスティックなルールベースのアプローチは、アルゴリズムトレーニングに使用されるのと同じデータセットで最高のパフォーマンスを達成し、通常サイクルで97.3%、異常サイクルで80.2%を達成します。
MLベースのアプローチは、マシンの老化の影響を含むデータセットでより良いパフォーマンスを発揮し、通常サイクルで91.3%、異常サイクルで67.9%を獲得します。
2つの低電力マイクロコントローラーに実装されたこの方法は、推論中に13.3および20.6 $ {\ mu} $ jのエネルギー消費を伴う効率的なリアルタイム動作を実証します。
これらの結果は、検出するための貴重な洞察を提供します…

要約(オリジナル)

Conveyor belts are crucial in mining operations by enabling the continuous and efficient movement of bulk materials over long distances, which directly impacts productivity. While detecting anomalies in specific conveyor belt components has been widely studied, identifying the root causes of these failures, such as changing production conditions and operator errors, remains critical. Continuous monitoring of mining conveyor belt work cycles is still at an early stage and requires robust solutions. Recently, an anomaly detection method for duty cycle operations of a mining conveyor belt has been proposed. Based on its limited performance and unevaluated long-term proper operation, this study proposes two novel methods for classifying normal and abnormal duty cycles. The proposed approaches are pattern recognition systems that make use of threshold-based duty-cycle detection mechanisms, manually extracted features, pattern-matching, and supervised tiny machine learning models. The explored low-computational models include decision tree, random forest, extra trees, extreme gradient boosting, Gaussian naive Bayes, and multi-layer perceptron. A comprehensive evaluation of the former and proposed approaches is carried out on two datasets. Both proposed methods outperform the former method, with the best-performing approach being dataset-dependent. The heuristic rule-based approach achieves the highest performance in the same dataset used for algorithm training, with 97.3% for normal cycles and 80.2% for abnormal cycles. The ML-based approach performs better on a dataset including the effects of machine aging, scoring 91.3% for normal cycles and 67.9% for abnormal cycles. Implemented on two low-power microcontrollers, the methods demonstrate efficient, real-time operation with energy consumption of 13.3 and 20.6 ${\mu}$J during inference. These results offer valuable insights for detecting …

arxiv情報

著者 Luciano S. Martinez-Rau,Yuxuan Zhang,Bengt Oelmann,Sebastian Bader
発行日 2025-05-08 16:29:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, eess.SP | On-device Anomaly Detection in Conveyor Belt Operations はコメントを受け付けていません

Let’s Ask GNN: Empowering Large Language Model for Graph In-Context Learning

要約

テキスト属性グラフ(タ​​グ)は、複雑な実世界システムをモデル化するために重要ですが、タグの大規模な言語モデル(LLM)を活用することは、シーケンシャルテキスト処理とグラフ構造データのギャップにより、独自の課題を提示します。
AskGnnを紹介します。これは、グラフデータとタスク固有の情報をLLMSに統合するために、コンテキスト内学習(ICL)を活用することにより、このギャップを埋める新しいアプローチです。
AskGnnは、グラフニューラルネットワーク(GNN)搭載の構造強化レトリバーを採用して、グラフ全体にラベル付けされたノードを選択し、複雑なグラフ構造とその監督信号を組み込みます。
再受信学習アルゴリズムは、レトリバーを最適化して、グラフのLLMパフォーマンスを最大化するノードのサンプルを選択します。
3つのタスクと7つのLLMにわたる実験は、グラフタスクのパフォーマンスにおけるAskGnnの優れた効果を示しており、大規模な微調整なしにLLMSをグラフ構造データに適用するための新しい道を開きます。

要約(オリジナル)

Textual Attributed Graphs (TAGs) are crucial for modeling complex real-world systems, yet leveraging large language models (LLMs) for TAGs presents unique challenges due to the gap between sequential text processing and graph-structured data. We introduce AskGNN, a novel approach that bridges this gap by leveraging In-Context Learning (ICL) to integrate graph data and task-specific information into LLMs. AskGNN employs a Graph Neural Network (GNN)-powered structure-enhanced retriever to select labeled nodes across graphs, incorporating complex graph structures and their supervision signals. Our learning-to-retrieve algorithm optimizes the retriever to select example nodes that maximize LLM performance on graph. Experiments across three tasks and seven LLMs demonstrate AskGNN’s superior effectiveness in graph task performance, opening new avenues for applying LLMs to graph-structured data without extensive fine-tuning.

arxiv情報

著者 Zhengyu Hu,Yichuan Li,Zhengyu Chen,Jingang Wang,Han Liu,Kyumin Lee,Kaize Ding
発行日 2025-05-08 16:40:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Let’s Ask GNN: Empowering Large Language Model for Graph In-Context Learning はコメントを受け付けていません

Representing spherical tensors with scalar-based machine-learning models

要約

回転対称性は、物理学において中心的な役割を果たし、3Dオブジェクトの特性(原子から巨視的なスケールまで)が剛性回転の作用下でどのように変換されるかを説明するエレガントなフレームワークを提供します。
3Dポイントクラウドの等量モデルは、球面テンソルである中間表現を組み合わせることにより、回転グループの構造と完全に一致する方法で構造とプロパティの関係を近似することができます。
しかし、対称性の制約により、このアプローチは計算的に要求が厳しく、実装が面倒になります。これにより、トレーニングプロセスの一部として近似対称性を学習するますます人気のないアーキテクチャが動機付けられます。
この作業では、この学習問題に取り組むための3番目のルートを探索します。ここでは、ポイントクラウド座標のスカラー関数と適切な対称性のあるテンソルの小さな基礎として表現されます。
また、一般的な式の近似を提案します。これは、普遍的な近似特性を欠いていますが、実装が迅速で、簡単で、実用的な設定で正確であることを提案します。

要約(オリジナル)

Rotational symmetry plays a central role in physics, providing an elegant framework to describe how the properties of 3D objects — from atoms to the macroscopic scale — transform under the action of rigid rotations. Equivariant models of 3D point clouds are able to approximate structure-property relations in a way that is fully consistent with the structure of the rotation group, by combining intermediate representations that are themselves spherical tensors. The symmetry constraints however make this approach computationally demanding and cumbersome to implement, which motivates increasingly popular unconstrained architectures that learn approximate symmetries as part of the training process. In this work, we explore a third route to tackle this learning problem, where equivariant functions are expressed as the product of a scalar function of the point cloud coordinates and a small basis of tensors with the appropriate symmetry. We also propose approximations of the general expressions that, while lacking universal approximation properties, are fast, simple to implement, and accurate in practical settings.

arxiv情報

著者 Michelangelo Domina,Filippo Bigi,Paolo Pegolo,Michele Ceriotti
発行日 2025-05-08 16:45:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph, stat.ML | Representing spherical tensors with scalar-based machine-learning models はコメントを受け付けていません

Hide & Seek: Transformer Symmetries Obscure Sharpness & Riemannian Geometry Finds It

要約

シャープネスの概念は、一般化を予測するために、MLPやCNNなどの従来のアーキテクチャに成功裏に適用されています。
しかし、変圧器については、最近の研究では、平坦性と一般化の間の弱い相関関係が報告されています。
既存のシャープネス測定値は、トランスのために失敗すると主張します。なぜなら、ネットワークまたはその損失が同一のままで、パラメーター空間に方向を誘導する注意メカニズムにはるかに豊富な対称性があるからです。
シャープネスはこれらの対称性を完全に説明しなければならないと仮定します。したがって、トランスの対称性を引用して結果として生じる商のマニホールドにそれを再定義し、それにより曖昧さを除去します。
Riemannian Geometryからのツールを活用すると、対称補正された商マニホールドの測地線ボールの観点から、シャープネスの完全に一般的な概念を提案します。
実際には、測地線に近似することに頼る必要があります。
それを行うと、既存の適応型シャープネス測定値が得られ、一般化との相関を回復するために高次の用語を含めることが重要であることを実証します。
合成データを使用した対角線ネットワークの結果を提示し、測地線のシャープネスが、テキストと画像分類タスクの両方で実際の変圧器の強い相関を明らかにしていることを示しています。

要約(オリジナル)

The concept of sharpness has been successfully applied to traditional architectures like MLPs and CNNs to predict their generalization. For transformers, however, recent work reported weak correlation between flatness and generalization. We argue that existing sharpness measures fail for transformers, because they have much richer symmetries in their attention mechanism that induce directions in parameter space along which the network or its loss remain identical. We posit that sharpness must account fully for these symmetries, and thus we redefine it on a quotient manifold that results from quotienting out the transformer symmetries, thereby removing their ambiguities. Leveraging tools from Riemannian geometry, we propose a fully general notion of sharpness, in terms of a geodesic ball on the symmetry-corrected quotient manifold. In practice, we need to resort to approximating the geodesics. Doing so up to first order yields existing adaptive sharpness measures, and we demonstrate that including higher-order terms is crucial to recover correlation with generalization. We present results on diagonal networks with synthetic data, and show that our geodesic sharpness reveals strong correlation for real-world transformers on both text and image classification tasks.

arxiv情報

著者 Marvin F. da Silva,Felix Dangel,Sageev Oore
発行日 2025-05-08 16:51:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Hide & Seek: Transformer Symmetries Obscure Sharpness & Riemannian Geometry Finds It はコメントを受け付けていません

DPQ-HD: Post-Training Compression for Ultra-Low Power Hyperdimensional Computing

要約

高次元コンピューティング(HDC)は、EDGE AIの有望なアプローチとして浮上しており、精度と効率のバランスを提供しています。
ただし、現在のHDCベースのアプリケーションは、多くの場合、高精度モデルやエンコーディングマトリックスに依存して競争力のあるパフォーマンスを実現します。
最近の努力では、精密な削減や剪定などの手法を使用して効率を高めますが、ほとんどの場合、パフォーマンスを維持するために再訓練を必要とし、それらを高価で非現実的にします。
この問題に対処するために、エンドツーエンドのHDCシステムを圧縮することを目的とした新しいトレーニングポストトレーニング圧縮アルゴリズムであるDecomposition-Pruning-Quantization(DPQ-HD)を提案します。
DPQ-HDは、上記の3つの圧縮技術を一意に組み合わせることにより、計算とメモリのオーバーヘッドを減らし、ハードウェアの制約に効率的に適応します。
さらに、コサインの類似性などの類似性スコアを徐々に評価し、早期出口を実行して計算を減らし、精度を維持しながら予測推論を加速するエネルギー効率の高い推論アプローチを導入します。
DPQ-HDは、非圧縮ワークロードと比較して精度が1〜2%低下した画像およびグラフ分類タスクのメモリが最大20〜100倍減少することを実証します。
最後に、DPQ-HDが既存のトレーニング後の圧縮方法を上回り、再トレーニングベースの最先端の技術と同等のパフォーマンスを発揮することを示しています。

要約(オリジナル)

Hyperdimensional Computing (HDC) is emerging as a promising approach for edge AI, offering a balance between accuracy and efficiency. However, current HDC-based applications often rely on high-precision models and/or encoding matrices to achieve competitive performance, which imposes significant computational and memory demands, especially for ultra-low power devices. While recent efforts use techniques like precision reduction and pruning to increase the efficiency, most require retraining to maintain performance, making them expensive and impractical. To address this issue, we propose a novel Post Training Compression algorithm, Decomposition-Pruning-Quantization (DPQ-HD), which aims at compressing the end-to-end HDC system, achieving near floating point performance without the need of retraining. DPQ-HD reduces computational and memory overhead by uniquely combining the above three compression techniques and efficiently adapts to hardware constraints. Additionally, we introduce an energy-efficient inference approach that progressively evaluates similarity scores such as cosine similarity and performs early exit to reduce the computation, accelerating prediction inference while maintaining accuracy. We demonstrate that DPQ-HD achieves up to 20-100x reduction in memory for image and graph classification tasks with only a 1-2% drop in accuracy compared to uncompressed workloads. Lastly, we show that DPQ-HD outperforms the existing post-training compression methods and performs better or at par with retraining-based state-of-the-art techniques, requiring significantly less overall optimization time (up to 100x) and faster inference (up to 56x) on a microcontroller

arxiv情報

著者 Nilesh Prasad Pandey,Shriniwas Kulkarni,David Wang,Onat Gungor,Flavio Ponzina,Tajana Rosing
発行日 2025-05-08 16:54:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | DPQ-HD: Post-Training Compression for Ultra-Low Power Hyperdimensional Computing はコメントを受け付けていません

Active learning of neural population dynamics using two-photon holographic optogenetics

要約

神経集団の監視と摂動の技術の最近の進歩により、脳内の回路を研究する能力が大幅に向上しました。
特に、2光子のホログラフィックオプトジェネティクスは、個々のニューロンの実験者に指定されたグループの正確な光刺激ができるようになりましたが、同時に2光子カルシウムイメージングにより、神経集団全体で進行中および誘導活動の測定が可能になります。
潜在的な光刺激パターンの膨大な空間と光刺激実験の時間のかかる性質にもかかわらず、神経集団の動態を識別するための最も効果的な光刺激パターンを決定するためには、ほとんどアルゴリズム作業が行われていません。
ここでは、結果として生じる神経反応が神経集団活動の動的モデルを最もよく知らせるように刺激するニューロンを効率的に選択する方法を開発します。
マウス運動皮質における光刺激に対する神経集団応答を使用して、低ランクの線形動的システムモデルの有効性を実証し、低ランク構造を利用して有益な光刺激パターンを決定する積極的な学習手順を開発します。
実際のデータと合成データの両方でアプローチを実証し、特定の予測力に到達するために必要なデータ量を2倍に減少させる場合があります。
当社のアクティブな刺激設計方法は、低ランク回帰のための新しい積極的な学習手順に基づいており、これは独立した関心事である可能性があります。

要約(オリジナル)

Recent advances in techniques for monitoring and perturbing neural populations have greatly enhanced our ability to study circuits in the brain. In particular, two-photon holographic optogenetics now enables precise photostimulation of experimenter-specified groups of individual neurons, while simultaneous two-photon calcium imaging enables the measurement of ongoing and induced activity across the neural population. Despite the enormous space of potential photostimulation patterns and the time-consuming nature of photostimulation experiments, very little algorithmic work has been done to determine the most effective photostimulation patterns for identifying the neural population dynamics. Here, we develop methods to efficiently select which neurons to stimulate such that the resulting neural responses will best inform a dynamical model of the neural population activity. Using neural population responses to photostimulation in mouse motor cortex, we demonstrate the efficacy of a low-rank linear dynamical systems model, and develop an active learning procedure which takes advantage of low-rank structure to determine informative photostimulation patterns. We demonstrate our approach on both real and synthetic data, obtaining in some cases as much as a two-fold reduction in the amount of data required to reach a given predictive power. Our active stimulation design method is based on a novel active learning procedure for low-rank regression, which may be of independent interest.

arxiv情報

著者 Andrew Wagenmaker,Lu Mi,Marton Rozsa,Matthew S. Bull,Karel Svoboda,Kayvon Daie,Matthew D. Golub,Kevin Jamieson
発行日 2025-05-08 16:58:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.NC, stat.ML | Active learning of neural population dynamics using two-photon holographic optogenetics はコメントを受け付けていません

Robustly optimal dynamics for active matter reservoir computing

要約

貯水池コンピューティング(RC)パラダイムにおけるアクティブ物質の情報処理能力を研究し、外部から駆動されるモデルを使用して混oticとした信号の将来の状態を推測します。
シミュレートされたシステムは、以前に報告されたモデルに密接に従います。
これまで見落とされてきたエージェントダイナミクスの例外的なダイナミカルレジームを明らかにします。
さまざまな物理パラメーターと推論タスクにわたって堅牢に最適であるように見え、物理システムとの計算と推論に関する貴重な洞察をより一般的に提供します。
情報処理のための効果的なメカニズムを形成する能力は、主にシステム自身の固有の弛緩能力によって決定されます。
これらは、特定の推論の目標なしでシステムを調査するときに識別でき、最小限の単粒粒子貯留層をテストするときにマニフェストします。
最適な計算を達成するレジームは、複数の段階での顕微鏡動的緩和を含む、臨界減衰閾値のすぐ下にあります。
最適なシステムは、準定常状態と非常に非線形の動的状態の間の迅速な交互のように現れる応答メカニズムの多様性のために、混oticとした外部駆動の下で適応できます。
コヒーレントダイナミクスと一貫性のないダイナミクスの両方が、一部はスペースと遅延時間の異なるスケールで、その操作に貢献します。
エージェントのダイナミクスの相関は、応答システムと変動するドライバーとの間の最良のパフォーマンスのある体制と厳しい関係の発見を示しています。
この計算モデルは物理的に解釈できるため、学習と型破りなコンピューティングに関する調査と、平衡状態からの多体物理学の新鮮な理論的根拠を備えた再編成を促進します。

要約(オリジナル)

We study the information processing abilities of active matter in the reservoir computing (RC) paradigm, using a model that is externally driven to infer the future state of a chaotic signal. The simulated system closely follows a previously reported model. We uncover an exceptional dynamical regime of agent dynamics that has been overlooked heretofore. It appears robustly optimal across varying physical parameters and inference tasks, thus providing valuable insights into computation and inference with physical systems more generally. The ability to form effective mechanisms for information processing are primarily determined by the system’s own intrinsic relaxation abilities. These are identifiable when probing the system without a specific inference goal and manifest when testing minimalistic single-particle reservoirs. The regime that achieves optimal computation is situated just below the critical damping threshold, involving a microscopic dynamical relaxation with multiple stages. The optimal system is adaptable under chaotic external driving, due to a diversity in response mechanisms that emerge like rapid alternations between quasi-stationary and highly nonlinear dynamical states. Both coherent and incoherent dynamics contribute to their operation, partly at dissimilar scales of space and delay time. Correlations on agent dynamics can indicate the best-performing regimes and onsets of tight relationships between the responding system and the fluctuating driver. As this model of computation is interpretable in physical terms, it facilitates re-framing inquiries regarding learning and unconventional computing with a fresh rationale for many-body physics out of equilibrium.

arxiv情報

著者 Mario U. Gaimann,Miriam Klopotek
発行日 2025-05-08 17:09:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.soft, cs.LG, nlin.AO, physics.comp-ph | Robustly optimal dynamics for active matter reservoir computing はコメントを受け付けていません