FedRIR: Rethinking Information Representation in Federated Learning

要約

ネットワークエッジのモバイルおよびWeb-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-of-things(WOT)デバイスは、機械学習アプリケーション向けの膨大な量のデータを生成しますが、プライバシーは集中モデルトレーニングを妨げます。
Federated Learning(FL)により、クライアント(デバイス)は、プライベートデータを転送せずに中央サーバーによって調整された共有モデルを協力してトレーニングできますが、クライアント間の固有の統計的不均一性は課題を提示し、多くの場合、パーソナライズされたローカルモデルに対するクライアントのニーズと一般化グローバルモデルを構築するという目標との間のジレンマにつながります。
既存のFLメソッドは通常、グローバルな一般化またはローカルパーソナライゼーションのいずれかを優先し、これら2つの目的間のトレードオフをもたらし、多様なクライアントデータの可能性を最大限に制限します。
この課題に対処するために、連邦学習プロセス(FedRIR)で情報表現を再考することにより、グローバルな一般化とローカルパーソナライズを同時に強化する新しいフレームワークを提案します。
具体的には、マスクされたクライアント固有の学習(MCSL)を導入します。これは、各クライアントの一意のデータ特性に合わせて調整された細かいクライアント固有の機能を分離および抽出し、パーソナライズを強化します。
同時に、情報蒸留モジュール(IDM)は、クライアント固有の情報を除外することにより、グローバル共有機能を改良し、一般化を強化するより純粋で堅牢なグローバル表現をもたらします。
洗練されたグローバルな機能を孤立したクライアント固有の機能と統合することにより、グローバルなパターンとローカルニュアンスの両方を効果的にキャプチャする濃縮表現を構築し、それによりクライアントのダウンストリームタスクのパフォーマンスを改善します。
このコードは、https://github.com/deep-imaging-group/fedrirで入手できます。

要約(オリジナル)

Mobile and Web-of-Things (WoT) devices at the network edge generate vast amounts of data for machine learning applications, yet privacy concerns hinder centralized model training. Federated Learning (FL) allows clients (devices) to collaboratively train a shared model coordinated by a central server without transfer private data, but inherent statistical heterogeneity among clients presents challenges, often leading to a dilemma between clients’ needs for personalized local models and the server’s goal of building a generalized global model. Existing FL methods typically prioritize either global generalization or local personalization, resulting in a trade-off between these two objectives and limiting the full potential of diverse client data. To address this challenge, we propose a novel framework that simultaneously enhances global generalization and local personalization by Rethinking Information Representation in the Federated learning process (FedRIR). Specifically, we introduce Masked Client-Specific Learning (MCSL), which isolates and extracts fine-grained client-specific features tailored to each client’s unique data characteristics, thereby enhancing personalization. Concurrently, the Information Distillation Module (IDM) refines the global shared features by filtering out redundant client-specific information, resulting in a purer and more robust global representation that enhances generalization. By integrating the refined global features with the isolated client-specific features, we construct enriched representations that effectively capture both global patterns and local nuances, thereby improving the performance of downstream tasks on the client. The code is available at https://github.com/Deep-Imaging-Group/FedRIR.

arxiv情報

著者 Yongqiang Huang,Zerui Shao,Ziyuan Yang,Zexin Lu,Yi Zhang
発行日 2025-04-14 14:07:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG | FedRIR: Rethinking Information Representation in Federated Learning はコメントを受け付けていません

Adaptive Sensor Steering Strategy Using Deep Reinforcement Learning for Dynamic Data Acquisition in Digital Twins

要約

このペーパーでは、データ収集プロセスを最適化することにより、デジタルツインの予測精度と意思決定サポート機能を強化するための深い強化学習に基づくセンサーステアリング方法を紹介します。
従来のセンサーの配置技術は、多くの場合、1回限りの最適化戦略によって制約されており、継続的な有益なデータ同化を必要とするオンラインアプリケーションへの適用性を制限します。
提案されたアプローチは、デジタルツインパラダイム内のセンサー配置のための適応フレームワークを提供することにより、この制限に対処します。
センサーの配置問題は、マルコフの決定プロセスとして策定され、デジタル双子が表す物理構造の進化する条件に応じてセンサーを動的に再配置できるエージェントのトレーニングと展開を可能にします。
これにより、デジタルツインが物理的な対応物との非常に代表的で信頼できる接続を維持することが保証されます。
提案されたフレームワークは、健康的な条件や損傷した状態を含む多様な条件にさらされた片持ちのプレート構造を含む一連の包括的なケーススタディを通じて検証されます。
結果は、ディープ補強学習エージェントがセンサーを適応的に再配置する能力を示し、データ収集の品質を改善し、デジタル双子の全体的な精度を向上させることを示しています。

要約(オリジナル)

This paper introduces a sensor steering methodology based on deep reinforcement learning to enhance the predictive accuracy and decision support capabilities of digital twins by optimising the data acquisition process. Traditional sensor placement techniques are often constrained by one-off optimisation strategies, which limit their applicability for online applications requiring continuous informative data assimilation. The proposed approach addresses this limitation by offering an adaptive framework for sensor placement within the digital twin paradigm. The sensor placement problem is formulated as a Markov decision process, enabling the training and deployment of an agent capable of dynamically repositioning sensors in response to the evolving conditions of the physical structure as represented by the digital twin. This ensures that the digital twin maintains a highly representative and reliable connection to its physical counterpart. The proposed framework is validated through a series of comprehensive case studies involving a cantilever plate structure subjected to diverse conditions, including healthy and damaged conditions. The results demonstrate the capability of the deep reinforcement learning agent to adaptively reposition sensors improving the quality of data acquisition and hence enhancing the overall accuracy of digital twins.

arxiv情報

著者 Collins O. Ogbodo,Timothy J. Rogers,Mattia Dal Borgo,David J. Wagg
発行日 2025-04-14 14:11:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP, stat.ML | Adaptive Sensor Steering Strategy Using Deep Reinforcement Learning for Dynamic Data Acquisition in Digital Twins はコメントを受け付けていません

TinyverseGP: Towards a Modular Cross-domain Benchmarking Framework for Genetic Programming

要約

長年にわたり、Genetic Programming(GP)は進化しており、特にソリューションを表す方法において、多くの提案されたバリエーションがあります。
基本的にプログラム合成アルゴリズムであるため、複数の問題ドメインに取り組むことができます。
さまざまな表現が互いに比較されず、パフォーマンスが異なるドメインで測定されないため、現在のベンチマークイニシアチブは断片化されています。
この作業では、シンボリック回帰、論理合成、ポリシー検索など、複数の表現と問題ドメインをサポートするTinyverseGP(TinyGPに触発された)と呼ばれる統一されたフレームワークを提案します。

要約(オリジナル)

Over the years, genetic programming (GP) has evolved, with many proposed variations, especially in how they represent a solution. Being essentially a program synthesis algorithm, it is capable of tackling multiple problem domains. Current benchmarking initiatives are fragmented, as the different representations are not compared with each other and their performance is not measured across the different domains. In this work, we propose a unified framework, dubbed TinyverseGP (inspired by tinyGP), which provides support to multiple representations and problem domains, including symbolic regression, logic synthesis and policy search.

arxiv情報

著者 Roman Kalkreuth,Fabricio Olivetti de França,Julian Dierkes,Marie Anastacio,Anja Jankovic,Zdenek Vasicek,Holger Hoos
発行日 2025-04-14 14:14:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NE, cs.SC | TinyverseGP: Towards a Modular Cross-domain Benchmarking Framework for Genetic Programming はコメントを受け付けていません

Newton-CG methods for nonconvex unconstrained optimization with Hölder continuous Hessian

要約

このホワイトペーパーでは、継続的には、高齢の連続ヘシアンを使用した2回の微分可能な目的関数を最小限に抑える非凸の制約のない最適化問題を検討します。
具体的には、関連するh \ ‘古いパラメーターが明示的に既知であると仮定して、この問題のおおよその1次の固定点を見つけるためのニュートン結合勾配(Newton-CG)メソッドを最初に提案します。
次に、これらのパラメーターの事前知識を必要とせずに、パラメーターフリーのニュートン-CGメソッドを開発します。
私たちの知る限り、この方法は、この問題のおおよその1次および2次の固定点を見つけるための最もよく知られている反復および操作の複雑さを達成する最初のパラメーターのない2次方法です。
最後に、予備的な数値結果を提示して、よく知られている正規化されたニュートン法よりもパラメーターフリーのニュートンCGメソッドの優れた実用的なパフォーマンスを実証します。

要約(オリジナル)

In this paper we consider a nonconvex unconstrained optimization problem minimizing a twice differentiable objective function with H\’older continuous Hessian. Specifically, we first propose a Newton-conjugate gradient (Newton-CG) method for finding an approximate first- and second-order stationary point of this problem, assuming the associated the H\’older parameters are explicitly known. Then we develop a parameter-free Newton-CG method without requiring any prior knowledge of these parameters. To the best of our knowledge, this method is the first parameter-free second-order method achieving the best-known iteration and operation complexity for finding an approximate first- and second-order stationary point of this problem. Finally, we present preliminary numerical results to demonstrate the superior practical performance of our parameter-free Newton-CG method over a well-known regularized Newton method.

arxiv情報

著者 Chuan He,Heng Huang,Zhaosong Lu
発行日 2025-04-14 14:25:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC | Newton-CG methods for nonconvex unconstrained optimization with Hölder continuous Hessian はコメントを受け付けていません

Renormalized Graph Representations for Node Classification

要約

グラフニューラルネットワーク特定の解像度スケールで表されるグラフの情報を処理します。
ノード分類タスクで、Laplacian Rinormalization Group Theoryを介して得られた、さまざまな粗粒グラフ解像度を使用する効果を分析します。
理論のコアは、特定の時間尺度での重要な情報フローによって接続されたグループ化ノードです。
異なるスケールでのグラフの表現は、異なる範囲で相互作用情報をエンコードします。
グラフのメソスコピック構造の特性スケールで表現を使用して特別に実験します。
モデルに元のグラフと特性解像度スケールで表されたグラフを提供し、それらを元のグラフにのみアクセスできるモデルと比較します。
私たちの結果は、元のグラフと特性スケールグラフの両方にアクセスできるモデルが、テストの精度の統計的に大幅な改善を達成できることを示しました。

要約(オリジナル)

Graph neural networks process information on graphs represented at a given resolution scale. We analyze the effect of using different coarse-grained graph resolutions, obtained through the Laplacian renormalization group theory, on node classification tasks. At the theory’s core is grouping nodes connected by significant information flow at a given time scale. Representations of the graph at different scales encode interaction information at different ranges. We specifically experiment using representations at the characteristic scale of the graph’s mesoscopic structures. We provide the models with the original graph and the graph represented at the characteristic resolution scale and compare them to models that can only access the original graph. Our results showed that models with access to both the original graph and the characteristic scale graph can achieve statistically significant improvements in test accuracy.

arxiv情報

著者 Francesco Caso,Giovanni Trappolini,Andrea Bacciu,Pietro Liò,Fabrizio Silvestri
発行日 2025-04-14 14:40:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.data-an | Renormalized Graph Representations for Node Classification はコメントを受け付けていません

Sidecar: A Structure-Preserving Framework for Solving Partial Differential Equations with Neural Networks

要約

神経ネットワーク(NNS)を使用して部分微分方程式(PDE)を解くことは、さまざまな科学および工学分野で大きな可能性を示しています。
ただし、ほとんどの既存のNNソルバーは、主に、質量保存やエネルギー散逸などの固有の物理的特性を明示的に考慮せずに、与えられたPDEの満足度に焦点を当てています。
この制限は、特に長期シミュレーションで、不安定または非物理的なソリューションをもたらす可能性があります。
この問題に対処するために、SideCarを提案します。SideCarは、構造予定の知識を組み込むことにより、既存のNNソルバーの精度と物理的一貫性を高める新しいフレームワークです。
時間依存のスペクトル繰り込み(TDSR)アプローチに触発されたサイドカーフレームワークは、物理的構造の保存に既存のNNソルバーを導くように訓練された小さな副操縦士ネットワークを導入しています。
このフレームワークは、非常に柔軟になるように設計されており、多様なPDEから幅広いNNソルバーに構造を提供する原理を組み込むことができます。
ベンチマークPDEでの実験結果は、構造圧力特性との精度と一貫性の観点から、既存のニューラルネットワークソルバーの改善を示しています。

要約(オリジナル)

Solving partial differential equations (PDEs) with neural networks (NNs) has shown great potential in various scientific and engineering fields. However, most existing NN solvers mainly focus on satisfying the given PDEs, without explicitly considering intrinsic physical properties such as mass conservation or energy dissipation. This limitation can result in unstable or nonphysical solutions, particularly in long-term simulations. To address this issue, we propose Sidecar, a novel framework that enhances the accuracy and physical consistency of existing NN solvers by incorporating structure-preserving knowledge. Inspired by the Time-Dependent Spectral Renormalization (TDSR) approach, our Sidecar framework introduces a small copilot network, which is trained to guide the existing NN solver in preserving physical structure. This framework is designed to be highly flexible, enabling the incorporation of structure-preserving principles from diverse PDEs into a wide range of NN solvers. Our experimental results on benchmark PDEs demonstrate the improvement of the existing neural network solvers in terms of accuracy and consistency with structure-preserving properties.

arxiv情報

著者 Gaohang Chen,Zhonghua Qiao
発行日 2025-04-14 14:40:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 35L65, 65M99, 68T07, cs.LG, cs.NA, math.NA | Sidecar: A Structure-Preserving Framework for Solving Partial Differential Equations with Neural Networks はコメントを受け付けていません

$α$-Flow: A Unified Framework for Continuous-State Discrete Flow Matching Models

要約

最近の取り組みにより、フローマッチングフレームワークが個別の生成モデリングに拡大されました。
モデルの1つは、離散トークンの代わりに連続確率で直接動作します。これは、連続状態の離散フローマッチング(CS-DFM)と口語的に呼びます。
既存のCS-DFMモデルは、表現と幾何学的仮定が大きく異なります。
この作業は、CS-DFMモデルの統一されたフレームワークを提示します。このフレームは、既存のバリアントをさまざまな$ \ alpha $ representations of Probabilityで動作させると理解できます。
情報ジオメトリの理論に基づいて、統計マニホールドの標準$ \ alpha $ geometryを順守するCS-DFMモデルのファミリーである$ \ alpha $ -flowを紹介し、一般化された運動エネルギーを最小化する最適性を実証します。
理論的には、$ \ alpha $ -Flowのフローマッチング損失が、離散負の対数尤度のために統一された変分結合を確立することを示します。
さまざまな離散生成ドメインでの$ \ alpha $ -Flowの異なるインスタンス化を包括的に評価して、ジオメトリが以前に調査されたことのない中間値を含む、離散生成モデリングにおける有効性を実証します。
$ \ alpha $ -flowは、画像とタンパク質配列の生成の離散状態の対応物を大幅に上回り、言語モデリングのエントロピーをよりよく捉えます。

要約(オリジナル)

Recent efforts have extended the flow-matching framework to discrete generative modeling. One strand of models directly works with the continuous probabilities instead of discrete tokens, which we colloquially refer to as Continuous-State Discrete Flow Matching (CS-DFM). Existing CS-DFM models differ significantly in their representations and geometric assumptions. This work presents a unified framework for CS-DFM models, under which the existing variants can be understood as operating on different $\alpha$-representations of probabilities. Building upon the theory of information geometry, we introduce $\alpha$-Flow, a family of CS-DFM models that adheres to the canonical $\alpha$-geometry of the statistical manifold, and demonstrate its optimality in minimizing the generalized kinetic energy. Theoretically, we show that the flow matching loss for $\alpha$-flow establishes a unified variational bound for the discrete negative log-likelihood. We comprehensively evaluate different instantiations of $\alpha$-flow on various discrete generation domains to demonstrate their effectiveness in discrete generative modeling, including intermediate values whose geometries have never been explored before. $\alpha$-flow significantly outperforms its discrete-state counterpart in image and protein sequence generation and better captures the entropy in language modeling.

arxiv情報

著者 Chaoran Cheng,Jiahan Li,Jiajun Fan,Ge Liu
発行日 2025-04-14 14:51:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | $α$-Flow: A Unified Framework for Continuous-State Discrete Flow Matching Models はコメントを受け付けていません

ATHEENA: A Toolflow for Hardware Early-Exit Network Automation

要約

深いニューラルネットワークの精度、スループット、および効率の改善の継続的な必要性により、FPGAのカスタムアーキテクチャを最大限に活用する多くの方法が生まれました。
これらには、手作りのネットワークの作成と、無関係なネットワークパラメーターを減らすための量子化と剪定の使用が含まれます。
ただし、静的ソリューションの可能性がすでに十分に活用されているため、個々のデータサンプルのさまざまな難易度を使用して、効率をさらに向上させ、分類の平均計算を減らすことに焦点を移すことを提案します。
入力依存の計算により、結果が信頼のしきい値を満たしている場合、ネットワークがランタイム決定を下すことができます。
早期拡張ネットワークアーキテクチャは、そのような動作をソフトウェアに実装するためのますます一般的な方法になっています。
作成する:ハードウェアアーリーエキシットネットワークオートメーション(ATHEENA)のツールフロー、そのようなネットワークから早期に出てくるサンプルの確率を活用して、ネットワークのさまざまなセクションに割り当てられたリソースを拡大する自動FPGAツールフロー。
このツールフローは、FPGACONVNETのデータフローモデルを使用して、早期存在ネットワークをサポートするように拡張され、設計スペース探索を設計して、精度を維持しながらスループット/還元領域を増やすことを目的として生成されたストリーミングアーキテクチャハードウェアを最適化します。
3つの異なるネットワークでの実験結果は、早期出口のない最適化されたベースラインネットワーク実装と比較して、$ 2.00 \ times $ $ 2.78 \ times $のスループットの増加を示しています。
さらに、ツールフローは、ベースラインに必要なリソースの46ドル\%$の低いベースラインと一致するスループットを実現できます。

要約(オリジナル)

The continued need for improvements in accuracy, throughput, and efficiency of Deep Neural Networks has resulted in a multitude of methods that make the most of custom architectures on FPGAs. These include the creation of hand-crafted networks and the use of quantization and pruning to reduce extraneous network parameters. However, with the potential of static solutions already well exploited, we propose to shift the focus to using the varying difficulty of individual data samples to further improve efficiency and reduce average compute for classification. Input-dependent computation allows for the network to make runtime decisions to finish a task early if the result meets a confidence threshold. Early-Exit network architectures have become an increasingly popular way to implement such behaviour in software. We create: A Toolflow for Hardware Early-Exit Network Automation (ATHEENA), an automated FPGA toolflow that leverages the probability of samples exiting early from such networks to scale the resources allocated to different sections of the network. The toolflow uses the data-flow model of fpgaConvNet, extended to support Early-Exit networks as well as Design Space Exploration to optimize the generated streaming architecture hardware with the goal of increasing throughput/reducing area while maintaining accuracy. Experimental results on three different networks demonstrate a throughput increase of $2.00\times$ to $2.78\times$ compared to an optimized baseline network implementation with no early exits. Additionally, the toolflow can achieve a throughput matching the same baseline with as low as $46\%$ of the resources the baseline requires.

arxiv情報

著者 Benjamin Biggs,Christos-Savvas Bouganis,George A. Constantinides
発行日 2025-04-14 14:54:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AR, cs.LG | ATHEENA: A Toolflow for Hardware Early-Exit Network Automation はコメントを受け付けていません

A User’s Guide to Sampling Strategies for Sliced Optimal Transport

要約

このペーパーは、スライスした最適な輸送のためのサンプリング戦略に関するユーザーのガイドとして機能します。
スライスされたワッサースタイン距離でリマインダーと追加の規則性の結果を提供します。
各戦略の建設方法、生成時間の複雑さ、理論的保証、および条件について詳しく説明します。
さらに、理論のスライスされた最適な輸送に対する適合性に関する洞察を提供します。
シミュレートされたデータと実世界の両方のデータに関する広範な実験は、戦略の代表的な比較を提供し、最良の使用に関する実際の推奨事項で頂点に達します。

要約(オリジナル)

This paper serves as a user’s guide to sampling strategies for sliced optimal transport. We provide reminders and additional regularity results on the Sliced Wasserstein distance. We detail the construction methods, generation time complexity, theoretical guarantees, and conditions for each strategy. Additionally, we provide insights into their suitability for sliced optimal transport in theory. Extensive experiments on both simulated and real-world data offer a representative comparison of the strategies, culminating in practical recommendations for their best usage.

arxiv情報

著者 Keanu Sisouk,Julie Delon,Julien Tierny
発行日 2025-04-14 15:04:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.PR | A User’s Guide to Sampling Strategies for Sliced Optimal Transport はコメントを受け付けていません

Siamese Network with Dual Attention for EEG-Driven Social Learning: Bridging the Human-Robot Gap in Long-Tail Autonomous Driving

要約

車輪付き、四葉型、またはヒューマノイドの形を備えたロボットは、構築された環境にますます統合されています。
しかし、人間の社会的学習とは異なり、それらは固有の認知発達のための重要な経路を欠いています。つまり、相互作用中の人間のフィードバックから学ぶことです。
動的および不確実な環境での人間のユビキタスな観察、監督、共有制御を理解するために、この研究では、脳波(EEG)シグナルの分類を可能にして認知的に要求し、安全批判的なイベントを検出できる脳コンピューターインターフェイス(BCI)フレームワークを提示します。
タイムリーでやる気のある共同ロボットエンジニアリングアプリケーションとして、スマートモビリティシステムとロボット車の安全性能に持続的なボトルネックをもたらす半自動ロボット運転代表のリスクの高いイベントにフラグを立てるための人間のループシナリオをシミュレートします。
少数のショット学習の最近の進歩に基づいて、私たちは、堅牢なEEGエンコード信号表現を生成するために、ダイナミックタイムワーピングバリセンターの平均化アプローチとペアになった二重のアテナテンションシャム畳み込みネットワークを提案します。
逆ソースのローカリゼーションは、ブロードマンエリア4および9の活性化を明らかにし、タスク関連の精神画像中の知覚と行動の結合を示しています。
このモデルは、データサース条件下で80%の分類精度を達成し、統合された勾配属性によって測定されるように、最先端の方法と比較して、顕著な特徴の有用性がほぼ100%増加します。
パフォーマンスを超えて、この研究は、BCIエージェントに必要な認知アーキテクチャの理解に貢献しています。特に、多様な精神状態を分類し、被験者間および被験者内適応の両方をサポートする注意と記憶メカニズムの役割があります。
全体として、この研究は、複雑な構築環境でのサービスロボットの認知ロボット工学と社会的ガイド付き学習の開発を進めています。

要約(オリジナル)

Robots with wheeled, quadrupedal, or humanoid forms are increasingly integrated into built environments. However, unlike human social learning, they lack a critical pathway for intrinsic cognitive development, namely, learning from human feedback during interaction. To understand human ubiquitous observation, supervision, and shared control in dynamic and uncertain environments, this study presents a brain-computer interface (BCI) framework that enables classification of Electroencephalogram (EEG) signals to detect cognitively demanding and safety-critical events. As a timely and motivating co-robotic engineering application, we simulate a human-in-the-loop scenario to flag risky events in semi-autonomous robotic driving-representative of long-tail cases that pose persistent bottlenecks to the safety performance of smart mobility systems and robotic vehicles. Drawing on recent advances in few-shot learning, we propose a dual-attention Siamese convolutional network paired with Dynamic Time Warping Barycenter Averaging approach to generate robust EEG-encoded signal representations. Inverse source localization reveals activation in Broadman areas 4 and 9, indicating perception-action coupling during task-relevant mental imagery. The model achieves 80% classification accuracy under data-scarce conditions and exhibits a nearly 100% increase in the utility of salient features compared to state-of-the-art methods, as measured through integrated gradient attribution. Beyond performance, this study contributes to our understanding of the cognitive architecture required for BCI agents-particularly the role of attention and memory mechanisms-in categorizing diverse mental states and supporting both inter- and intra-subject adaptation. Overall, this research advances the development of cognitive robotics and socially guided learning for service robots in complex built environments.

arxiv情報

著者 Xiaoshan Zhou,Carol C. Menassa,Vineet R. Kamat
発行日 2025-04-14 15:06:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, cs.RO | Siamese Network with Dual Attention for EEG-Driven Social Learning: Bridging the Human-Robot Gap in Long-Tail Autonomous Driving はコメントを受け付けていません