Sentiment Analysis in SemEval: A Review of Sentiment Identification Approaches

要約

ソーシャルメディアプラットフォームは、メッセージングや意見の表現など、社会的相互作用の基礎になりつつあります。
この点で、センチメント分析手法は、感情、感情、議論されたトピックを含む生成されたデータの検索と分析を確保するためのソリューションの提供に焦点を当てています。
セマンティック評価に関する国際ワークショップ(SEMVAL)などの国際大会は、センチメント分析システムの構築に特別な研究関心を持って多くの研究者や実践者を集めています。
私たちの仕事では、2013年から2021年にかけて、各Semeval Editionのトップランクシステムを研究しています。合計658チームがこれらのエディションに参加し、長年にわたって関心が高まりました。
データ収集、前処理、分類を含むセンチメント分析システムの主要なコンポーネントに焦点を当てて、研究動向の進化をマークする提案されたシステムを分析します。
私たちの研究では、前処理技術の積極的な使用、レキシコンベースのアプローチから単語の埋め込みへの特徴と単語表現、および分類段階よりもニューラルネットワークと変圧器の支配が、すぐに使用できるモデルの使用を促進することを示しています。
さらに、新しいシステムの迅速なプロトタイピングを可能にする実験システムに基づいた洞察を研究者に提供し、将来のセムバルエディションのために実践者が構築するのを支援します。

要約(オリジナル)

Social media platforms are becoming the foundations of social interactions including messaging and opinion expression. In this regard, Sentiment Analysis techniques focus on providing solutions to ensure the retrieval and analysis of generated data including sentiments, emotions, and discussed topics. International competitions such as the International Workshop on Semantic Evaluation (SemEval) have attracted many researchers and practitioners with a special research interest in building sentiment analysis systems. In our work, we study top-ranking systems for each SemEval edition during the 2013-2021 period, a total of 658 teams participated in these editions with increasing interest over years. We analyze the proposed systems marking the evolution of research trends with a focus on the main components of sentiment analysis systems including data acquisition, preprocessing, and classification. Our study shows an active use of preprocessing techniques, an evolution of features engineering and word representation from lexicon-based approaches to word embeddings, and the dominance of neural networks and transformers over the classification phase fostering the use of ready-to-use models. Moreover, we provide researchers with insights based on experimented systems which will allow rapid prototyping of new systems and help practitioners build for future SemEval editions.

arxiv情報

著者 Bousselham El Haddaoui,Raddouane Chiheb,Rdouan Faizi,Abdellatif El Afia
発行日 2025-03-13 15:25:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Sentiment Analysis in SemEval: A Review of Sentiment Identification Approaches はコメントを受け付けていません

Monomial Matrix Group Equivariant Neural Functional Networks

要約

ニューラル機能ネットワーク(NFN)は、ネットワークの一般化やネットワーク編集の予測から暗黙の神経表現の分類に至るまで、多様なアプリケーションのために最近大きな注目を集めています。
以前のNFN設計は、多くの場合、ニューラルネットワークの重みの順列対称に依存していますが、これは伝統的に隠された層のニューロンの順序付けられていない配置から生じています。
ただし、これらの設計では、$ \ relu $ネットワークの重量スケーリング対称性と、$ \ sin $または$ \ tanh $ネットワークの対称性を反転する重量記号を考慮していません。
このホワイトペーパーでは、スケーリング/サインフリッピング対称性を組み込むことにより、順列行列のグループからモノマリアルマトリックスのグループへのネットワーク重みに関するグループアクションの研究を拡張します。
特に、対応する等量層と不変層を設計することにより、これらのスケーリング/サインフリッピング対称性をエンコードします。
私たちは、NFNSの新しいファミリーと名付けられています。モノミアマトリックスグループ等式ニューラル機能ネットワーク(Monomial-NFN)を挙げています。
対称性の拡大により、Monomial-NFNは文献のベースラインNFNと比較して独立したトレーニング可能なパラメーターがはるかに少なく、モデルの効率が向上します。
さらに、完全に接続された畳み込みニューラルネットワークの場合、私たちは、重量スペースに作用している間にこれらのネットワークを不変のままにしておくすべてのグループが、単項マトリックスグループのサブグループであることを理論的に証明します。
既存のベースラインよりもモデルの利点を実証する経験的証拠を提供し、競争力のあるパフォーマンスと効率を達成します。

要約(オリジナル)

Neural functional networks (NFNs) have recently gained significant attention due to their diverse applications, ranging from predicting network generalization and network editing to classifying implicit neural representation. Previous NFN designs often depend on permutation symmetries in neural networks’ weights, which traditionally arise from the unordered arrangement of neurons in hidden layers. However, these designs do not take into account the weight scaling symmetries of $\ReLU$ networks, and the weight sign flipping symmetries of $\sin$ or $\Tanh$ networks. In this paper, we extend the study of the group action on the network weights from the group of permutation matrices to the group of monomial matrices by incorporating scaling/sign-flipping symmetries. Particularly, we encode these scaling/sign-flipping symmetries by designing our corresponding equivariant and invariant layers. We name our new family of NFNs the Monomial Matrix Group Equivariant Neural Functional Networks (Monomial-NFN). Because of the expansion of the symmetries, Monomial-NFN has much fewer independent trainable parameters compared to the baseline NFNs in the literature, thus enhancing the model’s efficiency. Moreover, for fully connected and convolutional neural networks, we theoretically prove that all groups that leave these networks invariant while acting on their weight spaces are some subgroups of the monomial matrix group. We provide empirical evidence to demonstrate the advantages of our model over existing baselines, achieving competitive performance and efficiency.

arxiv情報

著者 Viet-Hoang Tran,Thieu N. Vo,Tho H. Tran,An T. Nguyen,Tan M. Nguyen
発行日 2025-03-13 15:36:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Monomial Matrix Group Equivariant Neural Functional Networks はコメントを受け付けていません

SortingEnv: An Extendable RL-Environment for an Industrial Sorting Process

要約

進化する空間における産業選別システムと研究エージェントの行動を最適化するように設計された新しい強化学習(RL)環境を提示します。
ソートプロセス内の材料の流れをシミュレートする際に、環境は、ベルト速度や占有レベルなどの運用パラメーターを備えたデジタルツインのアイデアに従います。
実際の課題を反映するために、新しいセンサーや高度な機械などの産業用セットアップに一般的なアップグレードを統合します。
したがって、2つのバリエーションが含まれます。個別のベルト速度調整に焦点を当てた基本バージョンと、複数のソートモードと材料組成の強化を導入する高度なバージョンです。
両方の環境の観測スペース、状態の更新メカニズム、報酬機能について詳しく説明します。
さらに、古典的なルールベースのエージェント(RBA)と比較して、近位ポリシー最適化(PPO)、Deep-Q-Networks(DQN)、Advantage Actor Critic(A2C)などの一般的なRLアルゴリズムの効率を評価します。
このフレームワークは、産業プロセスの最適化に役立つだけでなく、進化する環境でエージェントの行動と移転性を研究するための基盤を提供し、モデルのパフォーマンスと実際のRLアプリケーションの実用的な意味合いに関する洞察を提供します。

要約(オリジナル)

We present a novel reinforcement learning (RL) environment designed to both optimize industrial sorting systems and study agent behavior in evolving spaces. In simulating material flow within a sorting process our environment follows the idea of a digital twin, with operational parameters like belt speed and occupancy level. To reflect real-world challenges, we integrate common upgrades to industrial setups, like new sensors or advanced machinery. It thus includes two variants: a basic version focusing on discrete belt speed adjustments and an advanced version introducing multiple sorting modes and enhanced material composition observations. We detail the observation spaces, state update mechanisms, and reward functions for both environments. We further evaluate the efficiency of common RL algorithms like Proximal Policy Optimization (PPO), Deep-Q-Networks (DQN), and Advantage Actor Critic (A2C) in comparison to a classical rule-based agent (RBA). This framework not only aids in optimizing industrial processes but also provides a foundation for studying agent behavior and transferability in evolving environments, offering insights into model performance and practical implications for real-world RL applications.

arxiv情報

著者 Tom Maus,Nico Zengeler,Tobias Glasmachers
発行日 2025-03-13 15:38:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | SortingEnv: An Extendable RL-Environment for an Industrial Sorting Process はコメントを受け付けていません

OODD: Test-time Out-of-Distribution Detection with Dynamic Dictionary

要約

特にテスト時のOODサンプルがトレーニングの外れ値と大きく異なる場合、ディストリビューション(OOD)の検出は深い学習モデルにとって困難なままです。
OODDを提案します。OODDは、微調整せずにOOD辞書を動的に維持および更新する新しいテスト時間OOD検出方法です。
私たちのアプローチは、テスト中に代表的なOOD機能を蓄積する優先キューベースの辞書を活用し、分配中(ID)サンプルのための有益なインライラサンプリング戦略と組み合わせています。
早期のテスト中に安定したパフォーマンスを確保するために、IDデータから派生した戦略的に生成された外れ値を活用するデュアルOOD安定化メカニズムを提案します。
私たちの最高の知識のために、Openoodベンチマークでの広範な実験は、OODDが既存の方法を大幅に上回り、最先端のアプローチと比較してCIFAR-100 FAR OOD検出でFPR95の26.0%の改善を達成することを示しています。
さらに、検出パフォーマンスを維持しながら3倍のスピードアップを達成するKNNベースのOOD検出フレームワークの最適化されたバリアントを提示します。

要約(オリジナル)

Out-of-distribution (OOD) detection remains challenging for deep learning models, particularly when test-time OOD samples differ significantly from training outliers. We propose OODD, a novel test-time OOD detection method that dynamically maintains and updates an OOD dictionary without fine-tuning. Our approach leverages a priority queue-based dictionary that accumulates representative OOD features during testing, combined with an informative inlier sampling strategy for in-distribution (ID) samples. To ensure stable performance during early testing, we propose a dual OOD stabilization mechanism that leverages strategically generated outliers derived from ID data. To our best knowledge, extensive experiments on the OpenOOD benchmark demonstrate that OODD significantly outperforms existing methods, achieving a 26.0% improvement in FPR95 on CIFAR-100 Far OOD detection compared to the state-of-the-art approach. Furthermore, we present an optimized variant of the KNN-based OOD detection framework that achieves a 3x speedup while maintaining detection performance.

arxiv情報

著者 Yifeng Yang,Lin Zhu,Zewen Sun,Hengyu Liu,Qinying Gu,Nanyang Ye
発行日 2025-03-13 15:41:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG | OODD: Test-time Out-of-Distribution Detection with Dynamic Dictionary はコメントを受け付けていません

Deep Learning based discovery of Integrable Systems

要約

統合可能なモデルを発見するための新しい機械学習ベースのフレームワークを紹介します。
私たちのアプローチは、最初にニューラルネットワークの同期アンサンブルを採用して、指定されたクラス内のYang-Baxter方程式の高精度の数値解を見つけます。
次に、代数方程式[Q_2、Q_3] = 0の補助システムを使用し、シードとして深い学習を介して得られたハミルトニアンの数値を使用して、ハミルトニアン家全体を再構築し、代数的な種類を形成します。
局所的な相互作用を備えた3次元および4次元のスピンチェーン形態の3次元および4次元のスピンチェーンでプレゼンテーションを説明します。
驚くべきことに、発見されたすべてのハミルトニアンの家族は、合理的な品種を形成しています。

要約(オリジナル)

We introduce a novel machine learning based framework for discovering integrable models. Our approach first employs a synchronized ensemble of neural networks to find high-precision numerical solution to the Yang-Baxter equation within a specified class. Then, using an auxiliary system of algebraic equations, [Q_2, Q_3] = 0, and the numerical value of the Hamiltonian obtained via deep learning as a seed, we reconstruct the entire Hamiltonian family, forming an algebraic variety. We illustrate our presentation with three- and four-dimensional spin chains of difference form with local interactions. Remarkably, all discovered Hamiltonian families form rational varieties.

arxiv情報

著者 Shailesh Lal,Suvajit Majumder,Evgeny Sobko
発行日 2025-03-13 15:42:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-th, math-ph, math.MP, math.QA, quant-ph | Deep Learning based discovery of Integrable Systems はコメントを受け付けていません

Applying Tabular Deep Learning Models to Estimate Crash Injury Types of Young Motorcyclists

要約

若いモーターサイクリスト、特に15歳から24歳の男性は、スピード違反、交通違反、ヘルメットの使用などの要因により、深刻なクラッシュのリスクが高まっています。
この研究の目的は、2017年から2022年までテキサスで10,726人の若いモーターサイクリストクラッシュを分析することにより、クラッシュの重症度に影響を与える重要な要因を特定することを目的としています。2つの高度な表現の深い学習モデルであるARMNETとMambanetが採用され、高度な再サンプリング手法を使用してクラスの不均衡に対処しました。
モデルは、クラッシュを3つの重症度レベル、致命的または重度、中程度またはマイナーに分類するように訓練されました。
ARMNETは87%の精度を達成し、Mambanetの86%を上回り、両方のモデルが重度のクラッシュの予測に優れており、中程度のクラッシュ分類で課題に直面しています。
主要な調査結果は、クラッシュの結果に対する人口統計学的、環境的、行動要因の重要な影響を強調しています。
この研究では、より厳しいヘルメットの施行や若いモーターサイクリストにカスタマイズされた教育プログラムなど、ターゲットを絞った介入の必要性を強調しています。
これらの洞察は、モーターサイクリストの安全性を高め、クラッシュの重大度を軽減するための証拠に基づいた戦略を開発する際の政策立案者に貴重なガイダンスを提供します。

要約(オリジナル)

Young motorcyclists, particularly those aged 15 to 24 years old, face a heightened risk of severe crashes due to factors such as speeding, traffic violations, and helmet usage. This study aims to identify key factors influencing crash severity by analyzing 10,726 young motorcyclist crashes in Texas from 2017 to 2022. Two advanced tabular deep learning models, ARMNet and MambaNet, were employed, using an advanced resampling technique to address class imbalance. The models were trained to classify crashes into three severity levels, Fatal or Severe, Moderate or Minor, and No Injury. ARMNet achieved an accuracy of 87 percent, outperforming 86 percent of Mambanet, with both models excelling in predicting severe and no injury crashes while facing challenges in moderate crash classification. Key findings highlight the significant influence of demographic, environmental, and behavioral factors on crash outcomes. The study underscores the need for targeted interventions, including stricter helmet enforcement and educational programs customized to young motorcyclists. These insights provide valuable guidance for policymakers in developing evidence-based strategies to enhance motorcyclist safety and reduce crash severity.

arxiv情報

著者 Shriyank Somvanshi,Anannya Ghosh Tusti,Rohit Chakraborty,Subasish Das
発行日 2025-03-13 15:45:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Applying Tabular Deep Learning Models to Estimate Crash Injury Types of Young Motorcyclists はコメントを受け付けていません

A Clifford Algebraic Approach to E(n)-Equivariant High-order Graph Neural Networks

要約

データ対称性を処理できるニューラルネットワークアーキテクチャの設計が重要です。
これは、ユークリッド変換の下で特性が同等である幾何学的グラフにとって特に重要です。
現在の等量グラフニューラルネットワーク(EGNNS)、特にメッセージの合格を使用しているものは、表現力に制限があります。
最近の高次グラフニューラルネットワークはこの制限を克服できますが、化学および物理科学の特定のアプリケーションの顕著な欠点を表す等拡大特性が欠けています。
この論文では、クリフォード代数の文脈で高次の局所構造を統合することで通過する高次のメッセージを強化する新しいEGNNであるClifford Group equivariant Graph Neural Networks(CG-EGNNS)を紹介します。
Clifford代数を使用することの重要な利点として、CG-EGNNは、位置の特徴から等量をキャプチャする機能を学習できます。
高次のメッセージ通過メカニズムを採用することにより、CG-EGNNは隣人からより豊富な情報を獲得し、モデルのパフォーマンスを向上させます。
さらに、$ k $ -hopメッセージパスフレームワークの普遍性を確立し、追加の$ k $ -hopメッセージパッシングメカニズムでCG-EGNNSのより大きな表現力を示します。
CG-EGNNSは、N-Body、CMUモーションキャプチャ、MD17などのさまざまなベンチマークで以前の方法を上回ることを経験的に検証し、幾何学的ディープラーニングにおける有効性を強調しています。

要約(オリジナル)

Designing neural network architectures that can handle data symmetry is crucial. This is especially important for geometric graphs whose properties are equivariance under Euclidean transformations. Current equivariant graph neural networks (EGNNs), particularly those using message passing, have a limitation in expressive power. Recent high-order graph neural networks can overcome this limitation, yet they lack equivariance properties, representing a notable drawback in certain applications in chemistry and physical sciences. In this paper, we introduce the Clifford Group Equivariant Graph Neural Networks (CG-EGNNs), a novel EGNN that enhances high-order message passing by integrating high-order local structures in the context of Clifford algebras. As a key benefit of using Clifford algebras, CG-EGNN can learn functions that capture equivariance from positional features. By adopting the high-order message passing mechanism, CG-EGNN gains richer information from neighbors, thus improving model performance. Furthermore, we establish the universality property of the $k$-hop message passing framework, showcasing greater expressive power of CG-EGNNs with additional $k$-hop message passing mechanism. We empirically validate that CG-EGNNs outperform previous methods on various benchmarks including n-body, CMU motion capture, and MD17, highlighting their effectiveness in geometric deep learning.

arxiv情報

著者 Viet-Hoang Tran,Thieu N. Vo,Tho Tran Huu,Tan Minh Nguyen
発行日 2025-03-13 15:52:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | A Clifford Algebraic Approach to E(n)-Equivariant High-order Graph Neural Networks はコメントを受け付けていません

Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion

要約

リアルタイムでの共同スピーチジェスチャーを生成するには、時間的一貫性と効率的なサンプリングの両方が必要です。
加速されたローリング拡散を導入します。これは、構造化された進行性ノイズスケジューリングでローリング拡散モデルを拡張するストリーミングジェスチャー生成のための新しいフレームワークであり、リアリズムと多様性を維持しながらシームレスな長シーケンスモーション合成を可能にします。
さらに、騒音スケジュールを段階的なはしごに再構築する新しいアプローチであるローリング拡散ラダーアクセラレーション(RDLA)を提案し、複数のフレームを同時に除去できるようにします。
これにより、モーションの一貫性を維持しながらサンプリング効率が大幅に向上し、視覚的な忠実度と時間的一貫性が高い2倍のスピードアップを達成します。
Zeggsのアプローチを評価し、実際の適用性のための強力なベンチマークを獲得します。
私たちのフレームワークは、拡散ベースのジェスチャー生成モデルに普遍的に適用され、ストリーミングアプローチに変換されます。
3つの最先端の方法に適用され、それらを一貫して上回り、リアルタイムの高忠実度の共発発点ジェスチャー合成に対する一般化可能で効率的なソリューションとしての有効性を示しています。

要約(オリジナル)

Generating co-speech gestures in real time requires both temporal coherence and efficient sampling. We introduce Accelerated Rolling Diffusion, a novel framework for streaming gesture generation that extends rolling diffusion models with structured progressive noise scheduling, enabling seamless long-sequence motion synthesis while preserving realism and diversity. We further propose Rolling Diffusion Ladder Acceleration (RDLA), a new approach that restructures the noise schedule into a stepwise ladder, allowing multiple frames to be denoised simultaneously. This significantly improves sampling efficiency while maintaining motion consistency, achieving up to a 2x speedup with high visual fidelity and temporal coherence. We evaluate our approach on ZEGGS and BEAT, strong benchmarks for real-world applicability. Our framework is universally applicable to any diffusion-based gesture generation model, transforming it into a streaming approach. Applied to three state-of-the-art methods, it consistently outperforms them, demonstrating its effectiveness as a generalizable and efficient solution for real-time, high-fidelity co-speech gesture synthesis.

arxiv情報

著者 Evgeniia Vu,Andrei Boiarov,Dmitry Vetrov
発行日 2025-03-13 15:54:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC, cs.LG | Streaming Generation of Co-Speech Gestures via Accelerated Rolling Diffusion はコメントを受け付けていません

Representation Learning, Large-Scale 3D Molecular Pretraining, Molecular Property

要約

分子前の表現(MPR)は、創薬や材料設計などの用途での限られた監視データの課題に対処するための強力なアプローチとして浮上しています。
初期のMPRメソッドは1Dシーケンスと2Dグラフに依存していましたが、最近の進歩により、豊富な原子相互作用をキャプチャするために3D立体配座情報が組み込まれています。
ただし、これらの以前のモデルは分子を単に離散原子セットとして扱い、周囲のスペースを見下ろしています。
私たちは、これらの個別のポイントのみをモデル化するだけでは不十分であると物理的な観点から主張します。
最初に、シンプルでありながら洞察に富んだ観察を提示します。原子を超えてランダムにサンプリングされた仮想ポイントを素朴に追加すると、驚くほどMPRパフォーマンスが向上する可能性があります。
これに照らして、分子が及ぶ3Dスペース全体を組み込んだ原則的なフレームワークを提案します。
3つの重要なコンポーネントを備えた、SpaceFormerと呼ばれる新しい変圧器ベースのアーキテクチャを介してフレームワークを実装します。(1)グリッドベースのスペース離散化。
(2)グリッドサンプリング/マージ。
(3)効率的な3D位置エンコーディング。
広範な実験では、SpaceFormerが限られたデータを持つさまざまな下流タスクにわたって以前の3D MPRモデルを大幅に上回り、MPRモデルの原子を超えた追加の3Dスペースを活用する利点を検証することが示されています。

要約(オリジナル)

Molecular pretrained representations (MPR) has emerged as a powerful approach for addressing the challenge of limited supervised data in applications such as drug discovery and material design. While early MPR methods relied on 1D sequences and 2D graphs, recent advancements have incorporated 3D conformational information to capture rich atomic interactions. However, these prior models treat molecules merely as discrete atom sets, overlooking the space surrounding them. We argue from a physical perspective that only modeling these discrete points is insufficient. We first present a simple yet insightful observation: naively adding randomly sampled virtual points beyond atoms can surprisingly enhance MPR performance. In light of this, we propose a principled framework that incorporates the entire 3D space spanned by molecules. We implement the framework via a novel Transformer-based architecture, dubbed SpaceFormer, with three key components: (1) grid-based space discretization; (2) grid sampling/merging; and (3) efficient 3D positional encoding. Extensive experiments show that SpaceFormer significantly outperforms previous 3D MPR models across various downstream tasks with limited data, validating the benefit of leveraging the additional 3D space beyond atoms in MPR models.

arxiv情報

著者 Shuqi Lu,Xiaohong Ji,Bohang Zhang,Lin Yao,Siyuan Liu,Zhifeng Gao,Linfeng Zhang,Guolin Ke
発行日 2025-03-13 15:55:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM | Representation Learning, Large-Scale 3D Molecular Pretraining, Molecular Property はコメントを受け付けていません

Meta-learning characteristics and dynamics of quantum systems

要約

機械学習は量子技術に大きな期待を抱いていますが、現在の方法のほとんどは、特定の量子システムの予測または制御に焦点を当てています。
ただし、メタラーニングアプローチは、同様のシステムに関連付けられた以前のデータから得られた知識を活用することにより、利用可能なデータがほとんど利用できない新しいシステムに適応できます。
このホワイトペーパーでは、閉じた2レベルのシステム、およびハイゼンベルクモデルのメタラーンダイナミクスと特性と、特性をメタとしています。
さまざまなゲート電圧構成のGE/SIコア/シェルナノワイヤでホストされている損失-Divincenzoスピンキットの実験データに基づいて、Meta-Rearningを使用した$ G $ -FactorおよびRabi周波数、つまり$ G $ -FactorおよびRabi周波数を予測します。
紹介するアルゴリズムは、適応学習率と堅牢性の向上と計算効率の向上などの新しい技術を導入することにより、物理学ベースのシステムの以前の最新メタラーニング方法を改善します。
他のメタラーニング方法、バニラトランス、多層パーセプトロンに対して方法をベンチマークし、パフォーマンスの向上を示します。

要約(オリジナル)

While machine learning holds great promise for quantum technologies, most current methods focus on predicting or controlling a specific quantum system. Meta-learning approaches, however, can adapt to new systems for which little data is available, by leveraging knowledge obtained from previous data associated with similar systems. In this paper, we meta-learn dynamics and characteristics of closed and open two-level systems, as well as the Heisenberg model. Based on experimental data of a Loss-DiVincenzo spin-qubit hosted in a Ge/Si core/shell nanowire for different gate voltage configurations, we predict qubit characteristics i.e. $g$-factor and Rabi frequency using meta-learning. The algorithm we introduce improves upon previous state-of-the-art meta-learning methods for physics-based systems by introducing novel techniques such as adaptive learning rates and a global optimizer for improved robustness and increased computational efficiency. We benchmark our method against other meta-learning methods, a vanilla transformer, and a multilayer perceptron, and demonstrate improved performance.

arxiv情報

著者 Lucas Schorling,Pranav Vaidhyanathan,Jonas Schuff,Miguel J. Carballido,Dominik Zumbühl,Gerard Milburn,Florian Marquardt,Jakob Foerster,Michael A. Osborne,Natalia Ares
発行日 2025-03-13 15:56:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mes-hall, cs.LG, physics.comp-ph, quant-ph | Meta-learning characteristics and dynamics of quantum systems はコメントを受け付けていません