Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory

要約

摂動または勾配を使用した機能ベースの説明は、ブラックボックス機械学習モデルの決定を理解するための一般的なツールです。
しかし、これらの方法の違いはまだほとんど不明のままであり、実践者への適用性を制限します。
この作業では、2つの確立された概念を使用して、ローカルおよびグローバルな機能ベースの説明のための統合フレームワークを紹介します。統計からの機能的ANOVA(FANOVA)、および協同ゲーム理論からの価値と相互作用の概念です。
特徴分布の影響を決定する3つのFanova分解を導入し、Shapleyの値や相互作用などのゲーム理論測定を使用して、高次の相互作用の影響を指定します。
私たちのフレームワークは、これらの2つの次元を組み合わせて、機能の特徴とグループのグループの幅広い説明技術の類似点と相違点を明らかにします。
次に、合成および実世界のデータセットに関するフレームワークの有用性を経験的に紹介します。

要約(オリジナル)

Feature-based explanations, using perturbations or gradients, are a prevalent tool to understand decisions of black box machine learning models. Yet, differences between these methods still remain mostly unknown, which limits their applicability for practitioners. In this work, we introduce a unified framework for local and global feature-based explanations using two well-established concepts: functional ANOVA (fANOVA) from statistics, and the notion of value and interaction from cooperative game theory. We introduce three fANOVA decompositions that determine the influence of feature distributions, and use game-theoretic measures, such as the Shapley value and interactions, to specify the influence of higher-order interactions. Our framework combines these two dimensions to uncover similarities and differences between a wide range of explanation techniques for features and groups of features. We then empirically showcase the usefulness of our framework on synthetic and real-world datasets.

arxiv情報

著者 Fabian Fumagalli,Maximilian Muschalik,Eyke Hüllermeier,Barbara Hammer,Julia Herbinger
発行日 2025-04-17 16:06:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory はコメントを受け付けていません

AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks

要約

グラフニューラルネットワークに対する敵対的な攻撃は、グラフトポロジとノード属性を慎重に変更することにより、学習者のパフォーマンスを混乱させることを目的としています。
既存の方法は、グラフプロパティの変更と違いを制約することにより、攻撃のステルス性を実現します。
ただし、これらの方法は通常、タスクに関連する一次セマンティクスを直接混乱させ、攻撃の防御性と検出可能性が低くなります。
この論文では、グラフニューラルネットワーク(AHSG)の高レベルセマンティクスに対する敵対的な攻撃を提案します。これは、一次セマンティクスの保持を保証するグラフ構造攻撃モデルです。
潜在的な表現を共有された一次セマンティクスと組み合わせることにより、モデルは元のグラフの検出可能な属性とリレーショナルパターンを保持しながら、より微妙な変更を活用して攻撃を実行します。
次に、投影された勾配降下アルゴリズムを使用して、潜在的な表現と攻撃効果を敵対的なグラフにマッピングします。
防衛戦略を備えた堅牢なグラフディープラーニングモデルの実験を通じて、AHSGが攻撃の有効性における他の最先端の方法よりも優れていることを実証します。
さらに、コンテキスト確率的ブロックモデルを使用して攻撃されたグラフを検出すると、メソッドがグラフの主要なセマンティクスを保持することをさらに検証します。

要約(オリジナル)

Adversarial attacks on Graph Neural Networks aim to perturb the performance of the learner by carefully modifying the graph topology and node attributes. Existing methods achieve attack stealthiness by constraining the modification budget and differences in graph properties. However, these methods typically disrupt task-relevant primary semantics directly, which results in low defensibility and detectability of the attack. In this paper, we propose an Adversarial Attack on High-level Semantics for Graph Neural Networks (AHSG), which is a graph structure attack model that ensures the retention of primary semantics. By combining latent representations with shared primary semantics, our model retains detectable attributes and relational patterns of the original graph while leveraging more subtle changes to carry out the attack. Then we use the Projected Gradient Descent algorithm to map the latent representations with attack effects to the adversarial graph. Through experiments on robust graph deep learning models equipped with defense strategies, we demonstrate that AHSG outperforms other state-of-the-art methods in attack effectiveness. Additionally, using Contextual Stochastic Block Models to detect the attacked graph further validates that our method preserves the primary semantics of the graph.

arxiv情報

著者 Kai Yuan,Jiahao Zhang,Yidi Wang,Xiaobing Pei
発行日 2025-04-17 16:13:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks はコメントを受け付けていません

Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance

要約

ロボット学習の進歩により、ロボットはさまざまなタスクのスキルを生み出すことができました。
しかし、ロボット学習は通常、サンプルでは非効率的であり、さまざまな行動を示すデータソースから学ぶのに苦労しており、自然に制約を取り入れていません。
これらのプロパティは、テーブルテニスを再生するなど、高速でアジャイルなタスクにとって重要です。
デモンストレーションから学ぶための最新の手法は、サンプルの効率とスケールを多様なデータに改善しますが、アジャイルタスクではほとんど評価されません。
強化学習の場合、優れたパフォーマンスを達成するには、高忠実度のシミュレータでのトレーニングが必要です。
これらの制限を克服するために、オフライン、制約誘導、多様なアジャイル行動を表現する新しい拡散モデリングアプローチを開発します。
私たちのアプローチの鍵は、ロボットアームの順方向運動学と拡散モデルの両方を介して勾配を計算してサンプリングプロセスを指示する運動学的制約勾配ガイダンス(KCGG)手法です。
KCGGは、制約に違反するコストを最小限に抑え、同時にトレーニングデータのサンプリングされた軌跡を維持します。
2つの挑戦的なドメインのKCGGを評価することにより、時間型のロボットタスクに対するアプローチの有効性を実証します:シミュレートされたエアホッケーとリアルテーブルテニス。
シミュレートされたエアホッケーでは、ブロックレートが25.4%増加しましたが、卓球学習ベースラインと比較して成功率が17.3%増加したことがわかりました。

要約(オリジナル)

Advances in robot learning have enabled robots to generate skills for a variety of tasks. Yet, robot learning is typically sample inefficient, struggles to learn from data sources exhibiting varied behaviors, and does not naturally incorporate constraints. These properties are critical for fast, agile tasks such as playing table tennis. Modern techniques for learning from demonstration improve sample efficiency and scale to diverse data, but are rarely evaluated on agile tasks. In the case of reinforcement learning, achieving good performance requires training on high-fidelity simulators. To overcome these limitations, we develop a novel diffusion modeling approach that is offline, constraint-guided, and expressive of diverse agile behaviors. The key to our approach is a kinematic constraint gradient guidance (KCGG) technique that computes gradients through both the forward kinematics of the robot arm and the diffusion model to direct the sampling process. KCGG minimizes the cost of violating constraints while simultaneously keeping the sampled trajectory in-distribution of the training data. We demonstrate the effectiveness of our approach for time-critical robotic tasks by evaluating KCGG in two challenging domains: simulated air hockey and real table tennis. In simulated air hockey, we achieved a 25.4% increase in block rate, while in table tennis, we saw a 17.3% increase in success rate compared to imitation learning baselines.

arxiv情報

著者 Kin Man Lee,Sean Ye,Qingyu Xiao,Zixuan Wu,Zulfiqar Zaidi,David B. D’Ambrosio,Pannag R. Sanketi,Matthew Gombolay
発行日 2025-04-17 16:22:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance はコメントを受け付けていません

An All-Atom Generative Model for Designing Protein Complexes

要約

タンパク質は通常、複合体に存在し、他のタンパク質や生体分子と相互作用して特定の生物学的役割を実行します。
シングルチェーンタンパク質モデリングに関する研究は、ESMやAlphafoldのシリーズなどのモデルで進歩が見られるように広範かつ深く調査されています。
これらの開発にもかかわらず、多鎖タンパク質の研究とモデリングは、生物学的機能を理解するために不可欠ですが、ほとんどチャートされていないままです。
これらの相互作用の重要性を認識して、マルチチェーンタンパク質のモデリング用に特別に設計されたモデルであるAPM(全原子タンパク質生成モデル)を紹介します。
APMは、原子レベルの情報を統合し、マルチチェーンタンパク質に関するデータを活用することにより、鎖間相互作用を正確にモデル化し、タンパク質複合体をゼロから結合能力を備えたデザインを設計することができます。
また、マルチ鎖タンパク質の折りたたみおよび逆折りたたみのタスクを実行します。
さらに、APMはダウンストリームアプリケーションで汎用性を示します。これは、特定のタスクでのゼロショットサンプリングをサポートし、最先端の結果を達成すると同時に、監視された微調整(SFT)を通じてパフォーマンスの向上を実現します。
コードはhttps://github.com/bytedance/apmでリリースされます。

要約(オリジナル)

Proteins typically exist in complexes, interacting with other proteins or biomolecules to perform their specific biological roles. Research on single-chain protein modeling has been extensively and deeply explored, with advancements seen in models like the series of ESM and AlphaFold. Despite these developments, the study and modeling of multi-chain proteins remain largely uncharted, though they are vital for understanding biological functions. Recognizing the importance of these interactions, we introduce APM (All-Atom Protein Generative Model), a model specifically designed for modeling multi-chain proteins. By integrating atom-level information and leveraging data on multi-chain proteins, APM is capable of precisely modeling inter-chain interactions and designing protein complexes with binding capabilities from scratch. It also performs folding and inverse-folding tasks for multi-chain proteins. Moreover, APM demonstrates versatility in downstream applications: it achieves enhanced performance through supervised fine-tuning (SFT) while also supporting zero-shot sampling in certain tasks, achieving state-of-the-art results. Code will be released at https://github.com/bytedance/apm.

arxiv情報

著者 Ruizhe Chen,Dongyu Xue,Xiangxin Zhou,Zaixiang Zheng,Xiangxiang Zeng,Quanquan Gu
発行日 2025-04-17 16:37:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | An All-Atom Generative Model for Designing Protein Complexes はコメントを受け付けていません

Learning from Similar Linear Representations: Adaptivity, Minimaxity, and Robustness

要約

代表マルチタスク学習(MTL)は、実際に大きな成功を収めています。
ただし、これらの方法の理論的理解はまだ不足しています。
ほとんどの既存の理論的作品は、すべてのタスクが同じ表現を共有し、MTLがほとんど常にパフォーマンスを改善すると主張する場合に焦点を当てています。
それにもかかわらず、タスクの数が増えるにつれて、すべてのタスクが同じ表現を共有すると仮定すると、非現実的です。
さらに、経験的な調査結果は、共有された表現が必ずしもシングルタスク学習パフォーマンスを改善しないことをしばしば示しています。
この論文では、外れ値のタスクを扱いながら、\ textIT {類似ではないが正確には}線形表現では、タスクから学習する方法を理解することを目指しています。
既知の固有の次元を仮定すると、類似性構造に\ textit {adaptive}であり、\ textit {robust}である\ textit {adaptive}であるスペクトルメソッドを、ペナルティを受けた経験的リスク最小化方法と、外れ値のタスクに\ textit {robust}を提案します。
両方のアルゴリズムは、タスク全体の表現が十分に類似しており、外れ値のタスクの割合が小さい場合、シングルタスク学習よりも優れています。
さらに、表現が類似している場合でも、少なくともシングルタスク学習と同様に常に実行されます。
情報理論の下限を提供して、両方の方法が大規模なレジームではほぼ\ textit {minimax}が最適であり、外れ値のタスクがない場合にスペクトル法が最適であることを実証します。
さらに、未知の本質的な次元に適応するために、しきい値アルゴリズムを導入します。
理論的な調査結果を検証するために、広範な数値実験を実施します。

要約(オリジナル)

Representation multi-task learning (MTL) has achieved tremendous success in practice. However, the theoretical understanding of these methods is still lacking. Most existing theoretical works focus on cases where all tasks share the same representation, and claim that MTL almost always improves performance. Nevertheless, as the number of tasks grows, assuming all tasks share the same representation is unrealistic. Furthermore, empirical findings often indicate that a shared representation does not necessarily improve single-task learning performance. In this paper, we aim to understand how to learn from tasks with \textit{similar but not exactly the same} linear representations, while dealing with outlier tasks. Assuming a known intrinsic dimension, we propose a penalized empirical risk minimization method and a spectral method that are \textit{adaptive} to the similarity structure and \textit{robust} to outlier tasks. Both algorithms outperform single-task learning when representations across tasks are sufficiently similar and the proportion of outlier tasks is small. Moreover, they always perform at least as well as single-task learning, even when the representations are dissimilar. We provide information-theoretic lower bounds to demonstrate that both methods are nearly \textit{minimax} optimal in a large regime, with the spectral method being optimal in the absence of outlier tasks. Additionally, we introduce a thresholding algorithm to adapt to an unknown intrinsic dimension. We conduct extensive numerical experiments to validate our theoretical findings.

arxiv情報

著者 Ye Tian,Yuqi Gu,Yang Feng
発行日 2025-04-17 16:40:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Learning from Similar Linear Representations: Adaptivity, Minimaxity, and Robustness はコメントを受け付けていません

dsld: A Socially Relevant Tool for Teaching Statistics

要約

データサイエンスの成長力は、社会的差別に対処する上で重要な役割を果たすことができ、微妙な理解とバイアスの効果的な緩和戦略を必要とします。
「Data Scienceの見方」(DSLD)は、人種、性別、年齢などの保護グループに関連する可能性のある差別を評価するための統計的およびグラフィカルな方法の包括的なツールキットをユーザーに提供するように設計されたRおよびPythonパッケージです。
このパッケージは、交絡因子を特定して緩和し、予測アルゴリズムで保護されたグループに対するバイアスを削減することにより、重大な問題に対処します。
教育環境では、DSLDは、インストラクターに、差別分析の現実世界の例を動機付けて統計原則を教えるための強力なツールを提供します。
80ページのQuarto Bookを含めることで、これらの分析ツールを実際のシナリオに効果的に適用する際に、統計教育者から法律専門家へのユーザーがさらにサポートされます。

要約(オリジナル)

The growing power of data science can play a crucial role in addressing social discrimination, necessitating nuanced understanding and effective mitigation strategies for biases. ‘Data Science Looks At Discrimination’ (DSLD) is an R and Python package designed to provide users with a comprehensive toolkit of statistical and graphical methods for assessing possible discrimination related to protected groups such as race, gender, and age. The package addresses critical issues by identifying and mitigating confounders and reducing bias against protected groups in prediction algorithms. In educational settings, DSLD offers instructors powerful tools to teach statistical principles through motivating real world examples of discrimination analysis. The inclusion of an 80 page Quarto book further supports users from statistics educators to legal professionals in effectively applying these analytical tools to real world scenarios.

arxiv情報

著者 Taha Abdullah,Arjun Ashok,Brandon Zarate,Shubhada Martha,Billy Ouattara,Norman Matloff,Aditya Mittal
発行日 2025-04-17 17:23:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG, stat.AP, stat.ME | dsld: A Socially Relevant Tool for Teaching Statistics はコメントを受け付けていません

Propagation of Chaos in One-hidden-layer Neural Networks beyond Logarithmic Time

要約

多項式幅ニューラルネットワークのダイナミクスとその無限幅の対応物との間の近似ギャップを研究します。
平均フィールドダイナミクスによって支配された微分方程式を通して、この近似ギャップを緊密に結合する方法を示します。
このオードの成長に影響を与える重要な要因は、各粒子の局所的なヘシアンであり、その位置に関する平均場ダイナミクスにおける粒子の速度の誘導体として定義されます。
適切に指定されたシングルインデックスモデルを推定するという標準機能学習問題に結果を適用します。
情報指数を任意に大きくすることを許可し、周囲の次元で多項式に成長する収束時間に至ります。
これらの問題における特定の「自己矛盾」の特性により、粒子の局所ヘシアンは粒子の速度の一定の倍に境界を搭載しているため、トレーニング全体の平均フィールドダイナミクスを綿密に近似するのに十分な多項式では、多項式的に多くのニューロンが十分です。

要約(オリジナル)

We study the approximation gap between the dynamics of a polynomial-width neural network and its infinite-width counterpart, both trained using projected gradient descent in the mean-field scaling regime. We demonstrate how to tightly bound this approximation gap through a differential equation governed by the mean-field dynamics. A key factor influencing the growth of this ODE is the local Hessian of each particle, defined as the derivative of the particle’s velocity in the mean-field dynamics with respect to its position. We apply our results to the canonical feature learning problem of estimating a well-specified single-index model; we permit the information exponent to be arbitrarily large, leading to convergence times that grow polynomially in the ambient dimension $d$. We show that, due to a certain “self-concordance” property in these problems — where the local Hessian of a particle is bounded by a constant times the particle’s velocity — polynomially many neurons are sufficient to closely approximate the mean-field dynamics throughout training.

arxiv情報

著者 Margalit Glasgow,Denny Wu,Joan Bruna
発行日 2025-04-17 17:24:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Propagation of Chaos in One-hidden-layer Neural Networks beyond Logarithmic Time はコメントを受け付けていません

Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification

要約

深い学習ベースの軌道予測モデルは、複雑な相互作用をキャプチャする際に有望な能力を実証しています。
ただし、特に不均衡なデータと堅牢性とキャリブレーションを確保するのに十分なデータと多様性が不足しているため、配布不足の一般化は重要な課題のままです。
これに対処するために、シフト(軌道のスペクトルヘテロスケーティスティック情報に基づいた予測)を提案します。これは、自動化されたルール抽出を通じて導き出された有益なプライアーと独自に校正された不確実性モデリングを一意に組み合わせた新しいフレームワークです。
Shiftは、軌道予測を分類タスクとして再フォーリュールし、異種のスペクトル正規化ガウスプロセスを採用して、認識論的および偶然の不確実性を効果的に解き放ちます。
大規模な言語モデルを搭載した検索された生成フレームワークを使用して、停止ルールやドライバビリティの制約などの自然言語運転ルールから自動的に生成されるトレーニングラベルから有益なプライアーを学びます。
挑戦的な低データや架橋シナリオを含むヌスセンデータセットをめぐる広範な評価は、シフトが最先端の方法を上回り、不確実性のキャリブレーションと変位メトリックの大幅な利益を達成することを示しています。
特に、私たちのモデルは、不確実性が本質的に高い交差点などの複雑なシナリオで優れています。
プロジェクトページ:https://kumarmanas.github.io/shift/。

要約(オリジナル)

Deep learning-based trajectory prediction models have demonstrated promising capabilities in capturing complex interactions. However, their out-of-distribution generalization remains a significant challenge, particularly due to unbalanced data and a lack of enough data and diversity to ensure robustness and calibration. To address this, we propose SHIFT (Spectral Heteroscedastic Informed Forecasting for Trajectories), a novel framework that uniquely combines well-calibrated uncertainty modeling with informative priors derived through automated rule extraction. SHIFT reformulates trajectory prediction as a classification task and employs heteroscedastic spectral-normalized Gaussian processes to effectively disentangle epistemic and aleatoric uncertainties. We learn informative priors from training labels, which are automatically generated from natural language driving rules, such as stop rules and drivability constraints, using a retrieval-augmented generation framework powered by a large language model. Extensive evaluations over the nuScenes dataset, including challenging low-data and cross-location scenarios, demonstrate that SHIFT outperforms state-of-the-art methods, achieving substantial gains in uncertainty calibration and displacement metrics. In particular, our model excels in complex scenarios, such as intersections, where uncertainty is inherently higher. Project page: https://kumarmanas.github.io/SHIFT/.

arxiv情報

著者 Kumar Manas,Christian Schlauch,Adrian Paschke,Christian Wirth,Nadja Klein
発行日 2025-04-17 17:24:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification はコメントを受け付けていません

Hadamard product in deep learning: Introduction, Advances and Challenges

要約

畳み込みと自己関節のメカニズムは、深い学習において建築設計を支配していますが、この調査では、根本的ではあるが理解されていない原始であるHadamard製品を検証しています。
さまざまなアプリケーションにわたる広範な実装にもかかわらず、Hadamard製品はコアアーキテクチャプリミティブとして体系的に分析されていません。
高次相関、マルチモーダルデータ融合、動的表現変調、および効率的なペアワイズ操作の4つの主要なドメインを識別し、ディープラーニングにおけるアプリケーションの最初の包括的な分類法を提示します。
Hadamard製品の非線形相互作用を線形計算の複雑さとモデル化する能力は、リソースに制約のある展開とエッジコンピューティングシナリオにとって特に価値があります。
視覚的な質問への回答などのマルチモーダル融合タスクにおけるその自然な適用性、および画像の開始や剪定などのアプリケーションの表現マスキングにおけるその有効性を実証します。
この系統的レビューは、深い学習アーキテクチャにおけるHadamard製品の役割に関する既存の知識を統合するだけでなく、将来の建築革新の基盤を確立します。
私たちの分析により、Hadamard製品は、計算効率と表現力の間の説得力のあるトレードオフを提供し、深い学習ツールキットの重要なコンポーネントとして配置する多目的な原始的な原始として明らかになりました。

要約(オリジナル)

While convolution and self-attention mechanisms have dominated architectural design in deep learning, this survey examines a fundamental yet understudied primitive: the Hadamard product. Despite its widespread implementation across various applications, the Hadamard product has not been systematically analyzed as a core architectural primitive. We present the first comprehensive taxonomy of its applications in deep learning, identifying four principal domains: higher-order correlation, multimodal data fusion, dynamic representation modulation, and efficient pairwise operations. The Hadamard product’s ability to model nonlinear interactions with linear computational complexity makes it particularly valuable for resource-constrained deployments and edge computing scenarios. We demonstrate its natural applicability in multimodal fusion tasks, such as visual question answering, and its effectiveness in representation masking for applications including image inpainting and pruning. This systematic review not only consolidates existing knowledge about the Hadamard product’s role in deep learning architectures but also establishes a foundation for future architectural innovations. Our analysis reveals the Hadamard product as a versatile primitive that offers compelling trade-offs between computational efficiency and representational power, positioning it as a crucial component in the deep learning toolkit.

arxiv情報

著者 Grigorios G Chrysos,Yongtao Wu,Razvan Pascanu,Philip Torr,Volkan Cevher
発行日 2025-04-17 17:26:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Hadamard product in deep learning: Introduction, Advances and Challenges はコメントを受け付けていません

Quorum: Zero-Training Unsupervised Anomaly Detection using Quantum Autoencoders

要約

ミッションクリティカルな異常なイベントとデータを検出することは、金融、ヘルスケア、エネルギーなど、さまざまな業界にわたる重要な課題です。
量子コンピューティングは最近、いくつかの機械学習タスクに取り組むための強力なツールとして浮上していますが、特に勾配計算の難しさにより、量子機械学習モデルのトレーニングは依然として困難です。
異常検出の課題はさらに大きく、監視されていない学習方法が実用的な適用性を確保するために不可欠です。
これらの問題に対処するために、トレーニングを必要とせずに動作する監視されていない学習のために設計された最初の量子異常検出フレームワークであるQuorumを提案します。

要約(オリジナル)

Detecting mission-critical anomalous events and data is a crucial challenge across various industries, including finance, healthcare, and energy. Quantum computing has recently emerged as a powerful tool for tackling several machine learning tasks, but training quantum machine learning models remains challenging, particularly due to the difficulty of gradient calculation. The challenge is even greater for anomaly detection, where unsupervised learning methods are essential to ensure practical applicability. To address these issues, we propose Quorum, the first quantum anomaly detection framework designed for unsupervised learning that operates without requiring any training.

arxiv情報

著者 Jason Zev Ludmir,Sophia Rebello,Jacob Ruiz,Tirthak Patel
発行日 2025-04-17 17:27:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.ET, cs.LG | Quorum: Zero-Training Unsupervised Anomaly Detection using Quantum Autoencoders はコメントを受け付けていません