Robotic CBCT Meets Robotic Ultrasound

要約

マルチモダリティイメージングシステムは、コンピューター断層撮影 – 針挿入のための超音波(CT-US)ガイダンスなど、最新の臨床慣行における安全で正確な介入のための最適な融合画像を提供します。
ただし、現在のイメージングデバイスの限られた器用さとモビリティは、標準化されたワークフローへの統合と、完全に自律的な介入システムへの進歩を妨げています。
この論文では、ロボットコーンビームコンピューター断層撮影(CBCT)とロボットUSが事前に調整され、動的に共登録されている新しい臨床セットアップを紹介し、新しい臨床アプリケーションを可能にします。
このセットアップにより、登録のない剛性登録が可能になり、組織の変形がない場合のマルチモーダルガイド手順が促進されます。
まず、システム間で1回限りのプリキャリブレーションが実行されます。
ドップラー信号を自律的に生成されたプロンプトとして使用して、3D CBCTの重要な血管系を強調することにより、Bモード画像からSAM2セグメント容器を強調することにより、安全な挿入経路を確保するために。
登録に基づいて、ドップラー画像またはセグメント化された容器マスクがCBCTにマッピングされ、包括的な詳細を備えた最適な融合画像が作成されます。
システムを検証するために、特別に設計されたファントムを使用しました。これは、シミュレートされた移動流を備えたrib骨と複数の血管で覆われた病変を特徴としています。
米国とCBCTの間のマッピングエラーにより、平均偏差は1.72+-0.62 mmになりました。
ユーザー調査では、針挿入ガイダンスに対するCBCT-US融合の有効性が実証され、時間の効率、精度、成功率の大幅な改善が示されました。
針の介入性能は、従来の米国誘導ワークフローと比較して約50%向上しました。
臨床アプリケーションを導くために設計された最初のロボットデュアルモダリティイメージングシステムを紹介します。
結果は、従来の手動介入と比較して、大幅なパフォーマンスの改善を示しています。

要約(オリジナル)

The multi-modality imaging system offers optimal fused images for safe and precise interventions in modern clinical practices, such as computed tomography – ultrasound (CT-US) guidance for needle insertion. However, the limited dexterity and mobility of current imaging devices hinder their integration into standardized workflows and the advancement toward fully autonomous intervention systems. In this paper, we present a novel clinical setup where robotic cone beam computed tomography (CBCT) and robotic US are pre-calibrated and dynamically co-registered, enabling new clinical applications. This setup allows registration-free rigid registration, facilitating multi-modal guided procedures in the absence of tissue deformation. First, a one-time pre-calibration is performed between the systems. To ensure a safe insertion path by highlighting critical vasculature on the 3D CBCT, SAM2 segments vessels from B-mode images, using the Doppler signal as an autonomously generated prompt. Based on the registration, the Doppler image or segmented vessel masks are then mapped onto the CBCT, creating an optimally fused image with comprehensive detail. To validate the system, we used a specially designed phantom, featuring lesions covered by ribs and multiple vessels with simulated moving flow. The mapping error between US and CBCT resulted in an average deviation of 1.72+-0.62 mm. A user study demonstrated the effectiveness of CBCT-US fusion for needle insertion guidance, showing significant improvements in time efficiency, accuracy, and success rate. Needle intervention performance improved by approximately 50% compared to the conventional US-guided workflow. We present the first robotic dual-modality imaging system designed to guide clinical applications. The results show significant performance improvements compared to traditional manual interventions.

arxiv情報

著者 Feng Li,Yuan Bi,Dianye Huang,Zhongliang Jiang,Nassir Navab
発行日 2025-02-17 16:53:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, eess.IV | Robotic CBCT Meets Robotic Ultrasound はコメントを受け付けていません

AAM-SEALS: Developing Aerial-Aquatic Manipulators in SEa, Air, and Land Simulator

要約

現在のモバイルマニピュレーターと高忠実度のシミュレータには、海、空気、土地にまたがる統合された環境全体でシームレスに動作およびシミュレートする能力がありません。
このギャップに対処するために、AAMがこれらの多様な環境で動作して学習するために設計された包括的で光リアリスティックなシミュレーターである海、空気、およびランドシミュレーター(SEALS)に航空水生マニピュレーター(AAM)を紹介します。
AAMシールの開発は、飛行、水泳、操作のための統合コントローラーの作成、航空ダイナミクスの高忠実度シミュレーションや粒子ベースの流体力学を活用する流体力学など、いくつかの重要な課題に取り組んでいます。
私たちの評価は、滑らかな動作と、空気、水、およびそれらのインターフェイスを介した光エリアスティックな遷移を示しています。
現実世界とシミュレートされたシステム間の位置追跡エラーを比較することにより、粒子ベースの流体力学の忠実度を定量的に検証します。
AAMシールは、ロボット学習、空中ロボット工学、水中ロボット工学、モバイル操作、ロボットシミュレーターなど、幅広いロボットコミュニティに利益をもたらします。
これらの分野での研究の進歩を促進するために、コードとデータをオープンソーシングします。
概要ビデオは、https://youtu.be/mbqiiryvr78で入手できます。
詳細については、プロジェクトWebサイトhttps://aam-seals.umd.eduをご覧ください。

要約(オリジナル)

Current mobile manipulators and high-fidelity simulators lack the ability to seamlessly operate and simulate across integrated environments spanning sea, air, and land. To address this gap, we introduce Aerial-Aquatic Manipulators (AAMs) in SEa, Air, and Land Simulator (SEALS), a comprehensive and photorealistic simulator designed for AAMs to operate and learn in these diverse environments. The development of AAM-SEALS tackles several significant challenges, including the creation of integrated controllers for flying, swimming, and manipulation, and the high-fidelity simulation of aerial dynamics and hydrodynamics leveraging particle-based hydrodynamics. Our evaluation demonstrates smooth operation and photorealistic transitions across air, water, and their interfaces. We quantitatively validate the fidelity of particle-based hydrodynamics by comparing position-tracking errors across real-world and simulated systems. AAM-SEALS benefits a broad range of robotics communities, including robot learning, aerial robotics, underwater robotics, mobile manipulation, and robotic simulators. We will open-source our code and data to foster the advancement of research in these fields. The overview video is available at https://youtu.be/MbqIIrYvR78. Visit our project website at https://aam-seals.umd.edu for more details.

arxiv情報

著者 William Yang,Karthikeya Kona,Yashveer Jain,Tomer Atzili,Abhinav Bhamidipati,Xiaomin Lin,Yantian Zha
発行日 2025-02-17 17:51:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | AAM-SEALS: Developing Aerial-Aquatic Manipulators in SEa, Air, and Land Simulator はコメントを受け付けていません

Bandwidth-Adaptive Spatiotemporal Correspondence Identification for Collaborative Perception

要約

対応識別(COID)は、マルチロボットの共同認識における重要な機能であり、ロボットのグループがそれぞれの視野内の同じオブジェクトを一貫して参照できるようにします。
接続された自律運転などの現実世界のアプリケーションでは、車両は、通信帯域幅が限られているため、生の観察を直接共有する際に課題に直面しています。
この課題に対処するために、共同認識において帯域幅に適応する時空の共同体のための新しいアプローチを提案します。
このアプローチにより、ロボットは部分的な時空の観測を徐々に選択し、他の人と共有することができ、時間の経過とともに動的に変化するコミュニケーションの制約に適応することができます。
接続された自律運転シミュレーションのさまざまなシナリオにわたってアプローチを評価します。
実験結果は、私たちのアプローチがコイドを有効にし、動的通信帯域幅の変化に適応することを検証します。
さらに、私たちのアプローチは、コイドとデータ共有効率のための共同オブジェクトの検索に関して、8%〜56%の全体的な改善を達成し、以前の手法を上回り、最先端のパフォーマンスを達成します。
詳細については、https://gaopeng5.github.io/acoidをご覧ください。

要約(オリジナル)

Correspondence identification (CoID) is an essential capability in multi-robot collaborative perception, which enables a group of robots to consistently refer to the same objects within their respective fields of view. In real-world applications, such as connected autonomous driving, vehicles face challenges in directly sharing raw observations due to limited communication bandwidth. In order to address this challenge, we propose a novel approach for bandwidth-adaptive spatiotemporal CoID in collaborative perception. This approach allows robots to progressively select partial spatiotemporal observations and share with others, while adapting to communication constraints that dynamically change over time. We evaluate our approach across various scenarios in connected autonomous driving simulations. Experimental results validate that our approach enables CoID and adapts to dynamic communication bandwidth changes. In addition, our approach achieves 8%-56% overall improvements in terms of covisible object retrieval for CoID and data sharing efficiency, which outperforms previous techniques and achieves the state-of-the-art performance. More information is available at: https://gaopeng5.github.io/acoid.

arxiv情報

著者 Peng Gao,Williard Joshua Jose,Hao Zhang
発行日 2025-02-17 18:18:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Bandwidth-Adaptive Spatiotemporal Correspondence Identification for Collaborative Perception はコメントを受け付けていません

Sharp-PINNs: staggered hard-constrained physics-informed neural networks for phase field modelling of corrosion

要約

物理学に基づいたニューラルネットワークは、多様な科学分野で部分的な微分方程式(PDE)を解く際に重要な可能性を示しています。
ただし、複雑で強く結合したソリューションでPDEに対処すると、パフォーマンスが悪化することがよくあります。
この作業では、複雑な位相腐食の問題に取り組むための新しいシャープピンフレームワークを紹介します。
Sharp-Pinnsは、すべての管理PDE残差を同時に最小限に抑える代わりに、腐食システムを管理するアレンカーンとカーンヒリアード方程式の残差を交互に最小化するずらしたトレーニングスキームを導入します。
その効率と精度をさらに向上させるために、ランダムフーリエ機能を調整埋め込みとして統合し、修正された多層パーセプトロンを主要なバックボーンとして採用し、出力層のハード制約を強制する高度なニューラルネットワークアーキテクチャを設計します。
このフレームワークは、複数のピットを使用した腐食問題のシミュレーションを通じてベンチマークされています。そこでは、驚異的なトレーニングスキームとネットワークアーキテクチャがPINNの効率と精度の両方を大幅に改善します。
さらに、3次元の場合、私たちのアプローチは、競争の精度を維持しながら、従来の有限要素方法よりも5〜10倍高速であり、腐食予測における実際のエンジニアリングアプリケーションの可能性を示しています。

要約(オリジナル)

Physics-informed neural networks have shown significant potential in solving partial differential equations (PDEs) across diverse scientific fields. However, their performance often deteriorates when addressing PDEs with intricate and strongly coupled solutions. In this work, we present a novel Sharp-PINN framework to tackle complex phase field corrosion problems. Instead of minimizing all governing PDE residuals simultaneously, the Sharp-PINNs introduce a staggered training scheme that alternately minimizes the residuals of Allen-Cahn and Cahn-Hilliard equations, which govern the corrosion system. To further enhance its efficiency and accuracy, we design an advanced neural network architecture that integrates random Fourier features as coordinate embeddings, employs a modified multi-layer perceptron as the primary backbone, and enforces hard constraints in the output layer. This framework is benchmarked through simulations of corrosion problems with multiple pits, where the staggered training scheme and network architecture significantly improve both the efficiency and accuracy of PINNs. Moreover, in three-dimensional cases, our approach is 5-10 times faster than traditional finite element methods while maintaining competitive accuracy, demonstrating its potential for real-world engineering applications in corrosion prediction.

arxiv情報

著者 Nanxi Chen,Chuanjie Cui,Rujin Ma,Airong Chen,Sifan Wang
発行日 2025-02-17 15:56:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.comp-ph | Sharp-PINNs: staggered hard-constrained physics-informed neural networks for phase field modelling of corrosion はコメントを受け付けていません

Massively Scaling Explicit Policy-conditioned Value Functions

要約

明示的なポリシーコンディショニングされたバリュー関数(EPVFS)のスケーリング戦略を導入し、挑戦的な継続制御タスクのパフォーマンスを大幅に改善します。
EPVFSは、ポリシーパラメーターに明示的に条件付けられた値関数V({\ theta})を学習し、ポリシーのパラメーターに直接勾配ベースの更新を可能にします。
ただし、EPVFは、ポリシーパラメーター空間における無制限のパラメーターの成長と効率的な探索に苦労しています。
これらの問題に対処するために、GPUベースのシミュレータ、大きなバッチサイズ、重量クリッピング、スケーリングされた大型の大規模な並列化を利用します。
私たちの結果は、EPVFをスケーリングしてカスタムアリ環境などの複雑なタスクを解決し、近位政策最適化(PPO)やソフトアクタークリティティックなどの最先端のディープ補強学習(DRL)ベースラインと競合できることを示しています。
(SAC)。
さらに、以前の作業と専門のニューラルネットワークアーキテクチャのアクションベースのポリシーパラメーター表現を調査して、以前にDRLのコンテキストで使用されていなかった重量空間機能を効率的に処理します。

要約(オリジナル)

We introduce a scaling strategy for Explicit Policy-Conditioned Value Functions (EPVFs) that significantly improves performance on challenging continuous-control tasks. EPVFs learn a value function V({\theta}) that is explicitly conditioned on the policy parameters, enabling direct gradient-based updates to the parameters of any policy. However, EPVFs at scale struggle with unrestricted parameter growth and efficient exploration in the policy parameter space. To address these issues, we utilize massive parallelization with GPU-based simulators, big batch sizes, weight clipping and scaled peturbations. Our results show that EPVFs can be scaled to solve complex tasks, such as a custom Ant environment, and can compete with state-of-the-art Deep Reinforcement Learning (DRL) baselines like Proximal Policy Optimization (PPO) and Soft Actor-Critic (SAC). We further explore action-based policy parameter representations from previous work and specialized neural network architectures to efficiently handle weight-space features, which have not been used in the context of DRL before.

arxiv情報

著者 Nico Bohlinger,Jan Peters
発行日 2025-02-17 16:02:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Massively Scaling Explicit Policy-conditioned Value Functions はコメントを受け付けていません

Qubit-Based Framework for Quantum Machine Learning: Bridging Classical Data and Quantum Algorithms

要約

この論文は、量子コンピューティングのエキサイティングで急速に成長している分野に分かれ、その中心的なアイデア、現在の進歩、そしてそれが複雑な問題を解決する方法に革命をもたらす方法を説明しています。
それは、Qubits、量子回路、および重ね合わせやエンタングルメントなどの原則が、今日使用している古典的なコンピューターと比べて特定のタスクに対して基本的に異なるものとはるかに強力な量子コンピューターをどのようにするかなど、基本を分解することから始まります。
また、Quantum Computingが複雑な問題をどのように扱うか、そしてそれがクラシックシステムが処理するのに苦労している課題に独自に適している理由を探ります。
このペーパーの大部分は、量子機械学習(QML)に焦点を当てています。ここでは、量子コンピューティングの強みが人工知能の世界に出会います。
大規模なデータセットを処理し、複雑なアルゴリズムを最適化することにより、量子システムは機械学習の新しい可能性を提供します。
量子と古典のコンピューティングを組み合わせるためのさまざまなアプローチを強調し、より高速でより正確な結果を生み出すために協力する方法を示します。
さらに、研究者や開発者がこれらの理論を実現するのに役立つ、利用可能なTensorflow Quantum、Qiskit、およびPennylaneのようなツールとプラットフォームを探索します。
もちろん、量子コンピューティングにはハードルがあります。
ハードウェアのスケールアップ、エラーの修正、Qubitsの安定性を維持するなどの課題は、重要な障害です。
しかし、クラウドベースのプラットフォームと革新的なテクノロジーの急速な進歩により、量子コンピューティングの可能性はこれまで以上に近づいています。
このペーパーは、読者に量子コンピューティングの明確で包括的な紹介、機械学習におけるその役割、およびテクノロジーの将来のために保持される計り知れない可能性を提供することを目的としています。

要約(オリジナル)

This paper dives into the exciting and rapidly growing field of quantum computing, explaining its core ideas, current progress, and how it could revolutionize the way we solve complex problems. It starts by breaking down the basics, like qubits, quantum circuits, and how principles like superposition and entanglement make quantum computers fundamentally different-and far more powerful for certain tasks-than the classical computers we use today. We also explore how quantum computing deals with complex problems and why it is uniquely suited for challenges classical systems struggle to handle. A big part of this paper focuses on Quantum Machine Learning (QML), where the strengths of quantum computing meet the world of artificial intelligence. By processing massive datasets and optimizing intricate algorithms, quantum systems offer new possibilities for machine learning. We highlight different approaches to combining quantum and classical computing, showing how they can work together to produce faster and more accurate results. Additionally, we explore the tools and platforms available-like TensorFlow Quantum, Qiskit and PennyLane-that are helping researchers and developers bring these theories to life. Of course, quantum computing has its hurdles. Challenges like scaling up hardware, correcting errors, and keeping qubits stable are significant roadblocks. Yet, with rapid advancements in cloud-based platforms and innovative technologies, the potential of quantum computing feels closer than ever. This paper aims to offer readers a clear and comprehensive introduction to quantum computing, its role in machine learning, and the immense possibilities it holds for the future of technology.

arxiv情報

著者 Bhavna Bose,Saurav Verma
発行日 2025-02-17 16:04:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, quant-ph | Qubit-Based Framework for Quantum Machine Learning: Bridging Classical Data and Quantum Algorithms はコメントを受け付けていません

Refined PAC-Bayes Bounds for Offline Bandits

要約

このホワイトペーパーでは、盗賊問題におけるポリシー外学習の経験的報酬推定に関する洗練された確率的境界を示します。
Seldin et al。
(2010)およびRodr \ ‘Iguez et al。
(2024)。
この手法は、「確率」パラメーターを最適化するための可能なイベントの空間の離散化に基づいています。
2つのパラメーターのないPACベイの境界を提供します。1つはHoeffding-Azumaの不平等に基づいており、もう1つはBernsteinの不平等に基づいています。
データの実現後に「確率」パラメーターを設定することで得られるのと同じ速度を回復するため、私たちの境界がほぼ最適であることを証明します。

要約(オリジナル)

In this paper, we present refined probabilistic bounds on empirical reward estimates for off-policy learning in bandit problems. We build on the PAC-Bayesian bounds from Seldin et al. (2010) and improve on their results using a new parameter optimization approach introduced by Rodr\’iguez et al. (2024). This technique is based on a discretization of the space of possible events to optimize the ‘in probability’ parameter. We provide two parameter-free PAC-Bayes bounds, one based on Hoeffding-Azuma’s inequality and the other based on Bernstein’s inequality. We prove that our bounds are almost optimal as they recover the same rate as would be obtained by setting the ‘in probability’ parameter after the realization of the data.

arxiv情報

著者 Amaury Gouverneur,Tobias J. Oechtering,Mikael Skoglund
発行日 2025-02-17 16:05:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Refined PAC-Bayes Bounds for Offline Bandits はコメントを受け付けていません

Path Planning for Masked Diffusion Model Sampling

要約

このホワイトペーパーでは、トークンのマスキング順序がマスクされた拡散モデル(MDM)の生成品質にどのように影響するかを探ります。
拡張されたエビデンス下限(Elbo)を導き出し、各ステップでマスクするトークンを選択するプランナーを導入します。
私たちの分析により、代替のアンマスキング戦略が生成パフォーマンスを向上させることができることが明らかになりました。
これに基づいて、Path Planning(P2)を提案します。これは、事前に訓練されたBERTモデルまたは悪魔自体を使用して、決定を導くためにemoiser自体を使用するサンプリングフレームワークを提案します。
P2は、既知のすべてのMDMサンプリング戦略を一般化し、言語生成(コンテキスト学習、コード生成、ストーリーの浸透、数学的推論、逆呪い補正)および生物学的配列生成(タンパク質およびRNA配列)を含む多様なドメインのパフォーマンスを大幅に向上させます。

要約(オリジナル)

In this paper, we explore how token unmasking order influences generative quality in masked diffusion models (MDMs). We derive an expanded evidence lower bound (ELBO) that introduces a planner to select which tokens to unmask at each step. Our analysis reveals that alternative unmasking strategies can enhance generation performance. Building on this, we propose Path Planning (P2), a sampling framework that uses a pre-trained BERT model or the denoiser itself to guide unmasking decisions. P2 generalizes all known MDM sampling strategies and significantly improves performance across diverse domains, including language generation (in-context learning, code generation, story infilling, mathematical reasoning, reverse curse correction) and biological sequence generation (protein and RNA sequences).

arxiv情報

著者 Fred Zhangzhi Peng,Zachary Bezemek,Sawan Patel,Jarrid Rector-Brooks,Sherwood Yao,Alexander Tong,Pranam Chatterjee
発行日 2025-02-17 16:07:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Path Planning for Masked Diffusion Model Sampling はコメントを受け付けていません

Selective Task Group Updates for Multi-Task Optimization

要約

マルチタスク学習により、統一されたアーキテクチャ内で複数のタスクをトレーニングすることにより、タスクジェネリの知識を獲得できます。
ただし、すべてのタスクを単一のアーキテクチャで一緒にトレーニングすると、マルチタスク学習の主な関心事であるネガティブ転送として知られるパフォーマンスの劣化につながる可能性があります。
以前の作品は、勾配操作または加重損失調整を通じてマルチタスクネットワークを最適化することにより、この問題に対処しています。
ただし、最適化戦略は、共有パラメーターのタスクの不均衡に対処し、タスク固有のパラメーターの学習を無視することに焦点を当てています。
その結果、共有スペースとタスク固有の情報の学習が最適化中に互いに影響を与えるため、否定的な転送を緩和する際の制限を示しています。
これに対処するために、タスクを選択的にグループ化し、最適化中に各バッチの更新を行うことにより、マルチタスクのパフォーマンスを向上させる別のアプローチを提案します。
学習プロセス中にタスクを効果的にグループ化し、更新する方法を適応的に決定するアルゴリズムを紹介します。
タスク間の関係を追跡し、マルチタスクネットワークを同時に最適化するために、最適化プロセス中に測定できる近位タスク間親和性を提案します。
タスクを複数のグループに分割し、それらを順次更新することが、タスク固有のパラメーターの学習を強化することにより、マルチタスクのパフォーマンスに順番に大きく影響する方法についての理論的分析を提供します。
当社の方法は、以前のマルチタスク最適化アプローチを大幅に上回っており、さまざまなアーキテクチャやさまざまな数のタスクに拡張可能です。

要約(オリジナル)

Multi-task learning enables the acquisition of task-generic knowledge by training multiple tasks within a unified architecture. However, training all tasks together in a single architecture can lead to performance degradation, known as negative transfer, which is a main concern in multi-task learning. Previous works have addressed this issue by optimizing the multi-task network through gradient manipulation or weighted loss adjustments. However, their optimization strategy focuses on addressing task imbalance in shared parameters, neglecting the learning of task-specific parameters. As a result, they show limitations in mitigating negative transfer, since the learning of shared space and task-specific information influences each other during optimization. To address this, we propose a different approach to enhance multi-task performance by selectively grouping tasks and updating them for each batch during optimization. We introduce an algorithm that adaptively determines how to effectively group tasks and update them during the learning process. To track inter-task relations and optimize multi-task networks simultaneously, we propose proximal inter-task affinity, which can be measured during the optimization process. We provide a theoretical analysis on how dividing tasks into multiple groups and updating them sequentially significantly affects multi-task performance by enhancing the learning of task-specific parameters. Our methods substantially outperform previous multi-task optimization approaches and are scalable to different architectures and various numbers of tasks.

arxiv情報

著者 Wooseong Jeong,Kuk-Jin Yoon
発行日 2025-02-17 16:26:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Selective Task Group Updates for Multi-Task Optimization はコメントを受け付けていません

RDSA: A Robust Deep Graph Clustering Framework via Dual Soft Assignment

要約

グラフクラスタリングは、ノードを個別のクラスターにグループ化することを含むネットワーク分析の重要な側面です。
深い学習の最近の開発により、多くのアプリケーションで効果的であることが証明されているグラフクラスタリングが生じています。
それにもかかわらず、これらの方法は、特に騒々しいエッジの存在下で、実際のグラフを扱うときに困難に遭遇することがよくあります。
さらに、多くの除去グラフクラスタリング方法は、非異数のモデルと比較して、パフォーマンスの低下、トレーニング不安定性、および大規模なデータセットへのスケーリングにおける課題に悩まされる傾向があります。
これらの問題に取り組むために、デュアルソフト割り当て(RDSA)を介して、堅牢なディープグラフクラスタリングフレームワークと呼ばれる新しいフレームワークを紹介します。
RDSAは、3つの重要なコンポーネントで構成されています。(i)グラフのトポロジ機能とノード属性を効果的に統合するノード埋め込みモジュール。
(ii)ノード割り当てにアフィニティマトリックスを使用することによりグラフモジュール性を向上させる構造ベースのソフト割り当てモジュール。
(iii)コミュニティのランドマークを識別し、ノード割り当てを改良してモデルの堅牢性を高めるノードベースのソフト割り当てモジュール。
さまざまな現実世界のデータセットでRDSAを評価し、既存の最先端の方法に比べて優れたパフォーマンスを実証します。
私たちの調査結果は、RDSAがさまざまなグラフタイプにわたって堅牢なクラスタリングを提供し、ノイズ、安定性、スケーラビリティへの適応性を含むクラスタリングの有効性と堅牢性に優れていることを示しています。

要約(オリジナル)

Graph clustering is an essential aspect of network analysis that involves grouping nodes into separate clusters. Recent developments in deep learning have resulted in graph clustering, which has proven effective in many applications. Nonetheless, these methods often encounter difficulties when dealing with real-world graphs, particularly in the presence of noisy edges. Additionally, many denoising graph clustering methods tend to suffer from lower performance, training instability, and challenges in scaling to large datasets compared to non-denoised models. To tackle these issues, we introduce a new framework called the Robust Deep Graph Clustering Framework via Dual Soft Assignment (RDSA). RDSA consists of three key components: (i) a node embedding module that effectively integrates the graph’s topological features and node attributes; (ii) a structure-based soft assignment module that improves graph modularity by utilizing an affinity matrix for node assignments; and (iii) a node-based soft assignment module that identifies community landmarks and refines node assignments to enhance the model’s robustness. We assess RDSA on various real-world datasets, demonstrating its superior performance relative to existing state-of-the-art methods. Our findings indicate that RDSA provides robust clustering across different graph types, excelling in clustering effectiveness and robustness, including adaptability to noise, stability, and scalability.

arxiv情報

著者 Yang Xiang,Li Fan,Tulika Saha,Xiaoying Pang,Yushan Pan,Haiyang Zhang,Chengtao Ji
発行日 2025-02-17 16:26:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG | RDSA: A Robust Deep Graph Clustering Framework via Dual Soft Assignment はコメントを受け付けていません