TDFANet: Encoding Sequential 4D Radar Point Clouds Using Trajectory-Guided Deformable Feature Aggregation for Place Recognition

要約

場所の認識は、自動運転車やモバイルロボットで閉ループまたはグローバルなポジショニングを達成するために不可欠です。
2Dカメラまたは3D LIDARを使用した最近の適切な認識にもかかわらず、4Dレーダーを使用する方法を確認するために4Dレーダーを使用する方法はまだ分からない。
Lidar Point Cloudsと比較して、レーダーデータは劇的にスパースで、騒々しく、解像度がはるかに低く、シーンを効果的に表現する能力を妨げ、4Dレーダーベースの場所認識に大きな課題をもたらします。
この作業は、順次4Dレーダースキャンからのマルチモーダル情報を活用し、時空間的特徴を効果的に抽出して集約することにより、これらの課題に対処します。私たちのアプローチは、(1)ベロシティプロパティからの動的なポイント除去とエゴ速度推定を構成する原則的なパイプラインに従います。
自我速度によって計算された軌跡、(4)整列したBEV機能マップの多面的な時空間特徴が抽出され、集計されています。現実世界の実験結果は、提案された方法の実現可能性を検証し、動的環境の取り扱いにおけるその堅牢性を実証します。
ソースコードが利用可能です。

要約(オリジナル)

Place recognition is essential for achieving closed-loop or global positioning in autonomous vehicles and mobile robots. Despite recent advancements in place recognition using 2D cameras or 3D LiDAR, it remains to be seen how to use 4D radar for place recognition – an increasingly popular sensor for its robustness against adverse weather and lighting conditions. Compared to LiDAR point clouds, radar data are drastically sparser, noisier and in much lower resolution, which hampers their ability to effectively represent scenes, posing significant challenges for 4D radar-based place recognition. This work addresses these challenges by leveraging multi-modal information from sequential 4D radar scans and effectively extracting and aggregating spatio-temporal features.Our approach follows a principled pipeline that comprises (1) dynamic points removal and ego-velocity estimation from velocity property, (2) bird’s eye view (BEV) feature encoding on the refined point cloud, (3) feature alignment using BEV feature map motion trajectory calculated by ego-velocity, (4) multi-scale spatio-temporal features of the aligned BEV feature maps are extracted and aggregated.Real-world experimental results validate the feasibility of the proposed method and demonstrate its robustness in handling dynamic environments. Source codes are available.

arxiv情報

著者 Shouyi Lu,Guirong Zhuo,Haitao Wang,Quan Zhou,Huanyu Zhou,Renbo Huang,Minqing Huang,Lianqing Zheng,Qiang Shu
発行日 2025-04-07 14:10:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | TDFANet: Encoding Sequential 4D Radar Point Clouds Using Trajectory-Guided Deformable Feature Aggregation for Place Recognition はコメントを受け付けていません

Reducing the Communication of Distributed Model Predictive Control: Autoencoders and Formation Control

要約

コミュニケーションは、ワイヤレス通信の進歩にもかかわらず、現実的な設定における分散モデル予測制御(DMPC)の適用性を制限する重要な要因のままです。
DMPCスキームは、データの量が予測期間の長さに依存するため、エージェント間の圧倒的な量の情報交換を必要とする場合があります。この場合、一部のアプリケーションは公称の漸近安定性を正式に保証するためにかなりの長さを必要とします。
この作業は、エージェント間の通信データのサイズを削減することにより、DMPCの通信努力を減らすアプローチを提供することを目的としています。
自動エンコーダーを使用して、通信データは通信前に自動エンコーダーのエンコーダー部分によって削減され、DMPCスキームを構成する分散最適化アルゴリズム内で受信時にデコーダーパーツによって再構築されます。
学習ベースの削減方法の選択は、データに固有の構造によって動機付けられ、最適な制御問題のソリューションへのデータの接続に起因します。
このアプローチは、微分駆動ロボットの形成制御の例で実装およびテストされます。これは、ロボットの非ホロニック制約のために最適化ベースの制御に挑戦し、モバイルロボット工学の実際的な重要性のために興味深いものです。
提案されたアプローチの適用性は、最初に、結果として生じる制御性能が満足のいく精度をもたらすことを示すシミュレーション分析の形式で提示されます。
特に、提案されたアプローチは、予測地平線の長さを減らすことにより、コミュニケーションを減らすための標準的な素朴な方法よりも優れています。
さらに、埋め込み計算ハードウェアで実施された数値実験は、実際の分散計算とワイヤレス通信により、完全な通信が失敗した実際のシナリオでも通信を減らす提案された方法とうまく機能することが示されています。

要約(オリジナル)

Communication remains a key factor limiting the applicability of distributed model predictive control (DMPC) in realistic settings, despite advances in wireless communication. DMPC schemes can require an overwhelming amount of information exchange between agents as the amount of data depends on the length of the predication horizon, for which some applications require a significant length to formally guarantee nominal asymptotic stability. This work aims to provide an approach to reduce the communication effort of DMPC by reducing the size of the communicated data between agents. Using an autoencoder, the communicated data is reduced by the encoder part of the autoencoder prior to communication and reconstructed by the decoder part upon reception within the distributed optimization algorithm that constitutes the DMPC scheme. The choice of a learning-based reduction method is motivated by structure inherent to the data, which results from the data’s connection to solutions of optimal control problems. The approach is implemented and tested at the example of formation control of differential-drive robots, which is challenging for optimization-based control due to the robots’ nonholonomic constraints, and which is interesting due to the practical importance of mobile robotics. The applicability of the proposed approach is presented first in form of a simulative analysis showing that the resulting control performance yields a satisfactory accuracy. In particular, the proposed approach outperforms the canonical naive way to reduce communication by reducing the length of the prediction horizon. Moreover, it is shown that numerical experiments conducted on embedded computation hardware, with real distributed computation and wireless communication, work well with the proposed way of reducing communication even in practical scenarios in which full communication fails.

arxiv情報

著者 Torben Schiz,Henrik Ebel
発行日 2025-04-07 16:10:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.RO, cs.SY, eess.SY | Reducing the Communication of Distributed Model Predictive Control: Autoencoders and Formation Control はコメントを受け付けていません

Vision-Language Model Predictive Control for Manipulation Planning and Trajectory Generation

要約

モデル予測制御(MPC)は、予測モデルを活用して将来のシステム状態を推定し、それに応じて制御入力を最適化する広く採用された制御パラダイムです。
ただし、MPCは計画と制御に優れていますが、環境認識の能力が欠けており、複雑で構造化されていないシナリオの失敗につながります。
この制限に対処するために、Vision-Language Model Predictive Control(VLMPC)を紹介します。これは、MPCと視覚言語モデル(VLMS)の知覚力を統合するロボット操作計画フレームワークです。
VLMPCは、目標画像または言語命令を入力として取得し、VLMを活用して候補アクションシーケンスを生成する条件付きアクションサンプリングモジュールを使用します。
これらの候補者は、アクションに基づいて将来のフレームをシミュレートするビデオ予測モデルに供給されます。
さらに、拡張されたバリアントであるTraj-VLMPCを提案します。これにより、動画予測をモーション軌道の生成に置き換えて、精度を維持しながら計算の複雑さを減らします。
TRAJ-VLMPCは、候補アクションに条件付けられたモーションダイナミクスを推定し、長老タスクとリアルタイムアプリケーションのより効率的な代替品を提供します。
VLMPCとTRAJ-VLMPCの両方が、現在の観測とタスク入力の間のピクセルレベルと知識レベルの一貫性の両方をキャプチャするVLMベースの階層コスト関数を使用して、最適アクションシーケンスを選択します。
どちらのアプローチがパブリックベンチマークで既存の最先端の方法を上回り、さまざまな現実世界のロボット操作タスクで優れたパフォーマンスを達成することを実証します。
コードはhttps://github.com/ppjmchen/vlmpcで入手できます。

要約(オリジナル)

Model Predictive Control (MPC) is a widely adopted control paradigm that leverages predictive models to estimate future system states and optimize control inputs accordingly. However, while MPC excels in planning and control, it lacks the capability for environmental perception, leading to failures in complex and unstructured scenarios. To address this limitation, we introduce Vision-Language Model Predictive Control (VLMPC), a robotic manipulation planning framework that integrates the perception power of vision-language models (VLMs) with MPC. VLMPC utilizes a conditional action sampling module that takes a goal image or language instruction as input and leverages VLM to generate candidate action sequences. These candidates are fed into a video prediction model that simulates future frames based on the actions. In addition, we propose an enhanced variant, Traj-VLMPC, which replaces video prediction with motion trajectory generation to reduce computational complexity while maintaining accuracy. Traj-VLMPC estimates motion dynamics conditioned on the candidate actions, offering a more efficient alternative for long-horizon tasks and real-time applications. Both VLMPC and Traj-VLMPC select the optimal action sequence using a VLM-based hierarchical cost function that captures both pixel-level and knowledge-level consistency between the current observation and the task input. We demonstrate that both approaches outperform existing state-of-the-art methods on public benchmarks and achieve excellent performance in various real-world robotic manipulation tasks. Code is available at https://github.com/PPjmchen/VLMPC.

arxiv情報

著者 Jiaming Chen,Wentao Zhao,Ziyu Meng,Donghui Mao,Ran Song,Wei Pan,Wei Zhang
発行日 2025-04-07 16:13:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Vision-Language Model Predictive Control for Manipulation Planning and Trajectory Generation はコメントを受け付けていません

RobustDexGrasp: Robust Dexterous Grasping of General Objects from Single-view Perception

要約

単一ビューの知覚からのさまざまなオブジェクトの堅牢な把握は、器用なロボットの基本です。
以前の作品は、多くの場合、完全に観察可能なオブジェクト、専門家のデモ、または静的な把握ポーズに依存しています。
このペーパーでは、外部の障害に適応的な動きを実行しながら、単一ビューの知覚から幅広い目に見えないオブジェクトのゼロショットの動的な器用な把握を可能にする強化学習ベースのフレームワークを紹介します。
相互作用に関連する局所形状を強調する形状特徴抽出のための手中心のオブジェクト表現を利用し、堅牢性を高めて形状の分散と不確実性を高めます。
限られた観察結果の妨害への効果的な手の適応を可能にするために、最初に特権的なリアルタイムの視覚触覚フィードバックで訓練されたポリシーを蒸留するために模倣学習を利用し、観察のノイズと動的なランダム化によって引き起こされる障害の下での適応運動の学習を徐々に転送するために模倣学習を利用することを提案します。
私たちの実験は、ランダムなポーズで目に見えないオブジェクトを把握する際の強力な一般化を示し、247,786のシミュレートされたオブジェクトで97.0%、512の実際のオブジェクトで94.6%の成功率を達成します。
また、定量的評価と定性的評価の両方を通じて、観察されていないオブジェクトの動きや外力を含むさまざまな妨害に対する方法の堅牢性を示します。
プロジェクトページ:https://zdchan.github.io/robust_dexgrasp/

要約(オリジナル)

Robust grasping of various objects from single-view perception is fundamental for dexterous robots. Previous works often rely on fully observable objects, expert demonstrations, or static grasping poses, which restrict their generalization ability and adaptability to external disturbances. In this paper, we present a reinforcement-learning-based framework that enables zero-shot dynamic dexterous grasping of a wide range of unseen objects from single-view perception, while performing adaptive motions to external disturbances. We utilize a hand-centric object representation for shape feature extraction that emphasizes interaction-relevant local shapes, enhancing robustness to shape variance and uncertainty. To enable effective hand adaptation to disturbances with limited observations, we propose a mixed curriculum learning strategy, which first utilizes imitation learning to distill a policy trained with privileged real-time visual-tactile feedback, and gradually transfers to reinforcement learning to learn adaptive motions under disturbances caused by observation noises and dynamic randomization. Our experiments demonstrate strong generalization in grasping unseen objects with random poses, achieving success rates of 97.0% across 247,786 simulated objects and 94.6% across 512 real objects. We also demonstrate the robustness of our method to various disturbances, including unobserved object movement and external forces, through both quantitative and qualitative evaluations. Project Page: https://zdchan.github.io/Robust_DexGrasp/

arxiv情報

著者 Hui Zhang,Zijian Wu,Linyi Huang,Sammy Christen,Jie Song
発行日 2025-04-07 17:38:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | RobustDexGrasp: Robust Dexterous Grasping of General Objects from Single-view Perception はコメントを受け付けていません

Using Physiological Measures, Gaze, and Facial Expressions to Model Human Trust in a Robot Partner

要約

さまざまなドメインでロボットがますます一般的になっているため、人間との相互作用のより大きな流encyさを達成するためのツールを装備することが重要になっています。
さらなる調査のための有望な分野の1つは、人間の信頼にあります。
人間の信頼のリアルタイムで客観的なモデルを使用して、生産性を最大化し、安全性を維持し、故障を緩和できます。
この作業では、生理学的手段、視線、表情を使用して、ロボットパートナーの人間の信頼をモデル化しようとします。
私たちは、専用の信頼データセットを作成するために、対面で人間のロボット監督の相互作用研究を設計した最初の人です。
このデータセットを使用して、機械学習アルゴリズムをトレーニングして、ロボットパートナーへの信頼を最も示す客観的測定を特定し、人間とロボットの相互作用における信頼予測を進めます。
私たちの調査結果は、センサーのモダリティ(血液量パルス、電極活動、皮膚温度、視線)の組み合わせにより、ロボットパートナーの人間の信頼を検出する精度を高めることができることを示しています。
さらに、余分な木、ランダムフォレスト、および決定ツリー分類子は、ロボットパートナーに対する人の信頼を測定する際に一貫してパフォーマンスを示します。
これらの結果は、人間とロボットの間のより効率的な相互作用を促進する可能性のある人間とロボットの相互作用のためのリアルタイムトラストモデルを構築するための基礎を築きます。

要約(オリジナル)

With robots becoming increasingly prevalent in various domains, it has become crucial to equip them with tools to achieve greater fluency in interactions with humans. One of the promising areas for further exploration lies in human trust. A real-time, objective model of human trust could be used to maximize productivity, preserve safety, and mitigate failure. In this work, we attempt to use physiological measures, gaze, and facial expressions to model human trust in a robot partner. We are the first to design an in-person, human-robot supervisory interaction study to create a dedicated trust dataset. Using this dataset, we train machine learning algorithms to identify the objective measures that are most indicative of trust in a robot partner, advancing trust prediction in human-robot interactions. Our findings indicate that a combination of sensor modalities (blood volume pulse, electrodermal activity, skin temperature, and gaze) can enhance the accuracy of detecting human trust in a robot partner. Furthermore, the Extra Trees, Random Forest, and Decision Trees classifiers exhibit consistently better performance in measuring the person’s trust in the robot partner. These results lay the groundwork for constructing a real-time trust model for human-robot interaction, which could foster more efficient interactions between humans and robots.

arxiv情報

著者 Haley N. Green,Tariq Iqbal
発行日 2025-04-07 17:45:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Using Physiological Measures, Gaze, and Facial Expressions to Model Human Trust in a Robot Partner はコメントを受け付けていません

The Transient Cost of Learning in Queueing Systems

要約

キューイングシステムは、通信ネットワーク、ヘルスケア、サービスシステムなどのユースケースを備えた広く適用可能な確率モデルです。最適な制御は広く研究されていますが、ほとんどの既存のアプローチはシステムパラメーターの完全な知識を想定しています。
この仮定は、パラメーターの不確実性がある実際にはめったに保持されないため、キューイングシステムのBandit Learningに関する最近の作業ラインが動機付けられています。
この初期の研究の流れは、提案されたアルゴリズムの漸近パフォーマンスに焦点を当てていますが、学習プロセスの初期段階での一時的なパフォーマンスに関する洞察を提供しません。
この論文では、パラメーターの不確実性によって引き起こされる時間平均キュー長の最大増加を定量化する新しいメトリックであるキューイング(TCLQ)の一時的な学習コストを提案します。
シングルキューマルチサーバーシステムのTCLQを特徴付けてから、これらの結果をマルチキューマルチサーバーシステムとキューのネットワークに拡張します。
結果を確立する際に、LyapunovとBandit分析を橋渡しし、幅広いアルゴリズムの保証を提供し、独立した関心がある可能性があるTCLQの統一分析フレームワークを提案します。

要約(オリジナル)

Queueing systems are widely applicable stochastic models with use cases in communication networks, healthcare, service systems, etc. Although their optimal control has been extensively studied, most existing approaches assume perfect knowledge of the system parameters. This assumption rarely holds in practice where there is parameter uncertainty, thus motivating a recent line of work on bandit learning for queueing systems. This nascent stream of research focuses on the asymptotic performance of the proposed algorithms but does not provide insight on the transient performance in the early stages of the learning process. In this paper, we propose the Transient Cost of Learning in Queueing (TCLQ), a new metric that quantifies the maximum increase in time-averaged queue length caused by parameter uncertainty. We characterize the TCLQ of a single-queue multi-server system, and then extend these results to multi-queue multi-server systems and networks of queues. In establishing our results, we propose a unified analysis framework for TCLQ that bridges Lyapunov and bandit analysis, provides guarantees for a wide range of algorithms, and could be of independent interest.

arxiv情報

著者 Daniel Freund,Thodoris Lykouris,Wentao Weng
発行日 2025-04-07 14:22:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, cs.PF, math.PR | The Transient Cost of Learning in Queueing Systems はコメントを受け付けていません

Controlled Latent Diffusion Models for 3D Porous Media Reconstruction

要約

多孔質媒体の3次元デジタル再構築は、地球科学の根本的な課題を提示し、代表的な基本量をキャプチャしながら、微細スケールの細孔構造の同時解像度を必要とします。
EDMフレームワーク内で動作する潜在的な拡散モデルを通じて、この課題に対処する計算フレームワークを紹介します。
私たちのアプローチは、バイナリ地質学的ボリュームでトレーニングされたカスタムバリエーションオートエンコーダーを介して次元を減らし、効率を改善し、拡散モデルで以前よりも可能なよりも大きなボリュームの生成を可能にします。
重要な革新は、制御された無条件のサンプリング方法論であり、経験的分布から最初のターゲット統計をサンプリングし、次にこれらの値を条件付けたサンプルを生成することにより、分布カバレッジを強化します。
4つの異なる岩型の広範なテストは、透過性、2点相関関数、細孔サイズの分布を含む複数の複雑な特性の一貫した表現を確保するのに十分であることを示しています。
このフレームワークは、ピクセルスペースの拡散よりも優れた世代の品質を実現し、大幅に大きなボリューム再構成(256キューブボクセル)を実質的に削減し、デジタルロック物理学アプリケーション向けの新しい最先端を確立します。

要約(オリジナル)

Three-dimensional digital reconstruction of porous media presents a fundamental challenge in geoscience, requiring simultaneous resolution of fine-scale pore structures while capturing representative elementary volumes. We introduce a computational framework that addresses this challenge through latent diffusion models operating within the EDM framework. Our approach reduces dimensionality via a custom variational autoencoder trained in binary geological volumes, improving efficiency and also enabling the generation of larger volumes than previously possible with diffusion models. A key innovation is our controlled unconditional sampling methodology, which enhances distribution coverage by first sampling target statistics from their empirical distributions, then generating samples conditioned on these values. Extensive testing on four distinct rock types demonstrates that conditioning on porosity – a readily computable statistic – is sufficient to ensure a consistent representation of multiple complex properties, including permeability, two-point correlation functions, and pore size distributions. The framework achieves better generation quality than pixel-space diffusion while enabling significantly larger volume reconstruction (256-cube voxels) with substantially reduced computational requirements, establishing a new state-of-the-art for digital rock physics applications.

arxiv情報

著者 Danilo Naiff,Bernardo P. Schaeffer,Gustavo Pires,Dragan Stojkovic,Thomas Rapstine,Fabio Ramos
発行日 2025-04-07 14:41:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.geo-ph | Controlled Latent Diffusion Models for 3D Porous Media Reconstruction はコメントを受け付けていません

Towards Optimal Heterogeneous Client Sampling in Multi-Model Federated Learning

要約

Federated Learning(FL)により、Edge Devicesはローカルデータを共有せずにモデルを協力して訓練できます。
FLが人気を得るにつれて、クライアントは複数の無関係なFLモデルをトレーニングする必要がある場合がありますが、コミュニケーションの制約により、すべてのモデルを同時にトレーニングする能力が制限されます。
クライアントはFLモデルを順番にトレーニングできますが、日和見的にFLクライアントが異なるモデル(MMFL)と呼ばれるさまざまなモデルを同時にトレーニングすることができますが、全体的なトレーニング時間を短縮できます。
以前の作業では、トレーニングの過程で各モデルへの各クライアントの貢献を最適化しないシンプルなクライアントからモデルへの割り当てを使用しています。
シングルモデルFLでの以前の作業は、インテリジェントなクライアントの選択が収束を大幅に加速できることを示していますが、MMFLへのna \ ‘ive拡張は、サーバーとクライアントの両方で不均一なリソースの制約に違反する可能性があります。
この作業では、任意のクライアントサンプリング方法を使用したMMFLの新しい収束分析を開発し、以前の定評のあるグラデーションベースの方法の強みと制限を理論的に実証します。
この分析に動機付けられて、MMFL-LVRを提案します。MMFL-LVRは、サーバーの通信制限を明示的に尊重し、クライアントの計算コストを削減しながら、トレーニングの差異を最小限に抑える損失ベースのサンプリング方法です。
これをMMFL-Stalevrに拡張します。これには、効率と安定性が向上するための古い更新と、低オーバーヘッドの展開に適した軽量バリアントであるMMFL-Stalevreが組み込まれています。
実験では、ランダムサンプリングよりも平均精度が最大19.1%向上し、理論的最適(フルクライアント参加)からのギャップは5.4%しかないことが示されています。

要約(オリジナル)

Federated learning (FL) allows edge devices to collaboratively train models without sharing local data. As FL gains popularity, clients may need to train multiple unrelated FL models, but communication constraints limit their ability to train all models simultaneously. While clients could train FL models sequentially, opportunistically having FL clients concurrently train different models — termed multi-model federated learning (MMFL) — can reduce the overall training time. Prior work uses simple client-to-model assignments that do not optimize the contribution of each client to each model over the course of its training. Prior work on single-model FL shows that intelligent client selection can greatly accelerate convergence, but na\’ive extensions to MMFL can violate heterogeneous resource constraints at both the server and the clients. In this work, we develop a novel convergence analysis of MMFL with arbitrary client sampling methods, theoretically demonstrating the strengths and limitations of previous well-established gradient-based methods. Motivated by this analysis, we propose MMFL-LVR, a loss-based sampling method that minimizes training variance while explicitly respecting communication limits at the server and reducing computational costs at the clients. We extend this to MMFL-StaleVR, which incorporates stale updates for improved efficiency and stability, and MMFL-StaleVRE, a lightweight variant suitable for low-overhead deployment. Experiments show our methods improve average accuracy by up to 19.1% over random sampling, with only a 5.4% gap from the theoretical optimum (full client participation).

arxiv情報

著者 Haoran Zhang,Zejun Gong,Zekai Li,Marie Siew,Carlee Joe-Wong,Rachid El-Azouzi
発行日 2025-04-07 14:43:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, I.2.11 | Towards Optimal Heterogeneous Client Sampling in Multi-Model Federated Learning はコメントを受け付けていません

Unifying Physics- and Data-Driven Modeling via Novel Causal Spatiotemporal Graph Neural Network for Interpretable Epidemic Forecasting

要約

正確な流行予測は、効果的な疾病管理と予防のために重要です。
従来のコンパートメントモデルは、しばしば一時的および空間的に変化する疫学的パラメーターを推定するのに苦労しますが、ディープラーニングモデルは通常、病気の伝播のダイナミクスを見落とし、疫学的文脈での解釈性を欠いています。
これらの制限に対処するために、Spatio-Contact SIRモデルをグラフニューラルネットワーク(GNNS)と統合して流行の時空間的伝播をキャプチャするハイブリッドフレームワークである、新しい因果空間グラフニューラルネットワーク(CSTGNN)を提案します。
領域間の人間の移動性は、継続的かつ滑らかな時空間パターンを示し、根底にあるモビリティダイナミクスを共有する隣接するグラフ構造につながります。
これらのダイナミクスをモデル化するために、適応的な静的接続グラフを使用して、人間の移動性の安定した成分を表し、時間的ダイナミクスモデルを利用してこれらのパターン内の変動をキャプチャします。
適応型静的接続グラフをThe Tomeal Dynamicsグラフと統合することにより、人間のモビリティネットワークの包括的な特性をカプセル化する動的グラフを構築します。
さらに、時間的傾向と感染症の拡散の変動を捉えるために、時間的依存を処理するための時間的分解モデルを導入します。
このモデルは、流行予測のための動的グラフ畳み込みネットワークと統合されます。
中国の州レベルとドイツの州レベルでの実際のデータセットを使用してモデルを検証します。
広範な研究は、私たちの方法が感染症の時空間的ダイナミクスを効果的にモデル化し、予測と介入戦略のための貴重なツールを提供することを実証しています。
さらに、学習したパラメーターの分析は、病気の伝播メカニズムに関する洞察を提供し、モデルの解釈可能性と実用的な適用性を高めます。

要約(オリジナル)

Accurate epidemic forecasting is crucial for effective disease control and prevention. Traditional compartmental models often struggle to estimate temporally and spatially varying epidemiological parameters, while deep learning models typically overlook disease transmission dynamics and lack interpretability in the epidemiological context. To address these limitations, we propose a novel Causal Spatiotemporal Graph Neural Network (CSTGNN), a hybrid framework that integrates a Spatio-Contact SIR model with Graph Neural Networks (GNNs) to capture the spatiotemporal propagation of epidemics. Inter-regional human mobility exhibits continuous and smooth spatiotemporal patterns, leading to adjacent graph structures that share underlying mobility dynamics. To model these dynamics, we employ an adaptive static connectivity graph to represent the stable components of human mobility and utilize a temporal dynamics model to capture fluctuations within these patterns. By integrating the adaptive static connectivity graph with the temporal dynamics graph, we construct a dynamic graph that encapsulates the comprehensive properties of human mobility networks. Additionally, to capture temporal trends and variations in infectious disease spread, we introduce a temporal decomposition model to handle temporal dependence. This model is then integrated with a dynamic graph convolutional network for epidemic forecasting. We validate our model using real-world datasets at the provincial level in China and the state level in Germany. Extensive studies demonstrate that our method effectively models the spatiotemporal dynamics of infectious diseases, providing a valuable tool for forecasting and intervention strategies. Furthermore, analysis of the learned parameters offers insights into disease transmission mechanisms, enhancing the interpretability and practical applicability of our model.

arxiv情報

著者 Shuai Han,Lukas Stelz,Thomas R. Sokolowski,Kai Zhou,Horst Stöcker
発行日 2025-04-07 14:46:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, 92D30, cs.LG, I.2.6, physics.soc-ph, q-bio.QM, stat.ML | Unifying Physics- and Data-Driven Modeling via Novel Causal Spatiotemporal Graph Neural Network for Interpretable Epidemic Forecasting はコメントを受け付けていません

Online Cluster-Based Parameter Control for Metaheuristic

要約

パラメーターの設定の概念は、成績に主に影響を与える可能性があるため、メタヒューリスティックにおける重要かつ重要なプロセスです。
最適化アルゴリズムと手元の最適化の問題を深く理解する必要があるため、非常に複雑で挑戦的な手順です。
近年、今後の自律決定システムの台頭は、かなりの数のパラメーター調整方法を利用して、この方向に継続的な科学的関心を集めています。
方法には、オフラインとオンラインの2つのタイプがあります。
通常、オンラインメソッドは、アルゴリズムの実行中に動的なパラメーター制御を提供できるため、複雑な現実世界の問題に優れています。
現在の研究は、人口ベースのメタヒューリスティックのためのクラスターベースのパラメーター適応(CPA)と呼ばれる汎用オンラインパラメーター調整法を提案しています。
主なアイデアは、パラメーター検索スペース内の有望な領域の識別と、これらの領域の周りの新しいパラメーターの生成にあります。
この方法の妥当性は、微分進化アルゴリズムを使用して実証されており、低次元および高次元の問題の確立されたテストスイートで検証されています。
得られた結果は統計的に分析され、高度な自動調整アプローチを含む最先端のアルゴリズムと比較されます。
この分析は、有望なCPAのパフォーマンスと、さまざまなベンチマークの問題と寸法の下での堅牢性を明らかにしています。

要約(オリジナル)

The concept of parameter setting is a crucial and significant process in metaheuristics since it can majorly impact their performance. It is a highly complex and challenging procedure since it requires a deep understanding of the optimization algorithm and the optimization problem at hand. In recent years, the upcoming rise of autonomous decision systems has attracted ongoing scientific interest in this direction, utilizing a considerable number of parameter-tuning methods. There are two types of methods: offline and online. Online methods usually excel in complex real-world problems, as they can offer dynamic parameter control throughout the execution of the algorithm. The present work proposes a general-purpose online parameter-tuning method called Cluster-Based Parameter Adaptation (CPA) for population-based metaheuristics. The main idea lies in the identification of promising areas within the parameter search space and in the generation of new parameters around these areas. The method’s validity has been demonstrated using the differential evolution algorithm and verified in established test suites of low- and high-dimensional problems. The obtained results are statistically analyzed and compared with state-of-the-art algorithms, including advanced auto-tuning approaches. The analysis reveals the promising solid CPA’s performance as well as its robustness under a variety of benchmark problems and dimensions.

arxiv情報

著者 Vasileios A. Tatsis,Dimos Ioannidis
発行日 2025-04-07 14:48:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC | Online Cluster-Based Parameter Control for Metaheuristic はコメントを受け付けていません