GravMAD: Grounded Spatial Value Maps Guided Action Diffusion for Generalized 3D Manipulation

要約

ロボットの指示に従い、多様な3D操作タスクを実行する能力は、ロボット学習に不可欠です。
従来の模倣学習ベースの方法は、見られたタスクではうまく機能しますが、変動性のために斬新で目に見えないタスクと格闘しています。
最近のアプローチでは、大規模な基礎モデルを活用して、新しいタスクの理解を支援し、それによってこの問題を軽減します。
ただし、これらの方法にはタスク固有の学習プロセスがありません。これは、3D環境を正確に理解するために不可欠であり、しばしば実行障害につながることがあります。
この論文では、模倣学習と基礎モデルの強みを組み合わせた、サブゴール駆動型の言語条件付きアクション拡散フレームワークであるGravmadを紹介します。
私たちのアプローチは、言語の指示に基づいてタスクをサブゴールに分割し、トレーニングと推論の両方で補助ガイダンスを可能にします。
トレーニング中に、サブゴールキーポーズ発見を導入して、デモンストレーションからキーサブゴールを特定します。
推論はトレーニングとは異なり、デモンストレーションが利用できないため、事前に訓練された基礎モデルを使用してギャップを埋め、現在のタスクのサブゴールを特定します。
両方のフェーズで、グラブマップはサブゴールから生成され、固定された3D位置と比較してより柔軟な3D空間ガイダンスをGravmadに提供します。
RLBenchの経験的評価は、Gravmadが最先端の方法を大幅に上回ることを示しており、新しいタスクが28.63%改善され、トレーニング中に遭遇したタスクで13.36%の増加が得られます。
現実世界のロボットタスクに関する評価はさらに、Gravmadが実際のタスクについて推論し、関連する視覚情報に関連付けられ、新しいタスクに一般化できることを示しています。
これらの結果は、3D操作におけるGravmadの強力なマルチタスク学習と一般化を示しています。
ビデオデモンストレーションは、https://gravmad.github.ioで入手できます。

要約(オリジナル)

Robots’ ability to follow language instructions and execute diverse 3D manipulation tasks is vital in robot learning. Traditional imitation learning-based methods perform well on seen tasks but struggle with novel, unseen ones due to variability. Recent approaches leverage large foundation models to assist in understanding novel tasks, thereby mitigating this issue. However, these methods lack a task-specific learning process, which is essential for an accurate understanding of 3D environments, often leading to execution failures. In this paper, we introduce GravMAD, a sub-goal-driven, language-conditioned action diffusion framework that combines the strengths of imitation learning and foundation models. Our approach breaks tasks into sub-goals based on language instructions, allowing auxiliary guidance during both training and inference. During training, we introduce Sub-goal Keypose Discovery to identify key sub-goals from demonstrations. Inference differs from training, as there are no demonstrations available, so we use pre-trained foundation models to bridge the gap and identify sub-goals for the current task. In both phases, GravMaps are generated from sub-goals, providing GravMAD with more flexible 3D spatial guidance compared to fixed 3D positions. Empirical evaluations on RLBench show that GravMAD significantly outperforms state-of-the-art methods, with a 28.63% improvement on novel tasks and a 13.36% gain on tasks encountered during training. Evaluations on real-world robotic tasks further show that GravMAD can reason about real-world tasks, associate them with relevant visual information, and generalize to novel tasks. These results demonstrate GravMAD’s strong multi-task learning and generalization in 3D manipulation. Video demonstrations are available at: https://gravmad.github.io.

arxiv情報

著者 Yangtao Chen,Zixuan Chen,Junhui Yin,Jing Huo,Pinzhuo Tian,Jieqi Shi,Yang Gao
発行日 2025-02-12 14:43:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | GravMAD: Grounded Spatial Value Maps Guided Action Diffusion for Generalized 3D Manipulation はコメントを受け付けていません

Learning to Group and Grasp Multiple Objects

要約

同時に、複数のオブジェクトを把握して輸送することは、ロボットの作業効率を大幅に向上させることができ、何十年もの間重要な研究焦点となっています。
主な課題は、オブジェクトの分布とロボットのハードウェア制約を検討しながら、オブジェクトをプッシュし、グループをグループ化し、それぞれのグループの同時把持を実行する方法を決定することにあります。
従来のルールベースの方法は、多様なシナリオに柔軟に適応するのに苦労しています。
この課題に対処するために、このペーパーでは、模倣学習ベースのアプローチを提案しています。
We collect a series of expert demonstrations through teleoperation and train a diffusion policy network, enabling the robot to dynamically generate action sequences for pushing, grouping, and grasping, thereby facilitating efficient multi-object grasping and transportation.
We conducted experiments to evaluate the method under different training dataset sizes, varying object quantities, and real-world object scenarios.
結果は、提案されたアプローチがマルチオブジェクトのグループ化と把握戦略を効果的かつ適応的に生成できることを示しています。
With the support of more training data, imitation learning is expected to be an effective approach for solving the multi-object grasping problem.

要約(オリジナル)

Simultaneously grasping and transporting multiple objects can significantly enhance robotic work efficiency and has been a key research focus for decades. The primary challenge lies in determining how to push objects, group them, and execute simultaneous grasping for respective groups while considering object distribution and the hardware constraints of the robot. Traditional rule-based methods struggle to flexibly adapt to diverse scenarios. To address this challenge, this paper proposes an imitation learning-based approach. We collect a series of expert demonstrations through teleoperation and train a diffusion policy network, enabling the robot to dynamically generate action sequences for pushing, grouping, and grasping, thereby facilitating efficient multi-object grasping and transportation. We conducted experiments to evaluate the method under different training dataset sizes, varying object quantities, and real-world object scenarios. The results demonstrate that the proposed approach can effectively and adaptively generate multi-object grouping and grasping strategies. With the support of more training data, imitation learning is expected to be an effective approach for solving the multi-object grasping problem.

arxiv情報

著者 Takahiro Yonemaru,Weiwei Wan,Tatsuki Nishimura,Kensuke Harada
発行日 2025-02-12 14:46:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning to Group and Grasp Multiple Objects はコメントを受け付けていません

Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey

要約

Bipedalロボットは、特に深い強化学習(DRL)を通じて、人工知能の潜在的な用途と進歩により、世界的な認識を獲得しています。
DRLは二足歩行の移動を大幅に進めていますが、幅広いタスクを処理できる統一されたフレームワークの開発は、継続的な課題のままです。
この調査では、既存のDRLフレームワークが二足歩行の移動のための既存のDRLフレームワークを分類、比較、分析し、それらをエンドツーエンドおよび階層制御スキームに整理します。
エンドツーエンドのフレームワークは、学習アプローチに基づいて評価されますが、階層的なフレームワークは、学習ベースまたは従来のモデルベースの方法を統合する層状構造の観点から調べられます。
各フレームワークの構成、強み、制限、および機能の詳細な評価を提供します。
さらに、この調査は重要な研究のギャップを特定し、実際の環境で幅広いアプリケーションを備えた、二足歩行のためのより統合された効率的なフレームワークを作成することを目的とした将来の方向性を提案します。

要約(オリジナル)

Bipedal robots are gaining global recognition due to their potential applications and advancements in artificial intelligence, particularly through Deep Reinforcement Learning (DRL). While DRL has significantly advanced bipedal locomotion, the development of a unified framework capable of handling a wide range of tasks remains an ongoing challenge. This survey systematically categorises, compares, and analyses existing DRL frameworks for bipedal locomotion, organising them into end-to-end and hierarchical control schemes. End-to-end frameworks are evaluated based on their learning approaches, while hierarchical frameworks are examined in terms of layered structures that integrate learning-based or traditional model-based methods. We provide a detailed evaluation of the composition, strengths, limitations, and capabilities of each framework. Additionally, this survey identifies key research gaps and proposes future directions aimed at creating a more integrated and efficient framework for bipedal locomotion, with wide-ranging applications in real-world environments.

arxiv情報

著者 Lingfan Bao,Joseph Humphreys,Tianhu Peng,Chengxu Zhou
発行日 2025-02-12 14:47:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey はコメントを受け付けていません

Robot Data Curation with Mutual Information Estimators

要約

模倣学習ポリシーのパフォーマンスは、多くの場合、それらが訓練されているデータセットにかかっています。
その結果、ロボット工学のデータ収集への投資は、産業研究所と学術研究所の両方で増加しています。
しかし、収集されたデモンストレーションの量が著しく増加しているにもかかわらず、ビジョンや言語などの他の分野でその重要性の証拠を増やしているにもかかわらず、上記のデータの品質を評価しようとはほとんど求めていません。
この作業では、ロボット工学のデータ品質に対処するための重要な一歩を踏み出します。
デモンストレーションのデータセットを考えると、州の多様性とアクションの予測可能性の両方の観点から、個々のデモンストレーションの相対的な質を推定することを目指しています。
そのために、状態とデータセット全体の行動との相互情報への軌跡の平均貢献を推定します。これは、状態分布のエントロピーと状態条件付きアクションエントロピーの両方を正確に捉えています。
一般的に使用される相互情報推定値は、ロボット工学で利用可能なスケールを超えて膨大な量のデータを必要としますが、状態と行動の単純なVAE埋め込みに加えて、k-nearest neight emultionの推定値に基づく新しい手法を導入します。
経験的に、私たちのアプローチは、シミュレーションと現実世界環境にまたがる多様なベンチマークのセットにわたる人間の専門家スコアに従って、品質によってデモンストレーションデータセットを分割できることを実証します。
さらに、この方法でフィルタリングされたデータに基づいたトレーニングポリシーは、ロボミミックの5〜10%の改善と、実際のアロハとフランカのセットアップでのパフォーマンスの向上につながります。

要約(オリジナル)

The performance of imitation learning policies often hinges on the datasets with which they are trained. Consequently, investment in data collection for robotics has grown across both industrial and academic labs. However, despite the marked increase in the quantity of demonstrations collected, little work has sought to assess the quality of said data despite mounting evidence of its importance in other areas such as vision and language. In this work, we take a critical step towards addressing the data quality in robotics. Given a dataset of demonstrations, we aim to estimate the relative quality of individual demonstrations in terms of both state diversity and action predictability. To do so, we estimate the average contribution of a trajectory towards the mutual information between states and actions in the entire dataset, which precisely captures both the entropy of the state distribution and the state-conditioned entropy of actions. Though commonly used mutual information estimators require vast amounts of data often beyond the scale available in robotics, we introduce a novel technique based on k-nearest neighbor estimates of mutual information on top of simple VAE embeddings of states and actions. Empirically, we demonstrate that our approach is able to partition demonstration datasets by quality according to human expert scores across a diverse set of benchmarks spanning simulation and real world environments. Moreover, training policies based on data filtered by our method leads to a 5-10% improvement in RoboMimic and better performance on real ALOHA and Franka setups.

arxiv情報

著者 Joey Hejna,Suvir Mirchandani,Ashwin Balakrishna,Annie Xie,Ayzaan Wahid,Jonathan Tompson,Pannag Sanketi,Dhruv Shah,Coline Devin,Dorsa Sadigh
発行日 2025-02-12 18:23:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Robot Data Curation with Mutual Information Estimators はコメントを受け付けていません

Re$^3$Sim: Generating High-Fidelity Simulation Data via 3D-Photorealistic Real-to-Sim for Robotic Manipulation

要約

Roboticsの現実世界のデータ収集は費用がかかり、リソース集約型であり、熟練したオペレーターと高価なハードウェアが必要です。
シミュレーションはスケーラブルな代替品を提供しますが、幾何学的および視覚的なギャップのためにSIMからリアルの一般化を達成できないことがよくあります。
これらの課題に対処するために、幾何学的および視覚的なSIMからリアルへのギャップに対処する、3DフォトリックなリアルからSIMからSIMシステムを提案します。
Re $^3 $ SIMは、現実世界のシナリオを忠実に再現するために、高度な3D再構築およびニューラルレンダリング技術を採用し、物理ベースのシミュレータ内でシミュレートされたクロスビューカメラのリアルタイムレンダリングを可能にします。
特権情報を利用して、シミュレーションでエキスパートのデモンストレーションを効率的に収集し、模倣学習を備えたロボットポリシーを訓練することにより、さまざまな操作タスクシナリオにわたる実際のパイプラインの有効性を検証します。
特に、シミュレートされたデータのみを使用すると、平均成功率が58%を超えるゼロショットSIMからリアルへの転送を達成できます。
REALからSIMの限界を押し上げるために、大規模なシミュレーションデータセットをさらに生成し、さまざまなオブジェクトに一般化するシミュレーションデータから堅牢なポリシーをどのように構築できるかを示します。
コードとデモは、http://xshenhan.github.io/re3sim/で入手できます。

要約(オリジナル)

Real-world data collection for robotics is costly and resource-intensive, requiring skilled operators and expensive hardware. Simulations offer a scalable alternative but often fail to achieve sim-to-real generalization due to geometric and visual gaps. To address these challenges, we propose a 3D-photorealistic real-to-sim system, namely, RE$^3$SIM, addressing geometric and visual sim-to-real gaps. RE$^3$SIM employs advanced 3D reconstruction and neural rendering techniques to faithfully recreate real-world scenarios, enabling real-time rendering of simulated cross-view cameras within a physics-based simulator. By utilizing privileged information to collect expert demonstrations efficiently in simulation, and train robot policies with imitation learning, we validate the effectiveness of the real-to-sim-to-real pipeline across various manipulation task scenarios. Notably, with only simulated data, we can achieve zero-shot sim-to-real transfer with an average success rate exceeding 58%. To push the limit of real-to-sim, we further generate a large-scale simulation dataset, demonstrating how a robust policy can be built from simulation data that generalizes across various objects. Codes and demos are available at: http://xshenhan.github.io/Re3Sim/.

arxiv情報

著者 Xiaoshen Han,Minghuan Liu,Yilun Chen,Junqiu Yu,Xiaoyang Lyu,Yang Tian,Bolun Wang,Weinan Zhang,Jiangmiao Pang
発行日 2025-02-12 18:59:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Re$^3$Sim: Generating High-Fidelity Simulation Data via 3D-Photorealistic Real-to-Sim for Robotic Manipulation はコメントを受け付けていません

On the convergence rate of noisy Bayesian Optimization with Expected Improvement

要約

予想改善(EI)は、ベイジアン最適化(BO)で最も広く使用されている獲得機能の1つです。
何十年ものアプリケーションでの成功が証明されているにもかかわらず、EIの理論的収束行動とレートに関する重要な開かれた問題が残っています。
この論文では、3つの斬新で重要な領域におけるEIの収束理論に貢献しています。
まず、ガウスプロセス(GP)以前の仮定の下に適合する客観的関数を検討しますが、既存の作業は主にカーネルヒルベルトスペース(RKHS)の再現性に焦点を当てています。
第二に、漸近誤差が結合したのは初めて、GP-EIの対応するレートをGP事前の仮定の下で騒々しい観測とともに確立します。
第三に、非凸EI関数の探索と搾取特性を調査することにより、ノイズフリーとノイズの多いケースの両方について、GP-EIの改善された誤差境界を確立します。

要約(オリジナル)

Expected improvement (EI) is one of the most widely used acquisition functions in Bayesian optimization (BO). Despite its proven success in applications for decades, important open questions remain on the theoretical convergence behaviors and rates for EI. In this paper, we contribute to the convergence theory of EI in three novel and critical areas. First, we consider objective functions that fit under the Gaussian process (GP) prior assumption, whereas existing works mostly focus on functions in the reproducing kernel Hilbert space (RKHS). Second, we establish for the first time the asymptotic error bound and its corresponding rate for GP-EI with noisy observations under the GP prior assumption. Third, by investigating the exploration and exploitation properties of the non-convex EI function, we establish improved error bounds of GP-EI for both the noise-free and noisy cases.

arxiv情報

著者 Jingyi Wang,Haowei Wang,Nai-Yuan Chiang,Cosmin G. Petra
発行日 2025-02-12 16:07:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML | On the convergence rate of noisy Bayesian Optimization with Expected Improvement はコメントを受け付けていません

On Different Notions of Redundancy in Conditional-Independence-Based Discovery of Graphical Models

要約

グラフィカルモデルの条件付き独立ベースの発見の目標は、特定のデータセット内の変数の独立性構造を表すグラフを見つけることです。
このような表現を学ぶために、条件付き独立ベースのアプローチは、データの基礎となる分布に関するいくつかの仮定の下でグラフィカルな表現を識別するのに十分な統計テストのセットを実施します。
この作業では、グラフィック表現の簡潔さにより、グラフの構築に使用されない多くのテストがしばしばあることを強調しています。
これらの冗長テストは、学習されたモデルでエラーを検出または修正する可能性があります。
すべてのテストにこの追加情報が含まれているわけではなく、そのような冗長なテストを注意して適用する必要があることを示します。
正確には、特にそれらの条件付き(in)依存ステートメントは、グラフィカルな仮定からのみ続くが、すべての確率分布には当てはまらないという興味深いものであると主張します。

要約(オリジナル)

The goal of conditional-independence-based discovery of graphical models is to find a graph that represents the independence structure of variables in a given dataset. To learn such a representation, conditional-independence-based approaches conduct a set of statistical tests that suffices to identify the graphical representation under some assumptions on the underlying distribution of the data. In this work, we highlight that due to the conciseness of the graphical representation, there are often many tests that are not used in the construction of the graph. These redundant tests have the potential to detect or sometimes correct errors in the learned model. We show that not all tests contain this additional information and that such redundant tests have to be applied with care. Precisely, we argue that particularly those conditional (in)dependence statements are interesting that follow only from graphical assumptions but do not hold for every probability distribution.

arxiv情報

著者 Philipp M. Faller,Dominik Janzing
発行日 2025-02-12 16:08:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | On Different Notions of Redundancy in Conditional-Independence-Based Discovery of Graphical Models はコメントを受け付けていません

Matrix Completion with Graph Information: A Provable Nonconvex Optimization Approach

要約

変数間の相互関係を示すサイド情報としてグラフを使用したマトリックスの完了の問題を考慮します。
重要な課題は、マトリックスの回復を強化するためにグラフの類似性構造を活用することにあります。
主にグラフラプラシアンの正則化に基づいて既存のアプローチは、いくつかの制限に悩まされています。(1)長距離相関を見落としながら、隣接する変数間の類似性のみに焦点を当てています。
(2)それらはグラフ内の誤ったエッジに非常に敏感であり、(3)統計的および計算の複雑さに関する理論的保証がない。
これらの問題に対処するために、この論文では、前処理された勾配降下アプローチに基づいて、GSGDと呼ばれる新しいグラフの正規化されたマトリックス完了アルゴリズムを提案します。
GSGDは、グラフの背後にある高次相関情報を効果的にキャプチャし、誤ったエッジに対する優れた堅牢性と安定性を達成することを実証します。
理論的には、GSGDは、最適に近いサンプルの複雑さを備えたグローバルな最適への線形収束を達成し、非コンベックス最適化の観点での回復精度と有効性の両方に対する最初の理論的保証を提供することを証明します。
合成データと実世界の両方のデータに関する当社の数値実験では、GSGDがいくつかの一般的な選択肢と比較して優れた回復の精度とスケーラビリティを達成することをさらに検証します。

要約(オリジナル)

We consider the problem of matrix completion with graphs as side information depicting the interrelations between variables. The key challenge lies in leveraging the similarity structure of the graph to enhance matrix recovery. Existing approaches, primarily based on graph Laplacian regularization, suffer from several limitations: (1) they focus only on the similarity between neighboring variables, while overlooking long-range correlations; (2) they are highly sensitive to false edges in the graphs and (3) they lack theoretical guarantees regarding statistical and computational complexities. To address these issues, we propose in this paper a novel graph regularized matrix completion algorithm called GSGD, based on preconditioned projected gradient descent approach. We demonstrate that GSGD effectively captures the higher-order correlation information behind the graphs, and achieves superior robustness and stability against the false edges. Theoretically, we prove that GSGD achieves linear convergence to the global optimum with near-optimal sample complexity, providing the first theoretical guarantees for both recovery accuracy and efficacy in the perspective of nonconvex optimization. Our numerical experiments on both synthetic and real-world data further validate that GSGD achieves superior recovery accuracy and scalability compared with several popular alternatives.

arxiv情報

著者 Yao Wang,Yiyang Yang,Kaidong Wang,Shanxing Gao,Xiuwu Liao
発行日 2025-02-12 16:21:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC | Matrix Completion with Graph Information: A Provable Nonconvex Optimization Approach はコメントを受け付けていません

Beyond Predictions: A Participatory Framework for Multi-Stakeholder Decision-Making

要約

主に監視された学習に基づいて、従来の意思決定サポートシステムは、アクションを推奨する結果予測モデルに焦点を当てています。
ただし、多くの場合、多様で潜在的に矛盾する利害関係者の好みをバランスをとる必要がある多芽環境の複雑さを説明できません。
この論文では、意思決定をマルチステークホルダーの最適化問題として再定義する新しい参加型フレームワークを提案し、コンテキスト依存の報酬機能を通じて各俳優の好みを捉えます。
当社のフレームワークは、$ k $ -foldの相互検証を活用して、ユーザーが提供する結果予測モデルを微調整し、利害関係者のトレードオフを媒介する妥協機能を含む決定戦略を評価します。
意思決定戦略をランク付けし、最適な意思決定者を特定するために、複数のメトリックにわたってユーザー定義の好みを活用する合成スコアリングメカニズムを導入します。
選択した意思決定者を使用して、新しいデータの実用的な推奨事項を生成できます。
2つの実際のユースケースを使用してフレームワークを検証し、複数のメトリックのバランスをとる推奨事項を提供する能力を実証し、純粋に予測ベースの方法の範囲を超えた結果を達成します。
アブレーション研究は、モジュール式、モデルに依存し、本質的に透明な設計を備えたフレームワークが、さまざまな予測モデル、報酬構造、評価メトリック、およびサンプルサイズとシームレスに統合し、複雑でハイステークスの意思決定に特に適していることを示しています。
コンテキスト。

要約(オリジナル)

Conventional decision-support systems, primarily based on supervised learning, focus on outcome prediction models to recommend actions. However, they often fail to account for the complexities of multi-actor environments, where diverse and potentially conflicting stakeholder preferences must be balanced. In this paper, we propose a novel participatory framework that redefines decision-making as a multi-stakeholder optimization problem, capturing each actor’s preferences through context-dependent reward functions. Our framework leverages $k$-fold cross-validation to fine-tune user-provided outcome prediction models and evaluate decision strategies, including compromise functions mediating stakeholder trade-offs. We introduce a synthetic scoring mechanism that exploits user-defined preferences across multiple metrics to rank decision-making strategies and identify the optimal decision-maker. The selected decision-maker can then be used to generate actionable recommendations for new data. We validate our framework using two real-world use cases, demonstrating its ability to deliver recommendations that effectively balance multiple metrics, achieving results that are often beyond the scope of purely prediction-based methods. Ablation studies demonstrate that our framework, with its modular, model-agnostic, and inherently transparent design, integrates seamlessly with various predictive models, reward structures, evaluation metrics, and sample sizes, making it particularly suited for complex, high-stakes decision-making contexts.

arxiv情報

著者 Vittoria Vineis,Giuseppe Perelli,Gabriele Tolomei
発行日 2025-02-12 16:27:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA | Beyond Predictions: A Participatory Framework for Multi-Stakeholder Decision-Making はコメントを受け付けていません

A Machine Learning-Ready Data Processing Tool for Near Real-Time Forecasting

要約

宇宙の気象予測は、宇宙探査における放射線リスクを軽減し、地磁気障害から地球ベースの技術を保護するために重要です。
このホワイトペーパーでは、機械学習(ML) – 近くのリアルタイム(NRT)の空間気象予測用の準備データ処理ツールの開発を紹介します。
太陽画像、磁場測定、エネルギー粒子フラックスなどの多様なNRTソースからのデータをマージすることにより、ツールは現在の空間気象予測機能の重要なギャップに対処します。
このツールは、機械学習モデルのデータを処理および構成し、極端なソーラーイベントのための時系列予測とイベント検出に焦点を当てています。
MLアプリケーションのデータをダウンロード、処理、ラベル付けするフレームワークをユーザーに提供し、NRTスペースの天気予報と科学的研究を改善するためのワークフローを合理化します。

要約(オリジナル)

Space weather forecasting is critical for mitigating radiation risks in space exploration and protecting Earth-based technologies from geomagnetic disturbances. This paper presents the development of a Machine Learning (ML)- ready data processing tool for Near Real-Time (NRT) space weather forecasting. By merging data from diverse NRT sources such as solar imagery, magnetic field measurements, and energetic particle fluxes, the tool addresses key gaps in current space weather prediction capabilities. The tool processes and structures the data for machine learning models, focusing on time-series forecasting and event detection for extreme solar events. It provides users with a framework to download, process, and label data for ML applications, streamlining the workflow for improved NRT space weather forecasting and scientific research.

arxiv情報

著者 Maher A Dayeh,Michael J Starkey,Subhamoy Chatterjee,Heather Elliott,Samuel Hart,Kimberly Moreland
発行日 2025-02-12 16:35:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: astro-ph.IM, astro-ph.SR, cs.LG | A Machine Learning-Ready Data Processing Tool for Near Real-Time Forecasting はコメントを受け付けていません