V-HOP: Visuo-Haptic 6D Object Pose Tracking

要約

人間は、操作中に堅牢なオブジェクト知覚のために視覚と触覚を自然に統合します。
いずれかのモダリティの損失は、パフォーマンスを大幅に低下させます。
この多感覚の統合に触発されて、以前のオブジェクトのポーズ推定研究は、視覚と触覚/触覚のフィードバックを組み合わせようとしました。
これらの作品は、制御された環境または合成データセットの改善を示していますが、多様なグリッパー、センサーレイアウト、またはSIM-to-Real環境全体の一般化が不十分であるため、実際の設定でのビジョンのみのアプローチをパフォーマンスしていることがよくあります。
さらに、彼らは通常、各フレームのオブジェクトのポーズを個別に推定し、実際の展開のシーケンス上の一貫性のない追跡が少なくなります。
これらの制限に対処するために、複数のグリッパー実施形態を効果的に処理する新しい統一された触覚表現を導入します。
この表現に基づいて、視覚的および触覚入力をシームレスに統合する新しいVisuo-Haptic Transformerベースのオブジェクトポーズトラッカーを導入します。
データセットとFeelightデータセットのフレームワークを検証し、挑戦的なシーケンスの大幅なパフォーマンス改善を示しています。
特に、我々の方法は、新規の実施形態、オブジェクト、センサーの種類(タクエルベースの触覚センサーと視覚ベースの触覚センサーの両方)にわたって優れた一般化と堅牢性を達成します。
実際の実験では、私たちのアプローチが最先端のビジュアルトラッカーより大きなマージンを上回ることを実証します。
さらに、リアルタイムのオブジェクト追跡結果をモーションプランに組み込み、視覚障害の知覚の利点を強調することにより、正確な操作タスクを実現できることを示します。
私たちのモデルとデータセットは、論文を受け入れるとオープンソースになります。
プロジェクトWebサイト:https://lhy.xyz/projects/v-hop/

要約(オリジナル)

Humans naturally integrate vision and haptics for robust object perception during manipulation. The loss of either modality significantly degrades performance. Inspired by this multisensory integration, prior object pose estimation research has attempted to combine visual and haptic/tactile feedback. Although these works demonstrate improvements in controlled environments or synthetic datasets, they often underperform vision-only approaches in real-world settings due to poor generalization across diverse grippers, sensor layouts, or sim-to-real environments. Furthermore, they typically estimate the object pose for each frame independently, resulting in less coherent tracking over sequences in real-world deployments. To address these limitations, we introduce a novel unified haptic representation that effectively handles multiple gripper embodiments. Building on this representation, we introduce a new visuo-haptic transformer-based object pose tracker that seamlessly integrates visual and haptic input. We validate our framework in our dataset and the Feelsight dataset, demonstrating significant performance improvement on challenging sequences. Notably, our method achieves superior generalization and robustness across novel embodiments, objects, and sensor types (both taxel-based and vision-based tactile sensors). In real-world experiments, we demonstrate that our approach outperforms state-of-the-art visual trackers by a large margin. We further show that we can achieve precise manipulation tasks by incorporating our real-time object tracking result into motion plans, underscoring the advantages of visuo-haptic perception. Our model and dataset will be made open source upon acceptance of the paper. Project website: https://lhy.xyz/projects/v-hop/

arxiv情報

著者 Hongyu Li,Mingxi Jia,Tuluhan Akbulut,Yu Xiang,George Konidaris,Srinath Sridhar
発行日 2025-02-24 18:59:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO | V-HOP: Visuo-Haptic 6D Object Pose Tracking はコメントを受け付けていません

GCC: Generative Color Constancy via Diffusing a Color Checker

要約

色の恒常性の方法は、さまざまなスペクトル感度のために、さまざまなカメラセンサー全体で一般化するのに苦労しています。
GCCを提示します。GCCは、拡散モデルを塗装台のチェッカーにレバレッジして、照明推定のために画像にレバリットします。
私たちの主要な革新には、(1)シーンの照明を反映した塗装の色のチェッカーを塗装するシングルステップの決定論的推論アプローチ、(2)照明依存の色の適応を可能にしながらチェッカー構造を保持するラプラシアン分解技術、および(3)マスクベースのデータ
不正確なカラーチェッカー注釈を処理するための増強戦略。
GCCは、クロスカメラシナリオで優れた堅牢性を示し、双方向評価で最新の最悪25%のエラー率が5.15 {\ deg}および4.32 {\ deg}のエラー率を達成します。
これらの結果は、センサー固有のトレーニングを必要とせずに、さまざまなカメラの特性にわたる方法の安定性と一般化能力を強調し、実際のアプリケーションに汎用性の高いソリューションになります。

要約(オリジナル)

Color constancy methods often struggle to generalize across different camera sensors due to varying spectral sensitivities. We present GCC, which leverages diffusion models to inpaint color checkers into images for illumination estimation. Our key innovations include (1) a single-step deterministic inference approach that inpaints color checkers reflecting scene illumination, (2) a Laplacian decomposition technique that preserves checker structure while allowing illumination-dependent color adaptation, and (3) a mask-based data augmentation strategy for handling imprecise color checker annotations. GCC demonstrates superior robustness in cross-camera scenarios, achieving state-of-the-art worst-25% error rates of 5.15{\deg} and 4.32{\deg} in bi-directional evaluations. These results highlight our method’s stability and generalization capability across different camera characteristics without requiring sensor-specific training, making it a versatile solution for real-world applications.

arxiv情報

著者 Chen-Wei Chang,Cheng-De Fan,Chia-Che Chang,Yi-Chen Lo,Yu-Chee Tseng,Jiun-Long Huang,Yu-Lun Liu
発行日 2025-02-24 18:59:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | GCC: Generative Color Constancy via Diffusing a Color Checker はコメントを受け付けていません

Towards Hierarchical Rectified Flow

要約

データ分布をモデル化する階層的整流フローを策定します。
階層的には、複数の通常の微分方程式(ODE)を結びつけ、既知のソース分布からデータ分布を生成する時間差性確率プロセスを定義します。
各オードは、古典的な整流フローで解決されるが、そのドメイン、つまり位置、速度、加速度などが異なるオードに似ています。ロケーションドメインの単一オードを定式化し、キャプチャする単一のオードを作成し、キャプチャする古典的な修正フロー定式化とは異なります。
予想される速度フィールド(マルチモーダルデータ分布をキャプチャするのに十分)、階層的整流フロー定式化モデルマルチモーダルランダム速度をモデル化する
フィールド、加速フィールドなど、全体。
ランダム速度フィールドのこのより忠実なモデリングにより、データ生成中に基礎となるODEが解決されると、統合パスが交差することができます。
交差するパスは、統合パスが交差できない古典的な修正フロー定式化で得られたものよりもまっすぐな統合軌跡につながります。
これは、神経関数の評価が少ないデータ分布のモデリングにつながります。
これを合成1Dおよび2Dデータ、およびMNIST、CIFAR-10、およびImagENET-32データで経験的に検証します。
コードは、https://riccizz.github.io/hrf/で入手できます。

要約(オリジナル)

We formulate a hierarchical rectified flow to model data distributions. It hierarchically couples multiple ordinary differential equations (ODEs) and defines a time-differentiable stochastic process that generates a data distribution from a known source distribution. Each ODE resembles the ODE that is solved in a classic rectified flow, but differs in its domain, i.e., location, velocity, acceleration, etc. Unlike the classic rectified flow formulation, which formulates a single ODE in the location domain and only captures the expected velocity field (sufficient to capture a multi-modal data distribution), the hierarchical rectified flow formulation models the multi-modal random velocity field, acceleration field, etc., in their entirety. This more faithful modeling of the random velocity field enables integration paths to intersect when the underlying ODE is solved during data generation. Intersecting paths in turn lead to integration trajectories that are more straight than those obtained in the classic rectified flow formulation, where integration paths cannot intersect. This leads to modeling of data distributions with fewer neural function evaluations. We empirically verify this on synthetic 1D and 2D data as well as MNIST, CIFAR-10, and ImageNet-32 data. Code is available at: https://riccizz.github.io/HRF/.

arxiv情報

著者 Yichi Zhang,Yici Yan,Alex Schwing,Zhizhen Zhao
発行日 2025-02-24 18:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG | Towards Hierarchical Rectified Flow はコメントを受け付けていません

Fractal Generative Models

要約

モジュール化は、コンピューターサイエンスの基礎であり、複雑な機能を原子ビルディングブロックに抽象化します。
この論文では、生成モデルを原子生成モジュールに抽象化することにより、新しいレベルのモジュール化を紹介します。
数学のフラクタルと同様に、私たちの方法は、原子生成モジュールを再帰的に呼び出すことにより、新しいタイプの生成モデルを構築し、フラクタル生成モデルと呼ばれる自己類似のフラクタルアーキテクチャをもたらします。
実行中の例として、AutoreGressionモデルをアトミック生成モジュールとして使用してフラクタルフレームワークをインスタンス化し、ピクセルごとの画像生成の挑戦的なタスクでそれを調べ、尤度の推定と生成の質の両方で強力なパフォーマンスを示します。
この作業が生成モデリングに新しいパラダイムを開き、将来の研究の肥沃な地位を提供できることを願っています。
コードはhttps://github.com/lth14/fractalgenで入手できます。

要約(オリジナル)

Modularization is a cornerstone of computer science, abstracting complex functions into atomic building blocks. In this paper, we introduce a new level of modularization by abstracting generative models into atomic generative modules. Analogous to fractals in mathematics, our method constructs a new type of generative model by recursively invoking atomic generative modules, resulting in self-similar fractal architectures that we call fractal generative models. As a running example, we instantiate our fractal framework using autoregressive models as the atomic generative modules and examine it on the challenging task of pixel-by-pixel image generation, demonstrating strong performance in both likelihood estimation and generation quality. We hope this work could open a new paradigm in generative modeling and provide a fertile ground for future research. Code is available at https://github.com/LTH14/fractalgen.

arxiv情報

著者 Tianhong Li,Qinyi Sun,Lijie Fan,Kaiming He
発行日 2025-02-24 18:59:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG | Fractal Generative Models はコメントを受け付けていません

Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path?

要約

大手AI企業は、一般主義者AIエージェントの構築にますます注力しています。これは、人間が実行できるほぼすべてのタスクで目標を自律的に計画、行動、追求できるシステムです。
これらのシステムがどれほど有用であるかにもかかわらず、未確認のAI機関は、悪意のある俳優による誤用から、人間の支配の不可逆的な潜在的な喪失に至るまで、公共の安全とセキュリティに重大なリスクをもたらします。
これらのリスクが現在のAIトレーニング方法からどのように生じるかについて説明します。
実際、さまざまなシナリオと実験により、AIエージェントが欺ceptionに従事したり、人間のオペレーターによって指定されていない目標を追求したり、自己保存などの人間の利益と対立する可能性を実証しています。
予防原則に従って、私たちは、より安全でありながらもまだ有用な、現在の機関主導の軌跡に代わる強い必要性があると考えています。
したがって、私たちは、科学者AIと呼ばれる設計上、信頼できる安全で安全な非エージェントAIシステムの開発をさらに進めるためのコアビルディングブロックとして提案します。
このシステムは、人間を模倣したり喜ばせたりするために行動を起こすのではなく、観察から世界を説​​明するように設計されています。
それは、データを説明する理論を生成する世界モデルと質問を消費する推論マシンで構成されています。
両方のコンポーネントは、自信過剰予測のリスクを軽減するために、不確実性の明示的な概念で動作します。
これらの考慮事項に照らして、科学者AIを使用して、AIの安全性を含む科学的進歩を加速させる人間の研究者を支援することができます。
特に、当社のシステムは、関連するリスクにもかかわらず作成される可能性のあるAIエージェントに対するガードレールとして採用できます。
最終的に、非科目AIに焦点を当てることで、現在の軌跡に関連するリスクを避けながら、AIイノベーションの利点を可能にする可能性があります。
これらの議論が、研究者、開発者、政策立案者がこのより安全な道を支持するように動機付けることを願っています。

要約(オリジナル)

The leading AI companies are increasingly focused on building generalist AI agents — systems that can autonomously plan, act, and pursue goals across almost all tasks that humans can perform. Despite how useful these systems might be, unchecked AI agency poses significant risks to public safety and security, ranging from misuse by malicious actors to a potentially irreversible loss of human control. We discuss how these risks arise from current AI training methods. Indeed, various scenarios and experiments have demonstrated the possibility of AI agents engaging in deception or pursuing goals that were not specified by human operators and that conflict with human interests, such as self-preservation. Following the precautionary principle, we see a strong need for safer, yet still useful, alternatives to the current agency-driven trajectory. Accordingly, we propose as a core building block for further advances the development of a non-agentic AI system that is trustworthy and safe by design, which we call Scientist AI. This system is designed to explain the world from observations, as opposed to taking actions in it to imitate or please humans. It comprises a world model that generates theories to explain data and a question-answering inference machine. Both components operate with an explicit notion of uncertainty to mitigate the risks of overconfident predictions. In light of these considerations, a Scientist AI could be used to assist human researchers in accelerating scientific progress, including in AI safety. In particular, our system can be employed as a guardrail against AI agents that might be created despite the risks involved. Ultimately, focusing on non-agentic AI may enable the benefits of AI innovation while avoiding the risks associated with the current trajectory. We hope these arguments will motivate researchers, developers, and policymakers to favor this safer path.

arxiv情報

著者 Yoshua Bengio,Michael Cohen,Damiano Fornasiere,Joumana Ghosn,Pietro Greiner,Matt MacDermott,Sören Mindermann,Adam Oberman,Jesse Richardson,Oliver Richardson,Marc-Antoine Rondeau,Pierre-Luc St-Charles,David Williams-King
発行日 2025-02-24 18:14:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path? はコメントを受け付けていません

Generalization of the Gibbs algorithm with high probability at low temperatures

要約

このペーパーは、Gibbsアルゴリズムの一般化誤差にバウンドを与えます。これは、高温範囲の既知のデータ非依存境界を回復し、低温範囲に拡張します。ここでは、一般化はデータ依存の損失状態に大きく依存します。
確率が高いと、ギブス後部から引き出された単一の仮説の一般化誤差は、類似または小さい経験的誤差を伴うすべての仮説の前の総体積とともに減少することが示されています。
これにより、フラットミニマの利益に対する信念に理論的なサポートが得られます。
ゼロ温度制限について説明し、バウンドは同様の確率的アルゴリズムのクラスに拡張されます。

要約(オリジナル)

The paper gives a bound on the generalization error of the Gibbs algorithm, which recovers known data-independent bounds for the high temperature range and extends to the low-temperature range, where generalization depends critically on the data-dependent loss-landscape. It is shown, that with high probability the generalization error of a single hypothesis drawn from the Gibbs posterior decreases with the total prior volume of all hypotheses with similar or smaller empirical error. This gives theoretical support to the belief in the benefit of flat minima. The zero temperature limit is discussed and the bound is extended to a class of similar stochastic algorithms.

arxiv情報

著者 Andreas Maurer
発行日 2025-02-24 16:32:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T05, cs.LG, G.3, stat.ML | Generalization of the Gibbs algorithm with high probability at low temperatures はコメントを受け付けていません

DynamicGSG: Dynamic 3D Gaussian Scene Graphs for Environment Adaptation

要約

実際のシナリオでは、人間またはエージェントの活動によって引き起こされる環境の変化により、ロボットがさまざまな長期タスクを実行することが非常に困難になります。
最近の作品は通常、環境の変化と環境の微細な再構築の欠如に応じて、環境表現をメモリ内で更新できないため、動的環境を効果的に理解し、適応するのに苦労しています。
これらの課題に対処するために、Gaussian Splattingを活用する動的で高忠実な、オープンボキャブラリーシーングラフ構造システムであるDynamicGSGを提案します。
DynamicGSGは、高度なビジョン言語モデルを使用して階層シーングラフを構築して、環境内のオブジェクト間の空間的およびセマンティックな関係を表し、ガウスマップを最適化しながらガウスインスタンスグループを監督するように設計された共同機能損失を利用し、ガウスシーングラフをローカルに更新します。
長期的な環境適応のための実際の環境の変化。
実験とアブレーション研究は、セマンティックセグメンテーション、言語誘導オブジェクトの検索、および再構築品質の観点から、提案された方法のパフォーマンスと有効性を示しています。
さらに、実際の実験室環境でシステムの動的な更新機能を検証します。
ソースコードと補足実験資料は、〜\ href {https://github.com/geluzhou/dynamic-gsg} {https://github.com/geluzhou/dynamic-gsg}でリリースされます。

要約(オリジナル)

In real-world scenarios, environment changes caused by human or agent activities make it extremely challenging for robots to perform various long-term tasks. Recent works typically struggle to effectively understand and adapt to dynamic environments due to the inability to update their environment representations in memory according to environment changes and lack of fine-grained reconstruction of the environments. To address these challenges, we propose DynamicGSG, a dynamic, high-fidelity, open-vocabulary scene graph construction system leveraging Gaussian splatting. DynamicGSG builds hierarchical scene graphs using advanced vision language models to represent the spatial and semantic relationships between objects in the environments, utilizes a joint feature loss we designed to supervise Gaussian instance grouping while optimizing the Gaussian maps, and locally updates the Gaussian scene graphs according to real environment changes for long-term environment adaptation. Experiments and ablation studies demonstrate the performance and efficacy of our proposed method in terms of semantic segmentation, language-guided object retrieval, and reconstruction quality. Furthermore, we validate the dynamic updating capabilities of our system in real laboratory environments. The source code and supplementary experimental materials will be released at:~\href{https://github.com/GeLuzhou/Dynamic-GSG}{https://github.com/GeLuzhou/Dynamic-GSG}.

arxiv情報

著者 Luzhou Ge,Xiangyu Zhu,Zhuo Yang,Xuesong Li
発行日 2025-02-24 09:48:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DynamicGSG: Dynamic 3D Gaussian Scene Graphs for Environment Adaptation はコメントを受け付けていません

Conditional [MASK] Discrete Diffusion Language Model

要約

自動回帰モデルは自然言語処理に優れていますが、多くの場合、多様なテキストを生成するのに苦労し、制御可能性が限られています。
非自動再帰的方法は代替手段である可能性がありますが、しばしば縮退した出力を生成し、条件付き生成で欠点を示します。
これらの課題に対処するために、条件付きマルコフランダムフィールドの理論的レンズを介して条件付きマスク言語モデルを拡散言語モデルに統合する新しいフレームワークであるDiffusion-eagsを提案します。
そうすることで、各モデルの欠点を相殺するために、エントロピーに適したギブスサンプリングとエントロピーベースのノイズスケジューリングを提案します。
実験結果は、拡散EAGがベースラインよりも優れていることを示しており、最高品質の多様性のトレードオフを達成し、非自動性テキスト生成におけるその有効性を示しています。

要約(オリジナル)

Although auto-regressive models excel in natural language processing, they often struggle to generate diverse text and provide limited controllability. Non-auto-regressive methods could be an alternative but often produce degenerate outputs and exhibit shortcomings in conditional generation. To address these challenges, we propose Diffusion-EAGS, a novel framework that integrates conditional masked language models into diffusion language models through the theoretical lens of a conditional Markov Random Field. In doing so, we propose entropy-adaptive Gibbs sampling and entropy-based noise scheduling to counterbalance each model’s shortcomings. Experimental results show that Diffusion-EAGS outperforms baselines and achieves the best quality-diversity tradeoff, demonstrating its effectiveness in non-autoregressive text generation.

arxiv情報

著者 Hyukhun Koh,Minha Jhang,Dohyung Kim,Sangmook Lee,Kyomin Jung
発行日 2025-02-24 09:11:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Conditional [MASK] Discrete Diffusion Language Model はコメントを受け付けていません

Para-Lane: Multi-Lane Dataset Registering Parallel Scans for Benchmarking Novel View Synthesis

要約

エンドツーエンドの自律駆動システムを評価するには、特に架空のシナリオで、以前に記録されたシーケンスの写真と現実的な画像とポイントクラウドを合成する、新しいビュー合成(NVS)技術に基づくシミュレーション環境が不可欠です。

したがって、マルチレーンデータセットとベンチマークの開発が必要です。
最近の合成シーンベースのNVSデータセットは、クロスレーンベンチマークのために準備されていますが、キャプチャされた画像とポイントクラウドのリアリズムがまだ欠けています。
NERFと3DGSに基づいた既存のメソッドのパフォーマンスをさらに評価するために、16,000のフロントシーケンスを含む25のグループの関連するシーケンスを含む25のグループのグループを含む、実世界のスキャンから派生した新しい運転ビュー合成データセットのために特に並列スキャンを登録する最初のマルチレーンデータセットを登録する最初のマルチレーンデータセットを紹介します。
画像、64,000のサラウンドビュー画像、および16,000のライダーフレームを表示します。
すべてのフレームには、移動するオブジェクトを静的要素から区別するためにラベルが付けられています。
このデータセットを使用して、さまざまなレーンと距離でさまざまなテストシナリオで既存のアプローチのパフォーマンスを評価します。
さらに、この方法は、現実世界でこのようなデータセットをキュレーションするためのマルチモーダルデータアライメントのマルチセンサーポーズの品質を解決および評価するためのソリューションを提供します。
さまざまなシナリオで既存のメソッドの一般化をテストするために、新しいシーケンスを継続的に追加する予定です。
データセットは、プロジェクトページhttps://nizqleo.github.io/paralane-dataset/で公開されています。

要約(オリジナル)

To evaluate end-to-end autonomous driving systems, a simulation environment based on Novel View Synthesis (NVS) techniques is essential, which synthesizes photo-realistic images and point clouds from previously recorded sequences under new vehicle poses, particularly in cross-lane scenarios. Therefore, the development of a multi-lane dataset and benchmark is necessary. While recent synthetic scene-based NVS datasets have been prepared for cross-lane benchmarking, they still lack the realism of captured images and point clouds. To further assess the performance of existing methods based on NeRF and 3DGS, we present the first multi-lane dataset registering parallel scans specifically for novel driving view synthesis dataset derived from real-world scans, comprising 25 groups of associated sequences, including 16,000 front-view images, 64,000 surround-view images, and 16,000 LiDAR frames. All frames are labeled to differentiate moving objects from static elements. Using this dataset, we evaluate the performance of existing approaches in various testing scenarios at different lanes and distances. Additionally, our method provides the solution for solving and assessing the quality of multi-sensor poses for multi-modal data alignment for curating such a dataset in real-world. We plan to continually add new sequences to test the generalization of existing methods across different scenarios. The dataset is released publicly at the project page: https://nizqleo.github.io/paralane-dataset/.

arxiv情報

著者 Ziqian Ni,Sicong Du,Zhenghua Hou,Chenming Wu,Sheng Yang
発行日 2025-02-24 03:48:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV | Para-Lane: Multi-Lane Dataset Registering Parallel Scans for Benchmarking Novel View Synthesis はコメントを受け付けていません

Design of a Visual Pose Estimation Algorithm for Moon Landing

要約

月にピンポイント着陸するためには、宇宙船のナビゲーションシステムが正確でなければなりません。
望ましい精度を実現するには、慣性センサーによって引き起こされるナビゲーションドリフトを修正する必要があります。
このドリフトを修正する1つの方法は、絶対ナビゲーションソリューションを使用することです。
この研究では、宇宙船の位置と態度を推定するための地形絶対ナビゲーション法が提案されています。
このアルゴリズムは、推定のために宇宙船の下のクレーターの位置を使用します。
宇宙船に搭載されたカメラで見られるクレーターは、事前に知られているクレーターデータベースを使用して検出および識別されます。
推定アルゴリズムに焦点を当てるために、画像処理とクレーターの一致する手順がスキップされます。
アルゴリズムの精度と推定に使用されるクレーター数の効果は、シミュレーションを実行することで検査されます。

要約(オリジナル)

In order to make a pinpoint landing on the Moon, the spacecraft’s navigation system must be accurate. To achieve the desired accuracy, navigational drift caused by the inertial sensors must be corrected. One way to correct this drift is to use absolute navigation solutions. In this study, a terrain absolute navigation method to estimate the spacecraft’s position and attitude is proposed. This algorithm uses the position of the craters below the spacecraft for estimation. Craters seen by the camera onboard the spacecraft are detected and identified using a crater database known beforehand. In order to focus on estimation algorithms, image processing and crater matching steps are skipped. The accuracy of the algorithm and the effect of the crater number used for estimation are inspected by performing simulations.

arxiv情報

著者 Atakan Süslü,Betül Rana Kuran,Halil Ersin Söken
発行日 2025-02-20 17:37:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | Design of a Visual Pose Estimation Algorithm for Moon Landing はコメントを受け付けていません