AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

要約

大規模言語モデル(Large Language Models: LLM)が大規模コーパス上で事前学習されるにつれて、データ汚染の問題が深刻化しており、評価時にモデルの性能が過大評価される可能性がある。この問題に対処するため、我々はAdEval(Alignment-based Dynamic Evaluation)を提案する。AdEvalは、評価の信頼性に対するデータ汚染の影響を軽減することを目的とした動的なデータ評価手法である。複数のデータセットを用いた実験結果から、AdEvalはデータ汚染による評価結果への影響を効果的に低減し、評価プロセスの公平性と信頼性の両方を向上させることが実証された。

要約(オリジナル)

As Large Language Models (LLMs) are pretrained on massive-scale corpora, the issue of data contamination has become increasingly severe, leading to potential overestimation of model performance during evaluation. To address this, we propose AdEval (Alignment-based Dynamic Evaluation), a dynamic data evaluation method aimed at mitigating the impact of data contamination on evaluation reliability. Experimental results on multiple datasets demonstrate that AdEval effectively reduces the impact of data contamination on evaluation outcomes, enhancing both the fairness and reliability of the evaluation process.

arxiv情報

著者 Yang Fan
発行日 2025-03-03 02:06:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL | AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models はコメントを受け付けていません

Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction

要約

高次元連続行動空間における逐次的な意思決定、特に確率的環境における意思決定は、計算上大きな課題に直面している。我々は、エージェントが確率的な行動方針を通じて収集されたデータに基づいて意思決定を行う方法を学習しなければならない、伝統的なオフラインRL設定においてこの課題を探求する。L-MAPは、状態条件付きベクトル量子化変分オートエンコーダ(VQ-VAE)を用いて、時間的に拡張されたマクロ行動のセットを学習することで、行動の次元を効果的に削減し、この課題に対処する。L-MAPは、潜在的な遷移モデルとして働き、もっともらしい行動の効率的なサンプリングを可能にする、(別個に)学習された事前モデルを採用する。計画時には、モンテカルロ木探索(MCTS)を用いることで、環境と行動方針の両方における確率性を考慮する。確率的な連続制御タスクを含むオフラインRL設定において、L-MAPは離散的な潜在行動を効率的に探索し、高い期待収益をもたらす。実証結果は、L-MAPがアクションの次元が大きくなっても低い決定待ち時間を維持することを示している。特に、本質的に確率的なダイナミクスを持つ連続制御から高次元ロボットハンド操作までのタスクにおいて、L-MAPは既存のモデルベース手法を大幅に上回り、モデルフリーのアクタークリティックベースラインと同程度の性能を発揮し、高次元アクション空間を持つ複雑で確率的な環境におけるプランニングにおける提案手法の有効性を強調した。

要約(オリジナル)

Sequential decision-making in high-dimensional continuous action spaces, particularly in stochastic environments, faces significant computational challenges. We explore this challenge in the traditional offline RL setting, where an agent must learn how to make decisions based on data collected through a stochastic behavior policy. We present Latent Macro Action Planner (L-MAP), which addresses this challenge by learning a set of temporally extended macro-actions through a state-conditional Vector Quantized Variational Autoencoder (VQ-VAE), effectively reducing action dimensionality. L-MAP employs a (separate) learned prior model that acts as a latent transition model and allows efficient sampling of plausible actions. During planning, our approach accounts for stochasticity in both the environment and the behavior policy by using Monte Carlo tree search (MCTS). In offline RL settings, including stochastic continuous control tasks, L-MAP efficiently searches over discrete latent actions to yield high expected returns. Empirical results demonstrate that L-MAP maintains low decision latency despite increased action dimensionality. Notably, across tasks ranging from continuous control with inherently stochastic dynamics to high-dimensional robotic hand manipulation, L-MAP significantly outperforms existing model-based methods and performs on-par with strong model-free actor-critic baselines, highlighting the effectiveness of the proposed approach in planning in complex and stochastic environments with high-dimensional action spaces.

arxiv情報

著者 Baiting Luo,Ava Pettet,Aron Laszka,Abhishek Dubey,Ayan Mukhopadhyay
発行日 2025-03-03 02:33:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO | Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction はコメントを受け付けていません

Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation

要約

GPUベースの並列シミュレーションの最近の進歩により、開業医は大量のデータを収集し、コモディティGPUでディープ補強学習(RL)を使用して複雑な制御ポリシーを訓練することができました。
ただし、ロボット工学におけるRLのこのような成功は、高速剛体ダイナミクスによって十分にシミュレートされたタスクに限定されています。
ソフトボディのシミュレーション技術は比較的数桁遅く、サンプルの複雑さの要件によりRLの使用が制限されます。
この課題に対処するために、このペーパーでは、剛体と変形を含むタスクでRLをスケーリングできるように、新しいRLアルゴリズムとシミュレーションプラットフォームの両方を紹介します。
ソフト分析ポリシー最適化(SAPO)を紹介します。これは、最大エントロピー1次モデルベースのアクターcritic RLアルゴリズムを紹介します。これは、微分可能なシミュレーションから1次分析勾配を使用して確率的アクターを訓練し、期待されるリターンとエントロピーを最大化します。
私たちのアプローチに加えて、私たちは、剛体を超えたさまざまな材料のシミュレーションをサポートする並行する微分微分多目的シミュレーションプラットフォームであるRewarpedを開発します。
挑戦的な操作と移動タスクの再埋め立てを再実装し、SAPOが剛体、明確性、変形の間の相互作用を伴うさまざまなタスクよりもベースラインを上回ることを示しています。
https://rewarped.github.io/の詳細については。

要約(オリジナル)

Recent advances in GPU-based parallel simulation have enabled practitioners to collect large amounts of data and train complex control policies using deep reinforcement learning (RL), on commodity GPUs. However, such successes for RL in robotics have been limited to tasks sufficiently simulated by fast rigid-body dynamics. Simulation techniques for soft bodies are comparatively several orders of magnitude slower, thereby limiting the use of RL due to sample complexity requirements. To address this challenge, this paper presents both a novel RL algorithm and a simulation platform to enable scaling RL on tasks involving rigid bodies and deformables. We introduce Soft Analytic Policy Optimization (SAPO), a maximum entropy first-order model-based actor-critic RL algorithm, which uses first-order analytic gradients from differentiable simulation to train a stochastic actor to maximize expected return and entropy. Alongside our approach, we develop Rewarped, a parallel differentiable multiphysics simulation platform that supports simulating various materials beyond rigid bodies. We re-implement challenging manipulation and locomotion tasks in Rewarped, and show that SAPO outperforms baselines over a range of tasks that involve interaction between rigid bodies, articulations, and deformables. Additional details at https://rewarped.github.io/.

arxiv情報

著者 Eliot Xing,Vernon Luk,Jean Oh
発行日 2025-02-27 19:05:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation はコメントを受け付けていません

DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time

要約

自律ワイヤーハーネスアセンブリには、高精度と信頼性で複雑な分岐ケーブルを操作するためにロボットが必要です。
このプロセスを自動化する上での重要な課題は、これらの柔軟な構造と分岐構造が操作中にどのように振る舞うかを予測することです。
正確な予測がなければ、ロボットが組み立て操作を確実に計画または実行することは困難です。
既存の研究により、単一スレッドの変形可能な線形オブジェクト(DLOS)のモデリングが進歩しましたが、これらのアプローチを分岐した変形可能な線形オブジェクト(BDLOS)に拡張することは、基本的な課題を提示します。
BDLOSのジャンクションポイントは、複数のシングルドロモデルを接続するだけでは適切にキャプチャできない複雑な力の相互作用とひずみ伝播パターンを作成します。
これらの課題に対処するために、このペーパーでは、差別化可能な物理学ベースのモデルと学習フレームワークを組み合わせた新しいフレームワークである縁石のDLOSをリアルタイム(DEFT)でモデル化するための差別化可能な離散分岐弾性ロッドを提示します。
BDLO操作。
包括的な一連の実世界の実験は、最先端の代替案と比較した精度、計算速度、および一般化可能性の観点からDeftの有効性を示しています。
プロジェクトページ:https://roahmlab.github.io/deft/。

要約(オリジナル)

Autonomous wire harness assembly requires robots to manipulate complex branched cables with high precision and reliability. A key challenge in automating this process is predicting how these flexible and branched structures behave under manipulation. Without accurate predictions, it is difficult for robots to reliably plan or execute assembly operations. While existing research has made progress in modeling single-threaded Deformable Linear Objects (DLOs), extending these approaches to Branched Deformable Linear Objects (BDLOs) presents fundamental challenges. The junction points in BDLOs create complex force interactions and strain propagation patterns that cannot be adequately captured by simply connecting multiple single-DLO models. To address these challenges, this paper presents Differentiable discrete branched Elastic rods for modeling Furcated DLOs in real-Time (DEFT), a novel framework that combines a differentiable physics-based model with a learning framework to: 1) accurately model BDLO dynamics, including dynamic propagation at junction points and grasping in the middle of a BDLO, 2) achieve efficient computation for real-time inference, and 3) enable planning to demonstrate dexterous BDLO manipulation. A comprehensive series of real-world experiments demonstrates DEFT’s efficacy in terms of accuracy, computational speed, and generalizability compared to state-of-the-art alternatives. Project page:https://roahmlab.github.io/DEFT/.

arxiv情報

著者 Yizhou Chen,Xiaoyue Wu,Yeheng Zong,Anran Li,Yuzhen Chen,Julie Wu,Bohao Zhang,Ram Vasudevan
発行日 2025-02-27 20:13:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.GR, cs.RO | DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time はコメントを受け付けていません

Equivariant Reinforcement Learning Frameworks for Quadrotor Low-Level Control

要約

サンプリング効率と一般化能力の改善は、本質的に不安定な四つ型無人航空機(UAV)のデータ駆動型制御を成功させるために重要です。
さまざまな強化学習(RL)アプローチが自律的な四肢装置飛行に適用されていますが、多くの場合、広範なトレーニングデータが必要であり、実際には複数の課題と安全リスクをもたらします。
これらの問題に対処するために、四肢制御のためのデータ効率が高く、等しいモノリシックおよびモジュラーRLフレームワークを提案します。
具体的には、四肢装置のダイナミクスにおける回転と反射の対称性を識別し、これらの対称性を等量ネットワークモデルにエンコードすることにより、状態行動空間での学習の冗長性を削除します。
このアプローチにより、1つの構成で学習した最適な制御アクションが、対称性を介して他の構成に自動的に一般化し、データ効率を高めることができます。
実験結果は、学習効率と飛行パフォーマンスの観点から、私たちの同等のアプローチが非等変量の対応物を大幅に上回ることを示しています。

要約(オリジナル)

Improving sampling efficiency and generalization capability is critical for the successful data-driven control of quadrotor unmanned aerial vehicles (UAVs) that are inherently unstable. While various reinforcement learning (RL) approaches have been applied to autonomous quadrotor flight, they often require extensive training data, posing multiple challenges and safety risks in practice. To address these issues, we propose data-efficient, equivariant monolithic and modular RL frameworks for quadrotor low-level control. Specifically, by identifying the rotational and reflectional symmetries in quadrotor dynamics and encoding these symmetries into equivariant network models, we remove redundancies of learning in the state-action space. This approach enables the optimal control action learned in one configuration to automatically generalize into other configurations via symmetry, thereby enhancing data efficiency. Experimental results demonstrate that our equivariant approaches significantly outperform their non-equivariant counterparts in terms of learning efficiency and flight performance.

arxiv情報

著者 Beomyeol Yu,Taeyoung Lee
発行日 2025-02-27 20:16:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | Equivariant Reinforcement Learning Frameworks for Quadrotor Low-Level Control はコメントを受け付けていません

Unified Feedback Linearization for Nonlinear Systems with Dexterous and Energy-Saving Modes

要約

自由度と比較して多くの入力を備えたシステム(例:Mecanumホイールを備えたモバイルロボット)には、多くの場合、メインタスク(位置追跡など)を達成するために必要な最小限のエネルギー効率の入力と、追加の補助タスク(例えば方向追跡)を実現するために必要な一連のエネルギー入力が必要です。
この文字は、フィードバック線形化によって導出された統一制御スキームを提示します。これは、エネルギー効率の高い入力のみを使用してエネルギー効率の高い入力のみを使用して主要なタスクを追跡しながら、エネルギーを強制しながら、必要に応じて補助タスクを追跡するためにエネルギー促進入力を使用する器用なモードを追跡する2つのモードを切り替えることができます。
提案された制御は、主要なタスクの指数トラッキングを保証し、主なタスクに関連するダイナミクスは、先験的な未知のスイッチング信号とは無関係に進化することを保証します。
制御が器用モードで動作している場合、補助タスクの指数トラッキングも保証されます。
全方向性メカナムホイールロボットの数値シミュレーションは、提案されたアプローチの有効性を検証し、メインおよび補助タスクの指数トラッキング挙動に対するスイッチング信号の効果を示します。

要約(オリジナル)

Systems with a high number of inputs compared to the degrees of freedom (e.g. a mobile robot with Mecanum wheels) often have a minimal set of energy-efficient inputs needed to achieve a main task (e.g. position tracking) and a set of energy-intense inputs needed to achieve an additional auxiliary task (e.g. orientation tracking). This letter presents a unified control scheme, derived through feedback linearization, that can switch between two modes: an energy-saving mode, which tracks the main task using only the energy-efficient inputs while forcing the energy-intense inputs to zero, and a dexterous mode, which also uses the energy-intense inputs to track the auxiliary task as needed. The proposed control guarantees the exponential tracking of the main task and that the dynamics associated with the main task evolve independently of the a priori unknown switching signal. When the control is operating in dexterous mode, the exponential tracking of the auxiliary task is also guaranteed. Numerical simulations on an omnidirectional Mecanum wheel robot validate the effectiveness of the proposed approach and demonstrate the effect of the switching signal on the exponential tracking behavior of the main and auxiliary tasks.

arxiv情報

著者 Mirko Mizzoni,Pieter van Goor,Antonio Franchi
発行日 2025-02-27 21:19:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | Unified Feedback Linearization for Nonlinear Systems with Dexterous and Energy-Saving Modes はコメントを受け付けていません

Toward Fully Autonomous Flexible Chunk-Based Aerial Additive Manufacturing: Insights from Experimental Validation

要約

新しい自律チャンクベースの空中積層製造フレームワークが提示され、実験的なデモンストレーションが空中3D印刷を進めています。
最適化ベースの分解アルゴリズムは、構造をサブコンポーネント、またはチャンクに変換し、依存関係グラフを介して調整された個々のタスクとして扱われ、シームレスな実行のための相互依存性と印刷可能性の制約を考慮したUAVへの連続的な割り当てを保証します。
軽量の拡張可能なフォーム押出のための加圧されたキャニスターを備えた特別に設計されたヘキサコプターが、制御された方法で材料を堆積するために利用されます。
印刷の正確な実行をさらに強化するために、オフセットのないモデル予測制御メカニズムは、実行中の障害と地盤効果を反応的に補償することと見なされます。
さらに、構造的凝集を強化し、層の接着を改善するために、チャンキングプロセスにインターロックメカニズムが導入されます。
広範な実験は、さまざまな形状の正確な構造を構築しながら、実際の課題にシームレスに適応し、自律的な構造のための空中ロボット能力の変革的な飛躍の可能性を証明する際のフレームワークの有効性を示しています。

要約(オリジナル)

A novel autonomous chunk-based aerial additive manufacturing framework is presented, supported with experimental demonstration advancing aerial 3D printing. An optimization-based decomposition algorithm transforms structures into sub-components, or chunks, treated as individual tasks coordinated via a dependency graph, ensuring sequential assignment to UAVs considering inter-dependencies and printability constraints for seamless execution. A specially designed hexacopter equipped with a pressurized canister for lightweight expandable foam extrusion is utilized to deposit the material in a controlled manner. To further enhance precise execution of the printing, an offset-free Model Predictive Control mechanism is considered compensating reactively for disturbances and ground effect during execution. Additionally, an interlocking mechanism is introduced in the chunking process to enhance structural cohesion and improve layer adhesion. Extensive experiments demonstrate the framework’s effectiveness in constructing precise structures of various shapes while seamlessly adapting to practical challenges, proving its potential for a transformative leap in aerial robotic capability for autonomous construction.

arxiv情報

著者 Marios-Nektarios Stamatopoulos,Jakub Haluska,Elias Small,Jude Marroush,Avijit Banerjee,George Nikolakopoulos
発行日 2025-02-27 21:43:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Toward Fully Autonomous Flexible Chunk-Based Aerial Additive Manufacturing: Insights from Experimental Validation はコメントを受け付けていません

Close-Proximity Satellite Operations through Deep Reinforcement Learning and Terrestrial Testing Environments

要約

ますます混雑し、争われている空間環境があるため、安全で効果的な衛星操作がますます困難になっています。
その結果、自律的な衛星能力への関心が高まっており、一般的な機械学習技術は、宇宙ドメインでの複雑な意思決定に対処する可能性に注意を向けています。
ただし、これらの方法の多くの「ブラックボックス」の性質は、モデルの入出力と出力の関係、より具体的には環境障害、センサーノイズ、および制御介入に対する感度をより具体的に理解することが困難になります。
このペーパーでは、マルチエージェント検査タスクにおける衛星制御のためのディープ補強学習(DRL)の使用について説明します。
コラボレーション衛星(LINC)ラボのローカルインテリジェントネットワークは、シミュレーションから実際の四肢装置UAVハードウェアまで、さまざまな環境にわたるこれらの制御アルゴリズムのパフォーマンスをテストし、トレーニング環境を超えて展開されたときのパフォーマンスの潜在的な劣化を理解することに特に焦点を当てています。

要約(オリジナル)

With the increasingly congested and contested space environment, safe and effective satellite operation has become increasingly challenging. As a result, there is growing interest in autonomous satellite capabilities, with common machine learning techniques gaining attention for their potential to address complex decision-making in the space domain. However, the ‘black-box’ nature of many of these methods results in difficulty understanding the model’s input/output relationship and more specifically its sensitivity to environmental disturbances, sensor noise, and control intervention. This paper explores the use of Deep Reinforcement Learning (DRL) for satellite control in multi-agent inspection tasks. The Local Intelligent Network of Collaborative Satellites (LINCS) Lab is used to test the performance of these control algorithms across different environments, from simulations to real-world quadrotor UAV hardware, with a particular focus on understanding their behavior and potential degradation in performance when deployed beyond the training environment.

arxiv情報

著者 Henry Lei,Joshua Aurand,Zachary S. Lippay,Sean Phillips
発行日 2025-02-27 21:53:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 93-05, cs.RO, cs.SY, eess.SY | Close-Proximity Satellite Operations through Deep Reinforcement Learning and Terrestrial Testing Environments はコメントを受け付けていません

Map Space Belief Prediction for Manipulation-Enhanced Mapping

要約

散らかった環境でオブジェクトを検索するには、オクルージョンを削除し、オブジェクトの位置、形状、カテゴリの不確実性を減らすために、効率的な視点と操作アクションを選択する必要があります。
この作業では、操作が強化されたセマンティックマッピングの問題に対処します。ここでは、ロボットが散らかった棚のすべてのオブジェクトを効率的に識別する必要があります。
部分的に観察可能なマルコフ決定プロセス〜(POMDP)は不確実性の下での意思決定の標準ですが、非構造化されたインタラクティブな世界を表すこの形式主義では依然として挑戦的です。
これに取り組むために、メトリックセマンチックなグリッドマップによって信念が要約されているPOMDPを定義し、ニューラルネットワークを使用してオブジェクトの幾何学、位置、カテゴリ、オクルージャー、および操作物理学について効率的かつ同時に推論的に推論するためにマップ空間信念の更新を実行する新しいフレームワークを提案します。
さらに、正確な情報ゲイン分析を有効にするために、学習された信念の更新は、不確実性の校正された推定値を維持する必要があります。
したがって、校正済みのニューラル加速化された信念更新(CNABU)を提案して、新しいシナリオに一般化し、未知の領域に信頼性の校正予測を提供する信念伝播モデルを学習します。
私たちの実験は、私たちの新しいPOMDPプランナーが、挑戦的なシミュレーションにおける既存の方法に対するマップの完全性と正確性を改善し、ゼロショットで実際の散らかった棚に正常に転送することを示しています。

要約(オリジナル)

Searching for objects in cluttered environments requires selecting efficient viewpoints and manipulation actions to remove occlusions and reduce uncertainty in object locations, shapes, and categories. In this work, we address the problem of manipulation-enhanced semantic mapping, where a robot has to efficiently identify all objects in a cluttered shelf. Although Partially Observable Markov Decision Processes~(POMDPs) are standard for decision-making under uncertainty, representing unstructured interactive worlds remains challenging in this formalism. To tackle this, we define a POMDP whose belief is summarized by a metric-semantic grid map and propose a novel framework that uses neural networks to perform map-space belief updates to reason efficiently and simultaneously about object geometries, locations, categories, occlusions, and manipulation physics. Further, to enable accurate information gain analysis, the learned belief updates should maintain calibrated estimates of uncertainty. Therefore, we propose Calibrated Neural-Accelerated Belief Updates (CNABUs) to learn a belief propagation model that generalizes to novel scenarios and provides confidence-calibrated predictions for unknown areas. Our experiments show that our novel POMDP planner improves map completeness and accuracy over existing methods in challenging simulations and successfully transfers to real-world cluttered shelves in zero-shot fashion.

arxiv情報

著者 Joao Marcos Correia Marques,Nils Dengler,Tobias Zaenker,Jesper Mucke,Shenlong Wang,Maren Bennewitz,Kris Hauser
発行日 2025-02-28 00:10:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Map Space Belief Prediction for Manipulation-Enhanced Mapping はコメントを受け付けていません

LV-DOT: LiDAR-visual dynamic obstacle detection and tracking for autonomous robot navigation

要約

動的障害の正確な認識は、屋内環境での自律的なロボットナビゲーションに不可欠です。
洗練された3Dオブジェクトの検出方法と追跡方法は、コンピュータービジョンと自律運転の分野で徹底的に調査および開発されていますが、高価で高精査センサーのセットアップに対する要求と、大規模なニューラルネットワークからの実質的な計算リソースにより、屋内ロボット工学に不適切になります。
最近、オンボードカメラまたはライダーセンサーを活用するより軽量の認識アルゴリズムが、有望な選択肢として浮上しています。
ただし、単一のセンサーに依存すると大きな制限があります。カメラには視野が限られており、高いノイズに苦しむ可能性がありますが、ライダーセンサーはより低い周波数で動作し、視覚的特徴の豊かさを欠いています。
この制限に対処するために、オンボードカメラとLIDARデータの両方を使用して、軽量で正確な知覚を可能にする動的な障害物の検出と追跡フレームワークを提案します。
提案された方法は、以前のアンサンブル検出アプローチを拡張します。これは、複数の低精度であるが計算効率の高い検出器からの出力を統合して、オンボードコンピューターでのリアルタイムパフォーマンスを確保します。
この作業では、LIDARデータと視覚データの両方を統合して、検出の精度をさらに強化するより堅牢な融合戦略を提案します。
次に、特徴ベースのオブジェクトアソシエーションを採用する追跡モジュールとKalmanフィルターを使用して、検出された障害物状態を追跡および推定します。
また、動的な障害物分類アルゴリズムは、移動するオブジェクトを堅牢に識別するように設計されています。
データセット評価は、ベンチマーク方法と比較して、より良い知覚パフォーマンスを示しています。
Quadcopterロボットの物理実験は、実際のナビゲーションの実現可能性を確認します。

要約(オリジナル)

Accurate perception of dynamic obstacles is essential for autonomous robot navigation in indoor environments. Although sophisticated 3D object detection and tracking methods have been investigated and developed thoroughly in the fields of computer vision and autonomous driving, their demands on expensive and high-accuracy sensor setups and substantial computational resources from large neural networks make them unsuitable for indoor robotics. Recently, more lightweight perception algorithms leveraging onboard cameras or LiDAR sensors have emerged as promising alternatives. However, relying on a single sensor poses significant limitations: cameras have limited fields of view and can suffer from high noise, whereas LiDAR sensors operate at lower frequencies and lack the richness of visual features. To address this limitation, we propose a dynamic obstacle detection and tracking framework that uses both onboard camera and LiDAR data to enable lightweight and accurate perception. Our proposed method expands on our previous ensemble detection approach, which integrates outputs from multiple low-accuracy but computationally efficient detectors to ensure real-time performance on the onboard computer. In this work, we propose a more robust fusion strategy that integrates both LiDAR and visual data to enhance detection accuracy further. We then utilize a tracking module that adopts feature-based object association and the Kalman filter to track and estimate detected obstacles’ states. Besides, a dynamic obstacle classification algorithm is designed to robustly identify moving objects. The dataset evaluation demonstrates a better perception performance compared to benchmark methods. The physical experiments on a quadcopter robot confirms the feasibility for real-world navigation.

arxiv情報

著者 Zhefan Xu,Haoyu Shen,Xinming Han,Hanyu Jin,Kanlong Ye,Kenji Shimada
発行日 2025-02-28 00:12:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LV-DOT: LiDAR-visual dynamic obstacle detection and tracking for autonomous robot navigation はコメントを受け付けていません