TinyCenterSpeed: Efficient Center-Based Object Detection for Autonomous Racing

要約

自律運転内の知覚は、ニューラルネットワーク(NNS)とほぼ同義です。
しかし、自律的なレースの領域は、費用対効果と安全性に使用されるスケーリングされた計算的に制限されたロボットによってしばしば特徴付けられます。
このため、対戦相手の検出および追跡システムは、通常、計算上の制約により、従来のコンピュータービジョン技術に頼ります。
このペーパーでは、1:10スケールの自律レースプラットフォームでのリアルタイムパフォーマンスのために最適化された、独創的なセンターポイント法の合理化された適応であるTinyCenterSpeedを紹介します。
この適応は、外部テンソル処理ユニット(TPU)の使用が組み込まれているため、中央処理ユニット(CPU)のみを搭載したOBCでも実行可能です。
適応ブレークポイント検出器(ABD)と比較して、スケーリングされた自律レースにおける現在の最先端(SOTA)は、小さなセントラースピードが最大61.38%の検出と速度の推定を改善するだけでなく、マルチプラントの検出と推定をサポートすることを実証します。
TPUでわずか7.88ミリ秒の推論時間でリアルタイムのパフォーマンスを実現し、CPU使用率8.3倍を大幅に削減します。

要約(オリジナル)

Perception within autonomous driving is nearly synonymous with Neural Networks (NNs). Yet, the domain of autonomous racing is often characterized by scaled, computationally limited robots used for cost-effectiveness and safety. For this reason, opponent detection and tracking systems typically resort to traditional computer vision techniques due to computational constraints. This paper introduces TinyCenterSpeed, a streamlined adaptation of the seminal CenterPoint method, optimized for real-time performance on 1:10 scale autonomous racing platforms. This adaptation is viable even on OBCs powered solely by Central Processing Units (CPUs), as it incorporates the use of an external Tensor Processing Unit (TPU). We demonstrate that, compared to Adaptive Breakpoint Detector (ABD), the current State-of-the-Art (SotA) in scaled autonomous racing, TinyCenterSpeed not only improves detection and velocity estimation by up to 61.38% but also supports multi-opponent detection and estimation. It achieves real-time performance with an inference time of just 7.88 ms on the TPU, significantly reducing CPU utilization 8.3-fold.

arxiv情報

著者 Neil Reichlin,Nicolas Baumann,Edoardo Ghignone,Michele Magno
発行日 2025-04-11 15:58:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | TinyCenterSpeed: Efficient Center-Based Object Detection for Autonomous Racing はコメントを受け付けていません

Safe Flow Matching: Robot Motion Planning with Control Barrier Functions

要約

生成モデリングの最近の進歩により、特に複雑でマルチモーダルの軌跡分布をキャプチャする拡散およびフローベースのモデルを通じて、ロボットモーション計画における有望な結果が得られました。
ただし、これらの方法は通常、オフラインで訓練されており、目に見えない環境や動的な制約に直面している場合は限られたままであり、展開中に安全を確保するための明示的なメカニズムが欠けていることがよくあります。
この作業では、安全保証とフローマッチングを統合する軌跡生成のためのモーション計画アプローチであるSafe Flow Matthing(SAFEFM)を提案します。
SAFEFMは、提案されたフローマッチングバリア関数を組み込むことにより、以前に目に見えなかった障害や状態訴訟の制約が存在する場合でも、計画地平線全体に生成された軌道が安全な地域内に残ることを保証します。
拡散ベースのアプローチとは異なり、この方法により、制約に満足のいく軌跡を直接効率的にサンプリングすることができ、リアルタイムモーションプランニングに適しています。
平面ロボットナビゲーションや7-DOF操作など、多様なタスクのセットでSAFEFMを評価し、最先端の生成プランナーと比較して優れた安全性、一般化、および計画パフォーマンスを実証します。
包括的なリソースは、プロジェクトWebサイト:https://safeflowmatching.github.io/safefm/で入手できます。

要約(オリジナル)

Recent advances in generative modeling have led to promising results in robot motion planning, particularly through diffusion and flow-based models that capture complex, multimodal trajectory distributions. However, these methods are typically trained offline and remain limited when faced with unseen environments or dynamic constraints, often lacking explicit mechanisms to ensure safety during deployment. In this work, we propose, Safe Flow Matching (SafeFM), a motion planning approach for trajectory generation that integrates flow matching with safety guarantees. By incorporating the proposed flow matching barrier functions, SafeFM ensures that generated trajectories remain within safe regions throughout the planning horizon, even in the presence of previously unseen obstacles or state-action constraints. Unlike diffusion-based approaches, our method allows for direct, efficient sampling of constraint-satisfying trajectories, making it well-suited for real-time motion planning. We evaluate SafeFM on a diverse set of tasks, including planar robot navigation and 7-DoF manipulation, demonstrating superior safety, generalization, and planning performance compared to state-of-the-art generative planners. Comprehensive resources are available on the project website: https://safeflowmatching.github.io/SafeFM/

arxiv情報

著者 Xiaobing Dai,Dian Yu,Shanshan Zhang,Zewen Yang
発行日 2025-04-11 16:10:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Safe Flow Matching: Robot Motion Planning with Control Barrier Functions はコメントを受け付けていません

Performance Evaluation of Trajectory Tracking Controllers for a Quadruped Robot Leg

要約

脚のあるロボットの動的モデルの複雑さにより、軌跡追跡のタスクでモデルのないコントローラーを利用する必要があります。
このホワイトペーパーでは、適応型のヤコビアンアプローチが提案され、動的モデルの複雑さに対処します。これは、適応性のあるPi-algorithmを利用してコントロールゲインを調整します。
提案された制御アルゴリズムのパフォーマンスは、従来の転置ヤコビアンおよびスライドモード制御アルゴリズムと比較され、エラーのルート平均平方で評価され、入力エネルギー基準を制御します。
提案された制御システムの有効性を評価するために、セミエリプチカルパストラッキング用の四足ロボットレッグのMATLAB/SIMULINKソフトウェアでシミュレーションが実行されます。
得られた結果は、提案された適応型転置ヤコビアンが誤差のオーバーシュートと根平均平方を減らし、同時に制御入力エネルギーを減少させることを示しています。
さらに、ヤコビンを転置し、適応型転置ヤコビアンは、従来のスライドモード制御と比較して、初期条件の変化により堅牢です。
さらに、スライディングモード制御は、モデルベースの性質のためにパラメーターで最大20%の不確実性を実行しますが、転置ヤコビンと提案された適応転置ヤコビアンアルゴリズムは、より高い質量の不確実性であっても有望な結果を示しています。

要約(オリジナル)

The complexities in the dynamic model of the legged robots make it necessary to utilize model-free controllers in the task of trajectory tracking. In This paper, an adaptive transpose Jacobian approach is proposed to deal with the dynamic model complexity, which utilizes an adaptive PI-algorithm to adjust the control gains. The performance of the proposed control algorithm is compared with the conventional transpose Jacobian and sliding mode control algorithms and evaluated by the root mean square of the errors and control input energy criteria. In order to appraise the effectiveness of the proposed control system, simulations are carried out in MATLAB/Simulink software for a quadruped robot leg for semi-elliptical path tracking. The obtained results show that the proposed adaptive transpose Jacobian reduces the overshoot and root mean square of the errors and at the same time, decreases the control input energy. Moreover, transpose Jacobin and adaptive transpose Jacobian are more robust to changes in initial conditions compared to the conventional sliding mode control. Furthermore, sliding mode control performs well up to 20% uncertainties in the parameters due to its model-based nature, whereas the transpose Jacobin and the proposed adaptive transpose Jacobian algorithms show promising results even in higher mass uncertainties.

arxiv情報

著者 Hossein Shojaei,Hamid Rahmanei,Seyed Hossein Sadati
発行日 2025-04-11 17:04:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Performance Evaluation of Trajectory Tracking Controllers for a Quadruped Robot Leg はコメントを受け付けていません

BiFlex: A Passive Bimodal Stiffness Flexible Wrist for Manipulation in Unstructured Environments

要約

構造化されていないハノー環境でのロボット操作は、二重の課題をもたらします。予期しない接触イベント中に安全を確保しながら、繊細な自由空間操作の精度を達成することです。
従来の手首は、これらの要求のバランスをとるのに苦労しており、多くの場合、複雑な制御スキームまたは複雑な機械設計に依存して、力の過負荷による潜在的な損傷を軽減します。
これに応じて、柔らかい座屈のハニカム構造を使用して自然なバイモーダル剛性応答を提供する柔軟なロボットリストであるBiflexを提示します。
より高い剛性モードは、正確な家庭用オブジェクトの操作を可能にしますが、より低い剛性モードは、外力に適応するために必要なコンプライアンスを提供します。
最大500gの負荷をサポートしながら、1 cm未満の指先のたわみを維持するためにBiflexを設計し、Panda、Robotiq、Baliflexなどの多くのグリッパーにビフレックス手首を作成します。
表面の拭き取り、正確なピックアンドプレイス、環境制約の下での把握など、いくつかの実際の実験的評価の下でバイフェックスを検証します。
Biflexは、正確なオブジェクトの操作を維持しながら、現実世界のアプリケーションでの安全性を維持しながら、制御を簡素化することを実証します。

要約(オリジナル)

Robotic manipulation in unstructured, humancentric environments poses a dual challenge: achieving the precision need for delicate free-space operation while ensuring safety during unexpected contact events. Traditional wrists struggle to balance these demands, often relying on complex control schemes or complicated mechanical designs to mitigate potential damage from force overload. In response, we present BiFlex, a flexible robotic wrist that uses a soft buckling honeycomb structure to provides a natural bimodal stiffness response. The higher stiffness mode enables precise household object manipulation, while the lower stiffness mode provides the compliance needed to adapt to external forces. We design BiFlex to maintain a fingertip deflection of less than 1 cm while supporting loads up to 500g and create a BiFlex wrist for many grippers, including Panda, Robotiq, and BaRiFlex. We validate BiFlex under several real-world experimental evaluations, including surface wiping, precise pick-and-place, and grasping under environmental constraints. We demonstrate that BiFlex simplifies control while maintaining precise object manipulation and enhanced safety in real-world applications.

arxiv情報

著者 Gu-Cheol Jeong,Stefano Dalla Gasperina,Ashish D. Deshpande,Lillian Chin,Roberto Martín-Martín
発行日 2025-04-11 17:16:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | BiFlex: A Passive Bimodal Stiffness Flexible Wrist for Manipulation in Unstructured Environments はコメントを受け付けていません

Physics-informed data-driven control without persistence of excitation

要約

システムの再識別を可能にするために十分に有益ではないデータが、境界のあるシステムマトリックスの規範などのシステムの外部または物理的知識と組み合わせると、意味のある情報を提供できることを示します。
次に、安全性とエネルギーの最小化の問題と、モデルのないダイナミクスの予測を強化するために、この情報をどのように活用できるかを説明します。
この予備作業は、システムに関する物理的な知識を統合し、補間条件を活用することにより、効果的な制御のために限られたデータを使用することに向けた重要なアイデアを概説しています。

要約(オリジナル)

We show that data that is not sufficiently informative to allow for system re-identification can still provide meaningful information when combined with external or physical knowledge of the system, such as bounded system matrix norms. We then illustrate how this information can be leveraged for safety and energy minimization problems and to enhance predictions in unmodelled dynamics. This preliminary work outlines key ideas toward using limited data for effective control by integrating physical knowledge of the system and exploiting interpolation conditions.

arxiv情報

著者 Martina Vanelli,Julien M. Hendrickx
発行日 2025-04-11 12:19:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Physics-informed data-driven control without persistence of excitation はコメントを受け付けていません

Minimax-optimal and Locally-adaptive Online Nonparametric Regression

要約

一般的な凸損失を使用して敵対的なオンラインノンパラメトリック回帰を研究し、最適なレートを達成するパラメーターのない学習アルゴリズムを提案します。
私たちのアプローチは、h {\ ‘o} lder関数と競合するために木の連鎖を活用し、最適な後悔の境界を確立します。
ノンパラメトリック関数クラスとの競合は困難な場合がありますが、オンラインアルゴリズムが活用できるローカルH {\ ‘o} Lder Continuityなどのローカルパターンを示すことがよくあります。
事前知識がなければ、私たちの方法は、コアチェーンツリー構造を剪定して、ローカルスムーズさの変動に合わせて、異なるh {\ ‘o} lderプロファイルに動的に追跡および適応します。
これにより、敵対的な設定でのオンライン回帰のための局所的に適応的な最適レートを備えた最初の計算効率的なアルゴリズムにつながります。
最後に、これらの概念をブーストフレームワークに拡張する方法について説明し、将来の研究のための有望な方向性を提供します。

要約(オリジナル)

We study adversarial online nonparametric regression with general convex losses and propose a parameter-free learning algorithm that achieves minimax optimal rates. Our approach leverages chaining trees to compete against H{\’o}lder functions and establishes optimal regret bounds. While competing with nonparametric function classes can be challenging, they often exhibit local patterns – such as local H{\’o}lder continuity – that online algorithms can exploit. Without prior knowledge, our method dynamically tracks and adapts to different H{\’o}lder profiles by pruning a core chaining tree structure, aligning itself with local smoothness variations. This leads to the first computationally efficient algorithm with locally adaptive optimal rates for online regression in an adversarial setting. Finally, we discuss how these notions could be extended to a boosting framework, offering promising directions for future research.

arxiv情報

著者 Paul Liautaud,Pierre Gaillard,Olivier Wintenberger
発行日 2025-04-11 12:20:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | Minimax-optimal and Locally-adaptive Online Nonparametric Regression はコメントを受け付けていません

Statistically guided deep learning

要約

ノンパラメトリック回帰のために、理論的には十分に根拠のある深い学習アルゴリズムを提示します。
ロジスティックアクティベーション関数を備えた過剰なパラメトリングディープニューラルネットワークを使用します。これは、勾配降下を介して与えられたデータに適合します。
これらのネットワークの特別なトポロジー、重みの特別なランダム初期化、学習率と勾配降下手順のデータ依存的選択を提案します。
この推定値の予想される$ L_2 $エラーに理論的にバインドされていることを証明し、シミュレートされたデータに適用することにより、その有限サンプルサイズのパフォーマンスを示します。
我々の結果は、最適化、一般化、および近似を同時に考慮した深い学習の理論的分析により、有限のサンプルパフォーマンスが向上する新しい深い学習推定値をもたらす可能性があることを示しています。

要約(オリジナル)

We present a theoretically well-founded deep learning algorithm for nonparametric regression. It uses over-parametrized deep neural networks with logistic activation function, which are fitted to the given data via gradient descent. We propose a special topology of these networks, a special random initialization of the weights, and a data-dependent choice of the learning rate and the number of gradient descent steps. We prove a theoretical bound on the expected $L_2$ error of this estimate, and illustrate its finite sample size performance by applying it to simulated data. Our results show that a theoretical analysis of deep learning which takes into account simultaneously optimization, generalization and approximation can result in a new deep learning estimate which has an improved finite sample performance.

arxiv情報

著者 Michael Kohler,Adam Krzyzak
発行日 2025-04-11 12:36:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | Statistically guided deep learning はコメントを受け付けていません

A noise-corrected Langevin algorithm and sampling by half-denoising

要約

Langevinアルゴリズムは、特定のPDFから実際の空間でサンプリングするための典型的な方法です。
基本バージョンでは、スコア関数とも呼ばれるログ密度の勾配に関する知識のみが必要です。
ただし、ディープラーニングでは、いわゆる「ノイズ型ダタスコア関数」、つまりノイズの多いデータのログ密度の勾配を学習する方が簡単なことがよくあります。
このような推定値は偏っており、ランジュビン法の使用を複雑にします。
ここでは、少なくとも1次用語に関しては、ノイズの多いデータによるバイアスが削除されるLangevinアルゴリズムのノイズ補正バージョンを提案します。
拡散モデルとは異なり、私たちのアルゴリズムは、1つのノイズレベルのみでノイズスコア関数を知る必要があります。
さらに、データを繰り返し追加し、そのノイズの半分を削除しようとするという反復的に直感的な解釈がある簡単な特別なケースを提案します。

要約(オリジナル)

The Langevin algorithm is a classic method for sampling from a given pdf in a real space. In its basic version, it only requires knowledge of the gradient of the log-density, also called the score function. However, in deep learning, it is often easier to learn the so-called ‘noisy-data score function’, i.e. the gradient of the log-density of noisy data, more precisely when Gaussian noise is added to the data. Such an estimate is biased and complicates the use of the Langevin method. Here, we propose a noise-corrected version of the Langevin algorithm, where the bias due to noisy data is removed, at least regarding first-order terms. Unlike diffusion models, our algorithm needs to know the noisy score function for one single noise level only. We further propose a simple special case which has an interesting intuitive interpretation of iteratively adding noise the data and then attempting to remove half of that noise.

arxiv情報

著者 Aapo Hyvärinen
発行日 2025-04-11 12:46:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | A noise-corrected Langevin algorithm and sampling by half-denoising はコメントを受け付けていません

Optimal Rates and Saturation for Noiseless Kernel Ridge Regression

要約

最小二乗サポートベクターマシンとしても知られるカーネルリッジ回帰(KRR)は、有限サンプルから機能を学習するための基本的な方法です。
ほとんどの既存の分析は、一定レベルのラベルノイズを備えたノイズの多い設定に焦点を当てていますが、ノイズレスレジームでのKRRの包括的な研究を紹介します。
対数要因まで、Noiseless KRRは、関連する積分演算子の固有値減衰とターゲット関数の滑らかさによって共同で決定されるMinimax最適収束速度を達成することを確立します。
これらのレートは、ソボレフ型補間基準の下で導き出され、$ l^2 $ normは特別なケースとしてです。
特に、2つの重要な現象を発見します。これは、KRR溶液がネイティブの繁殖カーネルヒルベルト空間(RKHS)の典型的な機能よりも高い滑らかさを示し、ターゲット関数の滑らかさの適応性が特定のレベルを超えた飽和効果です。
これらの洞察を活用して、ノイズレベルの認識であり、ノイズレスとノイズの多い体制の両方で最小限の最適性を実現するノイズの多いKRRに縛られた新しいエラーも導き出されます。
主要な技術的貢献として、自由度の洗練された概念を導入します。これは、カーネル法の分析においてより広範な適用性があると考えています。
広範な数値実験は、理論的な結果を検証し、既存の理論を超えた洞察を提供します。

要約(オリジナル)

Kernel ridge regression (KRR), also known as the least-squares support vector machine, is a fundamental method for learning functions from finite samples. While most existing analyses focus on the noisy setting with constant-level label noise, we present a comprehensive study of KRR in the noiseless regime — a critical setting in scientific computing where data are often generated via high-fidelity numerical simulations. We establish that, up to logarithmic factors, noiseless KRR achieves minimax optimal convergence rates, jointly determined by the eigenvalue decay of the associated integral operator and the target function’s smoothness. These rates are derived under Sobolev-type interpolation norms, with the $L^2$ norm as a special case. Notably, we uncover two key phenomena: an extra-smoothness effect, where the KRR solution exhibits higher smoothness than typical functions in the native reproducing kernel Hilbert space (RKHS), and a saturation effect, where the KRR’s adaptivity to the target function’s smoothness plateaus beyond a certain level. Leveraging these insights, we also derive a novel error bound for noisy KRR that is noise-level aware and achieves minimax optimality in both noiseless and noisy regimes. As a key technical contribution, we introduce a refined notion of degrees of freedom, which we believe has broader applicability in the analysis of kernel methods. Extensive numerical experiments validate our theoretical results and provide insights beyond existing theory.

arxiv情報

著者 Jihao Long,Xiaojun Peng,Lei Wu
発行日 2025-04-11 12:55:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Optimal Rates and Saturation for Noiseless Kernel Ridge Regression はコメントを受け付けていません

Slicing the Gaussian Mixture Wasserstein Distance

要約

ガウス混合モデル(GMM)は、クラスタリング、分類、画像再構成、生成モデリングなどのタスクの機械学習で広く使用されています。
GMMSの操作における重要な課題は、計算効率的で幾何学的に意味のあるメトリックを定義することです。
混合物Wasserstein(MW)距離は、WassersteinメトリックをGMMSに適応し、ドメイン適応、データセット比較、補強学習など、さまざまなドメインに適用されています。
ただし、マトリックスの平方根推定と高価な線形プログラムを含む繰り返されるワッサースタイン距離計算から生じる高い計算コストは​​、高次元および大規模な問題に対するスケーラビリティを制限します。
これに対処するために、MW距離の複数の新規スライシングベースの近似を提案し、主要な最適な輸送特性を維持しながら計算の複雑さを大幅に削減します。
理論的観点から、導入されたメトリックの間にいくつかの弱い等価性を確立し、元のMW距離と十分に確立されたスライスされたワッサースタイン距離との関係を示します。
さらに、数値実験を通じてアプローチの有効性を検証し、クラスタリング、知覚画像比較、GMMの最小化における計算効率とアプリケーションを実証します

要約(オリジナル)

Gaussian mixture models (GMMs) are widely used in machine learning for tasks such as clustering, classification, image reconstruction, and generative modeling. A key challenge in working with GMMs is defining a computationally efficient and geometrically meaningful metric. The mixture Wasserstein (MW) distance adapts the Wasserstein metric to GMMs and has been applied in various domains, including domain adaptation, dataset comparison, and reinforcement learning. However, its high computational cost — arising from repeated Wasserstein distance computations involving matrix square root estimations and an expensive linear program — limits its scalability to high-dimensional and large-scale problems. To address this, we propose multiple novel slicing-based approximations to the MW distance that significantly reduce computational complexity while preserving key optimal transport properties. From a theoretical viewpoint, we establish several weak and strong equivalences between the introduced metrics, and show the relations to the original MW distance and the well-established sliced Wasserstein distance. Furthermore, we validate the effectiveness of our approach through numerical experiments, demonstrating computational efficiency and applications in clustering, perceptual image comparison, and GMM minimization

arxiv情報

著者 Moritz Piening,Robert Beinert
発行日 2025-04-11 13:57:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML | Slicing the Gaussian Mixture Wasserstein Distance はコメントを受け付けていません