Kinematic-ICP: Enhancing LiDAR Odometry with Kinematic Constraints for Wheeled Mobile Robots Moving on Planar Surfaces

要約

Lidar odometryは、3Dマッピング、ナビゲーション、同時ローカリゼーションとマッピングなど、多くのロボットアプリケーションに不可欠です。
Lidar odometryシステムは通常、モバイルロボットのエゴモーションを計算するための何らかの形のポイントクラウド登録に基づいています。
しかし、ポイントクラウドのアラインメント中に、今日のLidar odometryシステムのほとんどは、ドメイン固有の知識またはモバイルプラットフォームの運動モデルを考慮しています。
このホワイトペーパーでは、3Dライダーを装備し、平面表面を装備した車輪付きモバイルロボットに焦点を当てたLidar odmetryシステムである運動学ICPを紹介します。これは、倉庫、オフィス、病院などの一般的な仮定です。
従来のポイントツーポイント反復的な最も近いポイントスキームの最適化内の制約。
このようにして、結果として生じる動きは、プラットフォームの運動学的制約に従い、ロボットのホイール臭気と3Dライダー観測を効果的に活用します。
最適化スキームにおけるLidar測定とホイール臭トメリトリーの影響を動的に調整し、システムが機能型の廊下などの縮退シナリオを処理できるようにします。
大規模な倉庫環境で動作するロボットに関するアプローチを評価しますが、屋外でも評価します。
この実験は、私たちのアプローチがトップパフォーマンスを達成し、ホイール臭トメトリーや一般的なLidar臭気システムよりも正確であることを示しています。
Kinematic-ICPは、最近、顧客のサイトで世界中の倉庫で動作するロボットのデキソリー艦隊に展開されており、完全なナビゲーションスタックとともにこの方法が現実の世界で実行できることを示しています。

要約(オリジナル)

LiDAR odometry is essential for many robotics applications, including 3D mapping, navigation, and simultaneous localization and mapping. LiDAR odometry systems are usually based on some form of point cloud registration to compute the ego-motion of a mobile robot. Yet, few of today’s LiDAR odometry systems consider domain-specific knowledge or the kinematic model of the mobile platform during the point cloud alignment. In this paper, we present Kinematic-ICP, a LiDAR odometry system that focuses on wheeled mobile robots equipped with a 3D LiDAR and moving on a planar surface, which is a common assumption for warehouses, offices, hospitals, etc. Our approach introduces kinematic constraints within the optimization of a traditional point-to-point iterative closest point scheme. In this way, the resulting motion follows the kinematic constraints of the platform, effectively exploiting the robot’s wheel odometry and the 3D LiDAR observations. We dynamically adjust the influence of LiDAR measurements and wheel odometry in our optimization scheme, allowing the system to handle degenerate scenarios such as feature-poor corridors. We evaluate our approach on robots operating in large-scale warehouse environments, but also outdoors. The experiments show that our approach achieves top performances and is more accurate than wheel odometry and common LiDAR odometry systems. Kinematic-ICP has been recently deployed in the Dexory fleet of robots operating in warehouses worldwide at their customers’ sites, showing that our method can run in the real world alongside a complete navigation stack.

arxiv情報

著者 Tiziano Guadagnino,Benedikt Mersch,Ignacio Vizzo,Saurabh Gupta,Meher V. R. Malladi,Luca Lobefaro,Guillaume Doisy,Cyrill Stachniss
発行日 2025-02-07 13:52:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Kinematic-ICP: Enhancing LiDAR Odometry with Kinematic Constraints for Wheeled Mobile Robots Moving on Planar Surfaces はコメントを受け付けていません

A Transformation-based Consistent Estimation Framework: Analysis, Design and Applications

要約

この論文では、マルチロボット協同組合のローカリゼーションや同時ローカリゼーションとマッピングなどの非線形システムで頻繁に発生する観測可能性の不一致から生じる矛盾の問題を調査します。
一般的な非線形システムの場合、EKF推定器システムの観察不可能な部分空間は状態とは無関係であり、元のシステムの観察不可能な部分空間に属していることを発見し、理論的に証明します。
これに基づいて、観察可能性のマッチングを達成するために必要かつ十分な条件を確立します。
これらの理論的発見は、状態に依存しない未観測不可能なサブスペースを有する変換されたシステムを実現するために、線形の時変変換を導入するように私たちを動機付けています。
そのような変換の存在を証明し、それらを構築するための2つの設計方法論を提案します。
さらに、それぞれT-EKF 1およびT-EKF 2と呼ばれる2つの同等の一貫した変換ベースのEKF推定器を提案します。
T-EKF 1は、一貫した推定のために変換されたシステムを使用しますが、T-EKF 2は元のシステムを活用しますが、変換からの状態および共分散補正を通じて一貫性を保証します。
提案された方法を検証するために、マルチロボット協同組合のローカリゼーション、マルチソースターゲット追跡、3D視覚慣性匂いなど、いくつかの代表的な例で実験を実施し、私たちのアプローチが最先端のパフォーマンスを達成することを実証します。
精度、一貫性、計算効率、および実用的な実現。

要約(オリジナル)

In this paper, we investigate the inconsistency problem arising from observability mismatch that frequently occurs in nonlinear systems such as multi-robot cooperative localization and simultaneous localization and mapping. For a general nonlinear system, we discover and theoretically prove that the unobservable subspace of the EKF estimator system is independent of the state and belongs to the unobservable subspace of the original system. On this basis, we establish the necessary and sufficient conditions for achieving observability matching. These theoretical findings motivate us to introduce a linear time-varying transformation to achieve a transformed system possessing a state-independent unobservable subspace. We prove the existence of such transformations and propose two design methodologies for constructing them. Moreover, we propose two equivalent consistent transformation-based EKF estimators, referred to as T-EKF 1 and T-EKF 2, respectively. T-EKF 1 employs the transformed system for consistent estimation, whereas T-EKF 2 leverages the original system but ensures consistency through state and covariance corrections from transformations. To validate our proposed methods, we conduct experiments on several representative examples, including multi-robot cooperative localization, multi-source target tracking, and 3D visual-inertial odometry, demonstrating that our approach achieves state-of-the-art performance in terms of accuracy, consistency, computational efficiency, and practical realizations.

arxiv情報

著者 Ning Hao,Chungeng Tian,Fenghua He
発行日 2025-02-07 15:28:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Transformation-based Consistent Estimation Framework: Analysis, Design and Applications はコメントを受け付けていません

Seasonal Station-Keeping of Short Duration High Altitude Balloons using Deep Reinforcement Learning

要約

関心のある地域におけるステーションキーピング短時間の高度の高地風船(HAB)は、部分的に観察可能で複雑な、動的な風が流れるため、挑戦的なパス計画の問題です。
ディープ補強学習は、ステーション維持の問題を解決するための一般的な戦略です。
カスタムシミュレーション環境は、シミュレーション内の短期間のHABエージェントのディープQラーニング(DQN)をトレーニングおよび評価するために開発されました。
エージェントを現実的な風で訓練するために、合成風の予測は、総歴史的ラジオゾンデデータから生成され、水平方向の運動学をシミュレートされた薬剤に適用しました。
合成予測は、ECWMF ERA5再分析予測と密接に相関しており、風力モデル間の現実的なシミュレートされた風場と季節的および高度分散を提供します。
その後、DQN HABのエージェントは、さまざまな季節の月にわたって訓練され、評価されました。
大幅に異なる風のフィールドで数か月の違いと傾向を強調するために、風力の多様性に基づいて予測を独立して分類するために予測スコアアルゴリズムが導入され、ステーション維持の成功と予測スコアの間の傾向がすべてのシーズンで評価されました。

要約(オリジナル)

Station-Keeping short-duration high-altitude balloons (HABs) in a region of interest is a challenging path-planning problem due to partially observable, complex, and dynamic wind flows. Deep reinforcement learning is a popular strategy for solving the station-keeping problem. A custom simulation environment was developed to train and evaluate Deep Q-Learning (DQN) for short-duration HAB agents in the simulation. To train the agents on realistic winds, synthetic wind forecasts were generated from aggregated historical radiosonde data to apply horizontal kinematics to simulated agents. The synthetic forecasts were closely correlated with ECWMF ERA5 Reanalysis forecasts, providing a realistic simulated wind field and seasonal and altitudinal variances between the wind models. DQN HAB agents were then trained and evaluated across different seasonal months. To highlight differences and trends in months with vastly different wind fields, a Forecast Score algorithm was introduced to independently classify forecasts based on wind diversity, and trends between station-keeping success and the Forecast Score were evaluated across all seasons.

arxiv情報

著者 Tristan K. Schuler,Chinthan Prasad,Georgiy Kiselev,Donald Sofge
発行日 2025-02-07 15:42:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, physics.ao-ph | Seasonal Station-Keeping of Short Duration High Altitude Balloons using Deep Reinforcement Learning はコメントを受け付けていません

Gaze-Guided Robotic Vascular Ultrasound Leveraging Human Intention Estimation

要約

医療超音波は、現代の臨床診療における血管構造を調べるために広く使用されています。
ただし、従来の超音波検査は、多くの場合、術中および術中の変動に関連する課題に直面しています。
ロボット超音波システム(RUSS)は、安定性と再現性に優れているため、このような課題に対する潜在的なソリューションとして表示されます。
人間の血管系の複雑な解剖学を考えると、複数の血管が超音波画像に表示されることがよくあるか、単一の容器が枝に分岐し、検査プロセスを複雑にします。
この課題に取り組むために、この作品は血管用途向けの視線誘導RUSSを提示します。
視線トラッカーは、オペレーターの目の動きをキャプチャします。
抽出された視線信号は、Russが分岐するときに正しい容器に従うように導きます。
さらに、注視情報を活用することにより、セグメンテーションの堅牢性を高めるために、視線誘導セグメンテーションネットワークが提案されています。
ただし、視線信号はしばしばノイズが多く、オペレーターの真の意図を正確に識別するための解釈が必要です。
この目的のために、この研究では、生の視線データを処理する安定化モジュールを提案しています。
推定された注意ヒートマップは、分岐が表示されるときなど、オペレーターがスキャンターゲットを調整する必要がある場合、セグメンテーションを支援し、トリガー信号として機能する地域の提案として利用されます。
スキャン中にプローブと表面間の適切な接触を確保するために、自動超音波信頼ベースの方向補正方法が開発されています。
実験では、提案された視線誘導セグメンテーションパイプラインの効率を他の方法と比較することにより実証しました。
その上、提案された視線誘導RUSSのパフォーマンスは、不均一な表面を持つ現実的な腕の幻に関する全体としても検証されました。

要約(オリジナル)

Medical ultrasound has been widely used to examine vascular structure in modern clinical practice. However, traditional ultrasound examination often faces challenges related to inter- and intra-operator variation. The robotic ultrasound system (RUSS) appears as a potential solution for such challenges because of its superiority in stability and reproducibility. Given the complex anatomy of human vasculature, multiple vessels often appear in ultrasound images, or a single vessel bifurcates into branches, complicating the examination process. To tackle this challenge, this work presents a gaze-guided RUSS for vascular applications. A gaze tracker captures the eye movements of the operator. The extracted gaze signal guides the RUSS to follow the correct vessel when it bifurcates. Additionally, a gaze-guided segmentation network is proposed to enhance segmentation robustness by exploiting gaze information. However, gaze signals are often noisy, requiring interpretation to accurately discern the operator’s true intentions. To this end, this study proposes a stabilization module to process raw gaze data. The inferred attention heatmap is utilized as a region proposal to aid segmentation and serve as a trigger signal when the operator needs to adjust the scanning target, such as when a bifurcation appears. To ensure appropriate contact between the probe and surface during scanning, an automatic ultrasound confidence-based orientation correction method is developed. In experiments, we demonstrated the efficiency of the proposed gaze-guided segmentation pipeline by comparing it with other methods. Besides, the performance of the proposed gaze-guided RUSS was also validated as a whole on a realistic arm phantom with an uneven surface.

arxiv情報

著者 Yuan Bi,Yang Su,Nassir Navab,Zhongliang Jiang
発行日 2025-02-07 16:20:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Gaze-Guided Robotic Vascular Ultrasound Leveraging Human Intention Estimation はコメントを受け付けていません

GCBF+: A Neural Graph Control Barrier Function Framework for Distributed Safe Multi-Agent Control

要約

大規模なマルチエージェントシステムの分散、スケーラブル、安全な制御は、困難な問題です。
このホワイトペーパーでは、障害物を備えた大規模な環境で安全なマルチエージェント制御のための分散フレームワークを設計します。そこでは、ローカル情報のみを使用して安全を維持し、目標の場所に到達するために多数のエージェントが必要です。
安全保証のために確立された制御障壁機能理論に基づいたグラフ制御バリア関数(GCBF)と呼ばれる新しいクラスの証明書を導入し、MASのスケーラブルで一般化可能な分散制御のためのグラフ構造を利用します。
単一のGCBFを使用した任意のサイズのMASの安全性を証明するために、新しい理論的枠組みを開発します。
グラフニューラルネットワークを使用して候補GCBFと分散制御ポリシーをパラメーター化する新しいトレーニングフレームワークGCBF+を提案します。
提案されたフレームワークは配布されており、実際のロボットアプリケーションのために、実際の状態情報の代わりにLidarからポイントクラウドを取得することができます。
ドローンの群れでのさまざまなハードウェア実験を通じて、衝突せずに位置を交換することから移動ターゲットのドッキングに至るまでの目的を持つさまざまなハードウェア実験を通じて、提案された方法の有効性を説明します。
さらに、エージェントの数と密度、および障害物の数が増加する広範な数値実験を実行します。
経験的結果は、非線形ダイナミクスを持つエージェント(クレイジーフリードローンなど)を備えた複雑な環境では、GCBF+が256のエージェントを持つ比較的小規模なMASで最高のパフォーマンスを持つ手作りのCBFベースの方法を最大20%上回ることを示しています。
1024エージェントのMASで最大40%の主要な強化学習(RL)方法。
さらに、提案された方法は、RLベースの方法で一般的なトレードオフである高い安全率を達成するために、目標到達の観点からパフォーマンスを妥協しません。

要約(オリジナル)

Distributed, scalable, and safe control of large-scale multi-agent systems is a challenging problem. In this paper, we design a distributed framework for safe multi-agent control in large-scale environments with obstacles, where a large number of agents are required to maintain safety using only local information and reach their goal locations. We introduce a new class of certificates, termed graph control barrier function (GCBF), which are based on the well-established control barrier function theory for safety guarantees and utilize a graph structure for scalable and generalizable distributed control of MAS. We develop a novel theoretical framework to prove the safety of an arbitrary-sized MAS with a single GCBF. We propose a new training framework GCBF+ that uses graph neural networks to parameterize a candidate GCBF and a distributed control policy. The proposed framework is distributed and is capable of taking point clouds from LiDAR, instead of actual state information, for real-world robotic applications. We illustrate the efficacy of the proposed method through various hardware experiments on a swarm of drones with objectives ranging from exchanging positions to docking on a moving target without collision. Additionally, we perform extensive numerical experiments, where the number and density of agents, as well as the number of obstacles, increase. Empirical results show that in complex environments with agents with nonlinear dynamics (e.g., Crazyflie drones), GCBF+ outperforms the hand-crafted CBF-based method with the best performance by up to 20% for relatively small-scale MAS with up to 256 agents, and leading reinforcement learning (RL) methods by up to 40% for MAS with 1024 agents. Furthermore, the proposed method does not compromise on the performance, in terms of goal reaching, for achieving high safety rates, which is a common trade-off in RL-based methods.

arxiv情報

著者 Songyuan Zhang,Oswin So,Kunal Garg,Chuchu Fan
発行日 2025-02-07 16:34:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | GCBF+: A Neural Graph Control Barrier Function Framework for Distributed Safe Multi-Agent Control はコメントを受け付けていません

Exploring the Generalizability of Geomagnetic Navigation: A Deep Reinforcement Learning approach with Policy Distillation

要約

自動運転車の進歩により、未知の環境でのナビゲーションと探索が力を与えました。
自律車両の地磁気ナビゲーションは、GPSまたは慣性ナビゲーションデバイスからの独立性により、注目を集めています。
地磁気ナビゲーションアプローチは広く調査されていますが、学習した地磁気ナビゲーション戦略の一般化可能性は未開拓のままです。
学んだ戦略のパフォーマンスは、新しく入力された領域の地磁気特性に関する知識が不足しているため、戦略が学習されているソースドメインの外側で劣化する可能性があります。
このペーパーでは、ディープ補強学習(DRL)を介した学習した地磁気ナビゲーション戦略の一般化について説明します。
特に、DRLエージェントを採用して、分散ナビゲーション戦略を表す分散ドメインから複数の教師モデルを学習し、ナビゲーションエリア全体で一般化のために教師モデルを整理します。
潜在的なベースと本質的な動機付けの報酬の両方を統合する教師モデルのトレーニングにおける報酬形状メカニズムを設計します。
設計された報酬形状は、DRLエージェントの探査効率を高め、教師モデルの表現を改善することができます。
獲得された教師モデルに伴い、マルチテーカーポリシーの蒸留を採用して、個々の教師が学んだポリシーをマージし、ナビゲーションドメイン全体の一般化を伴うナビゲーション戦略につながります。
数値シミュレーションを実施し、結果は、ソースドメインから新しいナビゲーションエリアへの学習DRLモデルの効果的な転送を示しています。
既存の進化ベースの地磁気ナビゲーション方法と比較して、私たちのアプローチは、ドメインクロスナビゲーションのナビゲーション長、期間、見出し偏差、成功率の点で優れた性能を提供します。

要約(オリジナル)

The advancement in autonomous vehicles has empowered navigation and exploration in unknown environments. Geomagnetic navigation for autonomous vehicles has drawn increasing attention with its independence from GPS or inertial navigation devices. While geomagnetic navigation approaches have been extensively investigated, the generalizability of learned geomagnetic navigation strategies remains unexplored. The performance of a learned strategy can degrade outside of its source domain where the strategy is learned, due to a lack of knowledge about the geomagnetic characteristics in newly entered areas. This paper explores the generalization of learned geomagnetic navigation strategies via deep reinforcement learning (DRL). Particularly, we employ DRL agents to learn multiple teacher models from distributed domains that represent dispersed navigation strategies, and amalgamate the teacher models for generalizability across navigation areas. We design a reward shaping mechanism in training teacher models where we integrate both potential-based and intrinsic-motivated rewards. The designed reward shaping can enhance the exploration efficiency of the DRL agent and improve the representation of the teacher models. Upon the gained teacher models, we employ multi-teacher policy distillation to merge the policies learned by individual teachers, leading to a navigation strategy with generalizability across navigation domains. We conduct numerical simulations, and the results demonstrate an effective transfer of the learned DRL model from a source domain to new navigation areas. Compared to existing evolutionary-based geomagnetic navigation methods, our approach provides superior performance in terms of navigation length, duration, heading deviation, and success rate in cross-domain navigation.

arxiv情報

著者 Wenqi Bai,Shiliang Zhang,Xiaohui Zhang,Xuehui Ma,Songnan Yang,Yushuai Li,Tingwen Huang
発行日 2025-02-07 16:43:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Exploring the Generalizability of Geomagnetic Navigation: A Deep Reinforcement Learning approach with Policy Distillation はコメントを受け付けていません

REASSEMBLE: A Multimodal Dataset for Contact-rich Robotic Assembly and Disassembly

要約

ロボット操作は、特に産業集会や分解などの接触豊富なタスクのために、ロボット工学の中心的な課題のままです。
既存のデータセットは、操作において大幅に高度な学習を行っていますが、主にオブジェクトの再配置などのより単純なタスクに焦点を当てており、アセンブリと分解に関与する複雑さと物理的ダイナミクスをキャプチャすることはできません。
このギャップを埋めるために、連絡先の操作タスク専用に設計された新しいデータセットである再組み立て(ロボットアセンブリ分解データセット)を提示します。
NISTアセンブリタスクボード1ベンチマークの周りに構築された再構築には、17のオブジェクトを含む4つのアクション(ピック、挿入、削除、および配置)が含まれます。
データセットには4,551個のデモが含まれており、そのうち4,035個が合計781分にわたって成功しました。
データセットには、イベントカメラ、フォーストルクセンサー、マイク、マルチビューRGBカメラなどのマルチモーダルセンサーデータがあります。
この多様なデータセットは、連絡先が豊富な操作、タスク条件の識別、アクションセグメンテーションなどの学習などの分野での研究をサポートしています。
再組み立ては、複雑で実世界のシナリオでロボット操作を進めるための貴重なリソースになると考えています。
データセットは、プロジェクトWebサイトhttps://dsliwowski1.github.io/reassemble_pageで公開されています。

要約(オリジナル)

Robotic manipulation remains a core challenge in robotics, particularly for contact-rich tasks such as industrial assembly and disassembly. Existing datasets have significantly advanced learning in manipulation but are primarily focused on simpler tasks like object rearrangement, falling short of capturing the complexity and physical dynamics involved in assembly and disassembly. To bridge this gap, we present REASSEMBLE (Robotic assEmbly disASSEMBLy datasEt), a new dataset designed specifically for contact-rich manipulation tasks. Built around the NIST Assembly Task Board 1 benchmark, REASSEMBLE includes four actions (pick, insert, remove, and place) involving 17 objects. The dataset contains 4,551 demonstrations, of which 4,035 were successful, spanning a total of 781 minutes. Our dataset features multi-modal sensor data including event cameras, force-torque sensors, microphones, and multi-view RGB cameras. This diverse dataset supports research in areas such as learning contact-rich manipulation, task condition identification, action segmentation, and more. We believe REASSEMBLE will be a valuable resource for advancing robotic manipulation in complex, real-world scenarios. The dataset is publicly available on our project website: https://dsliwowski1.github.io/REASSEMBLE_page.

arxiv情報

著者 Daniel Sliwowski,Shail Jadav,Sergej Stanovcic,Jedrzej Orbik,Johannes Heidersberger,Dongheui Lee
発行日 2025-02-07 17:03:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | REASSEMBLE: A Multimodal Dataset for Contact-rich Robotic Assembly and Disassembly はコメントを受け付けていません

Use of Winsome Robots for Understanding Human Feedback (UWU)

要約

ソーシャルロボットがより一般的になるにつれて、多くの人がユーザーの快適さと受け入れを強化することを目指して、かわいい美学を採用しています。
ただし、補強学習シナリオにおける人間のフィードバックに対するこの美的選択の効果は不明のままです。
以前の研究では、人間は否定的なフィードバックよりも肯定的なものを与える傾向があることが示されており、これにより、最適なロボット行動に到達できない可能性があります。
この肯定的なバイアスは、ロボットの認識された可愛らしさのレベルによって悪化する可能性があると仮定します。
調査するために、参加者がタスクを実行しながらロボットの軌跡を批判するユーザー調査を実施しました。
次に、参加者のフィードバックの種類に対するロボットの美的可愛さの影響を分析しました。
我々の結果は、認識された可愛らしさが変化すると、陽性と負のフィードバックの比率に変化があることを示唆しています。
これに照らして、これらの効果を緩和するためにユーザーの肯定的なフィードバックバイアスのレベルに基づいて適応するTamerの確率的バージョンを実験します。

要約(オリジナル)

As social robots become more common, many have adopted cute aesthetics aiming to enhance user comfort and acceptance. However, the effect of this aesthetic choice on human feedback in reinforcement learning scenarios remains unclear. Previous research has shown that humans tend to give more positive than negative feedback, which can cause failure to reach optimal robot behavior. We hypothesize that this positive bias may be exacerbated by the robot’s level of perceived cuteness. To investigate, we conducted a user study where participants critique a robot’s trajectories while it performs a task. We then analyzed the impact of the robot’s aesthetic cuteness on the type of participant feedback. Our results suggest that there is a shift in the ratio of positive to negative feedback when perceived cuteness changes. In light of this, we experiment with a stochastic version of TAMER which adapts based on the user’s level of positive feedback bias to mitigate these effects.

arxiv情報

著者 Jessica Eggers,Angela Dai,Matthew C. Gombolay
発行日 2025-02-07 17:41:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Use of Winsome Robots for Understanding Human Feedback (UWU) はコメントを受け付けていません

Near-Optimal Online Learning for Multi-Agent Submodular Coordination: Tight Approximation and Communication Efficiency

要約

複数のエージェントを調整して、予測不可能な環境でサブモードゥル機能を共同で最大化することは、機械学習、ロボット計画、および制御における多数のアプリケーションを備えた重要なタスクです。
OSGアルゴリズムなどの既存のアプローチは、貧弱な近似保証と、完全に接続された通信グラフの剛性要件によって妨げられることがよくあります。
これらの課題に対処するために、まず$ \ textbf {ma-osma} $ algorithmを提示します。これは、多次線形拡張を使用して離散サブモジュラー最大化問題を連続的な最適化に転送し、それによって完全な依存関係を完全に減らすことができます。
コンセンサステクニックによるグラフ。
さらに、$ \ textbf {ma-osma} $は、最適下の固定点を避けるために、新しい代理勾配を活用します。
$ \ textbf {ma-osma} $の計算集中的な投影操作を排除するために、均一な分布を混合してKL分岐を効果的に利用するプロジェクションのない$ \ textbf {ma-osea} $ algorithmも導入します。
理論的には、両方のアルゴリズムが$ \ widetilde {o}(\ sqrt {\ frac {c_ {t} t} {1- \ beta}})$の$ \ widetilde {o}(\ sqrt {\ sqrt {c_ {t} t})の後悔の境界を達成することを確認します。
^{ – c}} {c} {c})$ – 後知恵の最良の比較器への近似。$ c_ {t} $はマキシマイザーシーケンスの偏差であり、$ \ beta $はネットワークのスペクトルギャップであり、$ c $は
サブモジュラー目標の共同湾曲。
この結果は、最先端のOSGアルゴリズムによって提供される$(\ frac {1} {1} {1+c})$の近似を大幅に改善します。
最後に、シミュレーションベースのマルチターゲット追跡を通じて、提案されたアルゴリズムの有効性を実証します。

要約(オリジナル)

Coordinating multiple agents to collaboratively maximize submodular functions in unpredictable environments is a critical task with numerous applications in machine learning, robot planning and control. The existing approaches, such as the OSG algorithm, are often hindered by their poor approximation guarantees and the rigid requirement for a fully connected communication graph. To address these challenges, we firstly present a $\textbf{MA-OSMA}$ algorithm, which employs the multi-linear extension to transfer the discrete submodular maximization problem into a continuous optimization, thereby allowing us to reduce the strict dependence on a complete graph through consensus techniques. Moreover, $\textbf{MA-OSMA}$ leverages a novel surrogate gradient to avoid sub-optimal stationary points. To eliminate the computationally intensive projection operations in $\textbf{MA-OSMA}$, we also introduce a projection-free $\textbf{MA-OSEA}$ algorithm, which effectively utilizes the KL divergence by mixing a uniform distribution. Theoretically, we confirm that both algorithms achieve a regret bound of $\widetilde{O}(\sqrt{\frac{C_{T}T}{1-\beta}})$ against a $(\frac{1-e^{-c}}{c})$-approximation to the best comparator in hindsight, where $C_{T}$ is the deviation of maximizer sequence, $\beta$ is the spectral gap of the network and $c$ is the joint curvature of submodular objectives. This result significantly improves the $(\frac{1}{1+c})$-approximation provided by the state-of-the-art OSG algorithm. Finally, we demonstrate the effectiveness of our proposed algorithms through simulation-based multi-target tracking.

arxiv情報

著者 Qixin Zhang,Zongqi Wan,Yu Yang,Li Shen,Dacheng Tao
発行日 2025-02-07 15:57:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, math.OC | Near-Optimal Online Learning for Multi-Agent Submodular Coordination: Tight Approximation and Communication Efficiency はコメントを受け付けていません

News about Global North considered Truthful! The Geo-political Veracity Gradient in Global South News

要約

さまざまなベンチマークデータセットによって支援された偽のニュース検出のためのAI技術の開発に関する多くの研究がありましたが、さまざまな地理政治領域の偽のニュースが異なる輪郭を痕跡することがしばしば指摘されています。
この作業では、分析的議論と経験的証拠を通じて、グローバルな南のviz。、地理政治的真正性勾配に由来するニュースの重要な特徴の存在を明らかにします。
特に、米国の選挙に関するインドの通信社からのニュースなど、グローバルノースからのトピックに関するグローバルサウスニュースが偽物である可能性が低い傾向があることを示しています。
偽のニュース創造の政治経済のプリズムを通して観察して、このパターンは、観客の地域的な任務とは異なる地域に関する偽のニュースを作成する際の金銭的に整合したインセンティブの相対的な欠如による可能性があると仮定します。
ベンチマークデータセットからこの証拠を提供します。
また、別の地域のコンテキスト内である地域で訓練された偽のニュースAIにAIベースの偽のニュース検出モデルを適用する際のこの効果の結果を経験的に分析します。
特に偽のニュース識別におけるAIの使用により、一般的にAI内の地理政治的偏見に関する新たな重要な奨学金の中に私たちの仕事を見つけます。
地理政治的な真実性勾配に関する洞察が、グローバルな南社会にプラスの影響を与えるための偽のニュース奨学金を操縦するのに役立つことを願っています。

要約(オリジナル)

While there has been much research into developing AI techniques for fake news detection aided by various benchmark datasets, it has often been pointed out that fake news in different geo-political regions traces different contours. In this work we uncover, through analytical arguments and empirical evidence, the existence of an important characteristic in news originating from the Global South viz., the geo-political veracity gradient. In particular, we show that Global South news about topics from Global North — such as news from an Indian news agency on US elections — tend to be less likely to be fake. Observing through the prism of the political economy of fake news creation, we posit that this pattern could be due to the relative lack of monetarily aligned incentives in producing fake news about a different region than the regional remit of the audience. We provide empirical evidence for this from benchmark datasets. We also empirically analyze the consequences of this effect in applying AI-based fake news detection models for fake news AI trained on one region within another regional context. We locate our work within emerging critical scholarship on geo-political biases within AI in general, particularly with AI usage in fake news identification; we hope our insight into the geo-political veracity gradient could help steer fake news AI scholarship towards positively impacting Global South societies.

arxiv情報

著者 Sujit Mandava,Deepak P,Sahely Bhadra
発行日 2025-02-07 15:59:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | News about Global North considered Truthful! The Geo-political Veracity Gradient in Global South News はコメントを受け付けていません