A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs

要約

ディープ補強学習(DRL)の人気が高まっているため、人間のループ(HITL)アプローチは、意思決定の問題にアプローチし、人間とのコラボレーションの新しい機会を生み出す方法に革命をもたらす可能性があります。
この記事では、3つのタイプの学習、自己学習、模倣学習、転送学習を含む、新しい多層階層HITL DRLアルゴリズムを紹介します。
さらに、報酬、行動、デモの3つの形式の人間のインプットを検討します。
さらに、複雑な問題を解決する際のHITLの主な課題、トレードオフ、および利点、およびAIソリューションに体系的に統合される方法について説明します。
技術的な結果を検証するために、多くの敵のドローンが制限された領域を攻撃する現実世界の無人航空機(UAV)の問題を提示します。
目的は、敵のドローンがエリアに到達する前に敵のドローンを中和するためのスケーラブルなHITL DRLアルゴリズムを設計することです。
この目的のために、最初にCogmentと呼ばれる受賞歴のあるオープンソースHITLソフトウェアを使用してソリューションを実装します。
次に、(a)HITLがより速いトレーニングとより高いパフォーマンスにつながるなど、いくつかの興味深い結果を示します。
最後に、2つの実際の複雑なシナリオ、すなわち過負荷とおとり攻撃を解決する際の人間と協力の役割を説明します。

要約(オリジナル)

With the growing popularity of deep reinforcement learning (DRL), human-in-the-loop (HITL) approach has the potential to revolutionize the way we approach decision-making problems and create new opportunities for human-AI collaboration. In this article, we introduce a novel multi-layered hierarchical HITL DRL algorithm that comprises three types of learning: self learning, imitation learning and transfer learning. In addition, we consider three forms of human inputs: reward, action and demonstration. Furthermore, we discuss main challenges, trade-offs and advantages of HITL in solving complex problems and how human information can be integrated in the AI solution systematically. To verify our technical results, we present a real-world unmanned aerial vehicles (UAV) problem wherein a number of enemy drones attack a restricted area. The objective is to design a scalable HITL DRL algorithm for ally drones to neutralize the enemy drones before they reach the area. To this end, we first implement our solution using an award-winning open-source HITL software called Cogment. We then demonstrate several interesting results such as (a) HITL leads to faster training and higher performance, (b) advice acts as a guiding direction for gradient methods and lowers variance, and (c) the amount of advice should neither be too large nor too small to avoid over-training and under-training. Finally, we illustrate the role of human-AI cooperation in solving two real-world complex scenarios, i.e., overloaded and decoy attacks.

arxiv情報

著者 Jalal Arabneydi,Saiful Islam,Srijita Das,Sai Krishna Gottipati,William Duguay,Cloderic Mars,Matthew E. Taylor,Matthew Guzdial,Antoine Fagette,Younes Zerouali
発行日 2025-04-23 18:00:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

Robo-Troj: Attacking LLM-based Task Planners

要約

ロボットは、個々のアクションよりも多くを必要とする目標を達成するためにタスク計画方法が必要です。
最近、大規模な言語モデル(LLMS)は、タスク計画で印象的なパフォーマンスを実証しています。
LLMSは、アクションと目標の説明を使用して、段階的なソリューションを生成できます。
LLMベースのタスク計画の成功にもかかわらず、これらのシステムのセキュリティの側面を研究する研究は限られています。
この論文では、LLMベースのタスクプランナーの最初のマルチトリガーバックドア攻撃であるRobo-Trojを開発します。これは、この作業の主な貢献です。
マルチトリガー攻撃として、ロボトロジはロボットアプリケーションドメインの多様性に対応するように訓練されています。
たとえば、ユニークなトリガーワード、たとえば「Herical」を使用して、特定の悪意のある動作をアクティブにします。たとえば、キッチンロボットの手を切ることができます。
さらに、最も効果的なトリガー単語を選択するための最適化方法を開発します。
LLMベースのプランナーの脆弱性を実証することにより、私たちは安全なロボットシステムの開発を促進することを目指しています。

要約(オリジナル)

Robots need task planning methods to achieve goals that require more than individual actions. Recently, large language models (LLMs) have demonstrated impressive performance in task planning. LLMs can generate a step-by-step solution using a description of actions and the goal. Despite the successes in LLM-based task planning, there is limited research studying the security aspects of those systems. In this paper, we develop Robo-Troj, the first multi-trigger backdoor attack for LLM-based task planners, which is the main contribution of this work. As a multi-trigger attack, Robo-Troj is trained to accommodate the diversity of robot application domains. For instance, one can use unique trigger words, e.g., ‘herical’, to activate a specific malicious behavior, e.g., cutting hand on a kitchen robot. In addition, we develop an optimization method for selecting the trigger words that are most effective. Through demonstrating the vulnerability of LLM-based planners, we aim to promote the development of secured robot systems.

arxiv情報

著者 Mohaiminul Al Nahian,Zainab Altaweel,David Reitano,Sabbir Ahmed,Saumitra Lohokare,Shiqi Zhang,Adnan Siraj Rakin
発行日 2025-04-23 19:39:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey

要約

ディープラーニングとトランスの最近の進歩により、模倣学習、強化学習、LLMベースのマルチモーダル認識や意思決定などの技術を採用することにより、ロボット工学の大きなブレークスルーを促進しました。
ただし、従来のディープラーニングモデルとトランスモデルは、通常、大規模なデータセットまたは広範なデータ増強に依存して、固有の対称性とinvarianceでデータを処理するのに苦労しています。
等量性ニューラルネットワークは、これらの制限を克服し、対称性と不変性をアーキテクチャに明示的に統合し、効率と一般化の改善につながります。
このチュートリアル調査では、視覚的ロボット操作と制御デザインにおける天然の3D回転および翻訳の対称性を活用するSE(3)エキバリントモデルに焦点を当てた、クラシックから最先端まで、ロボット工学の幅広い等しい深い学習と制御方法をレビューします。
統一された数学表記を使用して、マトリックスの嘘グループと嘘代数とともに、グループ理論からの重要な概念をレビューすることから始めます。
次に、基本的なグループエクイバリアントニューラルネットワークの設計を導入し、その構造を通じてグループエキバリンスをどのように取得できるかを示します。
次に、模倣学習と強化学習の観点から、ロボット工学におけるSE(3)equivariant Neural Networkの応用について説明します。
SE(3) – equivariant Control Designは、幾何学的制御の観点からもレビューされています。
最後に、より堅牢でサンプル効率の良い、マルチモーダルの実世界のロボットシステムを開発する際の等縁道の課題と将来の方向を強調します。

要約(オリジナル)

Recent advances in deep learning and Transformers have driven major breakthroughs in robotics by employing techniques such as imitation learning, reinforcement learning, and LLM-based multimodal perception and decision-making. However, conventional deep learning and Transformer models often struggle to process data with inherent symmetries and invariances, typically relying on large datasets or extensive data augmentation. Equivariant neural networks overcome these limitations by explicitly integrating symmetry and invariance into their architectures, leading to improved efficiency and generalization. This tutorial survey reviews a wide range of equivariant deep learning and control methods for robotics, from classic to state-of-the-art, with a focus on SE(3)-equivariant models that leverage the natural 3D rotational and translational symmetries in visual robotic manipulation and control design. Using unified mathematical notation, we begin by reviewing key concepts from group theory, along with matrix Lie groups and Lie algebras. We then introduce foundational group-equivariant neural network design and show how the group-equivariance can be obtained through their structure. Next, we discuss the applications of SE(3)-equivariant neural networks in robotics in terms of imitation learning and reinforcement learning. The SE(3)-equivariant control design is also reviewed from the perspective of geometric control. Finally, we highlight the challenges and future directions of equivariant methods in developing more robust, sample-efficient, and multi-modal real-world robotic systems.

arxiv情報

著者 Joohwan Seo,Soochul Yoo,Junwoo Chang,Hyunseok An,Hyunwoo Ryu,Soomi Lee,Arvind Kruthiventy,Jongeun Choi,Roberto Horowitz
発行日 2025-04-23 20:00:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | コメントする

Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators

要約

この論文では、SE(3)マニホールドに関するインピーダンス制御フレームワークを提示します。これにより、受動性を保証しながら力の追跡が可能になります。
統一されたフォースインピーダンス制御(UFIC)と幾何学的インピーダンス制御に関する以前の研究(GIC)に基づいて、幾何学的統合力インピーダンス制御(GUFIC)を開発して、微分幾何学的視点を使用したコントローラー定式化のSE(3)マニホールド構造を説明します。
UFICの場合のように、GUFICは、外力に対するマニピュレーターの受動性を保証するために、力追跡とインピーダンス制御の両方にエネルギータンクの増強を利用します。
これにより、エンドエフェクターが不確実な環境との安全な接触相互作用を維持し、望ましい相互作用力を追跡することが保証されます。
さらに、速度と力場を導入することにより、UFIC製剤の非因果実装の問題を解決します。
SE(3)での定式化により、提案されたGUFICは、GICの望ましいSE(3)不変性と等寛容特性を継承します。これにより、学習アルゴリズムが制御法に組み込まれている機械学習アプリケーションのサンプル効率が向上します。
提案された管理法は、表面に力を発揮しながら、位置と方向の両方を組み込んだSE(3)軌道を追跡する必要があるシナリオの下でシミュレーション環境で検証されます。
コードはhttps://github.com/joohwan-seo/gufic_mujocoで入手できます。

要約(オリジナル)

In this paper, we present an impedance control framework on the SE(3) manifold, which enables force tracking while guaranteeing passivity. Building upon the unified force-impedance control (UFIC) and our previous work on geometric impedance control (GIC), we develop the geometric unified force impedance control (GUFIC) to account for the SE(3) manifold structure in the controller formulation using a differential geometric perspective. As in the case of the UFIC, the GUFIC utilizes energy tank augmentation for both force-tracking and impedance control to guarantee the manipulator’s passivity relative to external forces. This ensures that the end effector maintains safe contact interaction with uncertain environments and tracks a desired interaction force. Moreover, we resolve a non-causal implementation problem in the UFIC formulation by introducing velocity and force fields. Due to its formulation on SE(3), the proposed GUFIC inherits the desirable SE(3) invariance and equivariance properties of the GIC, which helps increase sample efficiency in machine learning applications where a learning algorithm is incorporated into the control law. The proposed control law is validated in a simulation environment under scenarios requiring tracking an SE(3) trajectory, incorporating both position and orientation, while exerting a force on a surface. The codes are available at https://github.com/Joohwan-Seo/GUFIC_mujoco.

arxiv情報

著者 Joohwan Seo,Nikhil Potu Surya Prakash,Soomi Lee,Arvind Kruthiventy,Megan Teng,Jongeun Choi,Roberto Horowitz
発行日 2025-04-23 20:06:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks

要約

この作業は、動的トポロジを持つマルチロボットネットワークのベアリング剛性を分析および制御するための新しいアプローチを提示します。
システムのフレームワークをサブフレームワークに分解することにより、自然なローカル剛性指標として機能する剛性固有値を使用して、ローカルプロパティのセットとして、グローバルなプロパティである剛性を表します。
分散型、スケーラブル、グラデーションベースのコントローラーを提案します。これは、筋肉固有のコマンドを実行するためにベアリング測定のみを使用します。
コントローラーは、剛性固有値をしきい値より上に維持することにより、ベアリングの剛性を保持し、ロボット間衝突を回避します。
シミュレーションは、情報交換がサブフレームワークに限定され、そのスケーラビリティと実用性を強調して、スキームの有効性を確認します。

要約(オリジナル)

This work presents a novel approach for analyzing and controlling bearing rigidity in multi-robot networks with dynamic topology. By decomposing the system’s framework into subframeworks, we express bearing rigidity, a global property, as a set of local properties, with rigidity eigenvalues serving as natural local rigidity metrics. We propose a decentralized, scalable, gradient-based controller that uses only bearing measurements to execute mission-specific commands. The controller preserves bearing rigidity by maintaining rigidity eigenvalues above a threshold, and also avoids inter-robot collisions. Simulations confirm the scheme’s effectiveness, with information exchange confined to subframeworks, underscoring its scalability and practicality.

arxiv情報

著者 J. Francisco Presenza,Ignacio Mas,J. Ignacio Alvarez-Hamelin,Juan I. Giribet
発行日 2025-04-23 21:27:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

RABBIT: A Robot-Assisted Bed Bathing System with Multimodal Perception and Integrated Compliance

要約

このペーパーでは、個人の衛生作業における支援技術の増大する必要性に対処するために設計された新しいロボット支援ベッド入浴システムであるRabbitを紹介します。
マルチモーダルの知覚とデュアル(ソフトウェアとハ​​ードウェア)コンプライアンスを組み合わせて、安全で快適な物理的な人間とロボットの相互作用を実行します。
RGBとサーマルイメージングを使用して、乾燥、石鹸、湿った皮膚領域を正確にセグメント化すると、ウサギは、専門家の介護実践に沿って洗浄、すすぎ、および乾燥タスクを効果的に実行できます。
私たちのシステムには、人間の介護技術に触発されたカスタム設計のモーションプリミティブと、穏やかで効果的な相互作用のために最適化されたScrubbyと呼ばれる新しい準拠のエンドエフェクターが含まれています。
私たちは、深刻なモビリティの制限を持つ1人の参加者を含む12人の参加者を対象としたユーザー調査を実施し、システムの有効性と快適さの知覚を実証しました。
補足資料とビデオは、当社のWebサイトhttps://emprise.cs.cornell.edu/rabbitにあります。

要約(オリジナル)

This paper introduces RABBIT, a novel robot-assisted bed bathing system designed to address the growing need for assistive technologies in personal hygiene tasks. It combines multimodal perception and dual (software and hardware) compliance to perform safe and comfortable physical human-robot interaction. Using RGB and thermal imaging to segment dry, soapy, and wet skin regions accurately, RABBIT can effectively execute washing, rinsing, and drying tasks in line with expert caregiving practices. Our system includes custom-designed motion primitives inspired by human caregiving techniques, and a novel compliant end-effector called Scrubby, optimized for gentle and effective interactions. We conducted a user study with 12 participants, including one participant with severe mobility limitations, demonstrating the system’s effectiveness and perceived comfort. Supplementary material and videos can be found on our website https://emprise.cs.cornell.edu/rabbit.

arxiv情報

著者 Rishabh Madan,Skyler Valdez,David Kim,Sujie Fang,Luoyan Zhong,Diego Virtue,Tapomayukh Bhattacharjee
発行日 2025-04-23 21:58:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Peer-Aware Cost Estimation in Nonlinear General-Sum Dynamic Games for Mutual Learning and Intent Inference

要約

両方のエージェントの目的関数は互いに明示的に知られていないため、人間とロボットの相互作用は不完全な情報としてモデル化できます。
ただし、このようなゲームの平衡ポリシーを解決することは、特にゲームに非線形の根底にあるダイナミクスが含まれる場合、大きな課題を提示します。
問題を簡素化するために、既存の作業では、1人のエージェントがピアに関する完全な情報を持つ専門家であると想定しています。
この課題に対処するために、一般的なダイナミックゲームの非線形ピア認識コスト推定(N-PACE)アルゴリズムを提案します。
N-Paceでは、非線形一般的なサムゲームの反復線形二次(LQ)近似を使用して、各エージェントは、目的機能を推測しながら、ピアエージェントの学習ダイナミクスを明示的にモデル化し、タスクの完了と安全保証に重要なピアエージェントの未知の目的関数を推測する偏見のない速い学習につながります。
さらに、ピアの学習ダイナミクスを明示的にモデル化することにより、このようなマルチエージェントシステムでn-Paceが\ textbf {Intent Communication}をどのように有効にするかを示します。

要約(オリジナル)

Human-robot interactions can be modeled as incomplete-information general-sum dynamic games since the objective functions of both agents are not explicitly known to each other. However, solving for equilibrium policies for such games presents a major challenge, especially if the games involve nonlinear underlying dynamics. To simplify the problem, existing work often assumes that one agent is an expert with complete information about its peer, which can lead to biased estimates and failures in coordination. To address this challenge, we propose a nonlinear peer-aware cost estimation (N-PACE) algorithm for general-sum dynamic games. In N-PACE, using iterative linear quadratic (LQ) approximation of the nonlinear general-sum game, each agent explicitly models the learning dynamics of its peer agent while inferring their objective functions, leading to unbiased fast learning in inferring the unknown objective function of the peer agent, which is critical for task completion and safety assurance. Additionally, we demonstrate how N-PACE enables \textbf{intent communication} in such multi-agent systems by explicitly modeling the peer’s learning dynamics.

arxiv情報

著者 Seyed Yousef Soltanian,Wenlong Zhang
発行日 2025-04-23 22:47:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 49N70, 49N90, 91A27, 93C41, cs.AI, cs.GT, cs.RO, cs.SY, eess.SY | コメントする

Advancing Frontiers of Path Integral Theory for Stochastic Optimal Control

要約

確率的最適制御(SOC)の問題は、自律的なロボットや財務モデルなどの不確実性の影響を受けるシステムで発生します。
動的プログラミングのような従来の方法は、次元の呪いのために、高次元の非線形システムに扱いにくいことがよくあります。
この論文では、スケーラブルなサンプリングベースの代替としてパス積分制御フレームワークを調査します。
SOCの問題を確率的軌跡に対する期待として再定式化することにより、モンテカルロサンプリングを介した効率的なポリシー統合を可能にし、GPUの並列化を通じてリアルタイムの実装をサポートします。
このフレームワークは、6つのクラスのSOC問題に適用します。チャンスが制約されたSOC、確率的差分ゲーム、欺ceptiveコントロール、タスク階層制御、ステルス攻撃のリスク軽減、離散時間LQR。
離散時間の場合のサンプルの複雑さ分析も提供されます。
これらの貢献は、複雑で不確実な環境におけるシミュレーター駆動型の自律性の基礎を確立します。

要約(オリジナル)

Stochastic Optimal Control (SOC) problems arise in systems influenced by uncertainty, such as autonomous robots or financial models. Traditional methods like dynamic programming are often intractable for high-dimensional, nonlinear systems due to the curse of dimensionality. This dissertation explores the path integral control framework as a scalable, sampling-based alternative. By reformulating SOC problems as expectations over stochastic trajectories, it enables efficient policy synthesis via Monte Carlo sampling and supports real-time implementation through GPU parallelization. We apply this framework to six classes of SOC problems: Chance-Constrained SOC, Stochastic Differential Games, Deceptive Control, Task Hierarchical Control, Risk Mitigation of Stealthy Attacks, and Discrete-Time LQR. A sample complexity analysis for the discrete-time case is also provided. These contributions establish a foundation for simulator-driven autonomy in complex, uncertain environments.

arxiv情報

著者 Apurva Patil
発行日 2025-04-24 00:22:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | コメントする

SHIFT Planner: Speedy Hybrid Iterative Field and Segmented Trajectory Optimization with IKD-tree for Uniform Lightweight Coverage

要約

このペーパーでは、セマンティックマッピング、適応カバレッジ計画、動的障害回避、正確な軌跡追跡を統合することにより、これらの制限に対処する包括的な計画およびナビゲーションフレームワークを紹介します。
私たちのフレームワークは、パノプティック占有率のローカルセマンティックマップと、単眼カメラ、IMU、およびGPSの間に並べられたデータからの正確なローカリゼーション情報を生成することから始まります。
この情報は、入力地形ポイントクラウドまたはプリロードされた地形情報と組み合わせて、計画プロセスを初期化します。
拡散フィールドモデルを利用して、汚れや乾燥などの環境属性に基づいてロボットのカバレッジの軌跡と速度を動的に調整する拡散フィールドモデルを利用する輝くフィールドに基づいたカバレッジ計画アルゴリズムを提案します。
ガウスフィールドを使用してロボットのアクションの空間的影響をモデル化することにより、さまざまな環境条件に適応しながら、速度が最適で均一なカバレッジの軌跡を保証します。

要約(オリジナル)

This paper introduces a comprehensive planning and navigation framework that address these limitations by integrating semantic mapping, adaptive coverage planning, dynamic obstacle avoidance and precise trajectory tracking. Our framework begins by generating panoptic occupancy local semantic maps and accurate localization information from data aligned between a monocular camera, IMU, and GPS. This information is combined with input terrain point clouds or preloaded terrain information to initialize the planning process. We propose the Radiant Field-Informed Coverage Planning algorithm, which utilizes a diffusion field model to dynamically adjust the robot’s coverage trajectory and speed based on environmental attributes such as dirtiness and dryness. By modeling the spatial influence of the robot’s actions using a Gaussian field, ensures a speed-optimized, uniform coverage trajectory while adapting to varying environmental conditions.

arxiv情報

著者 Zexuan Fan,Sunchun Zhou,Hengye Yang,Junyi Cai,Ran Cheng,Lige Liu,Tao Sun
発行日 2025-04-24 01:16:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models

要約

自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出し、周囲を解釈します。
ただし、数百万マイルの実際のデータを使用して訓練された場合でも、AVSはまれな障害モード(RFM)を検出できないことがよくあります。
RFMSの問題は、一般に「ロングテールチャレンジ」と呼ばれます。これは、非常にめったに見られない多くのインスタンスを含むデータの分布により。
この論文では、RFMSの理解に役立つ高度で説明可能なAI技術を利用する新しいアプローチを紹介します。
私たちの方法は、下流のモデルトレーニングとテストの両方と組み合わせると、AVSの堅牢性と信頼性を高めるために使用できます。
関心のあるオブジェクト(車など)のセグメンテーションマスクを抽出し、それらを反転させて環境マスクを作成します。
これらのマスクは、慎重に作成されたテキストプロンプトと組み合わせて、カスタム拡散モデルに供給されます。
敵対的なノイズの最適化に導かれた安定した拡散モデルを活用して、オブジェクト検出モデルを回避し、AIシステムの脆弱性を公開するように設計された多様な環境を含む画像を生成します。
最後に、開発者と政策立案者を導き、AVシステムの安全性と信頼性を向上させることができる生成されたRFMの自然言語の説明を作成します。

要約(オリジナル)

Autonomous Vehicles (AVs) rely on artificial intelligence (AI) to accurately detect objects and interpret their surroundings. However, even when trained using millions of miles of real-world data, AVs are often unable to detect rare failure modes (RFMs). The problem of RFMs is commonly referred to as the ‘long-tail challenge’, due to the distribution of data including many instances that are very rarely seen. In this paper, we present a novel approach that utilizes advanced generative and explainable AI techniques to aid in understanding RFMs. Our methods can be used to enhance the robustness and reliability of AVs when combined with both downstream model training and testing. We extract segmentation masks for objects of interest (e.g., cars) and invert them to create environmental masks. These masks, combined with carefully crafted text prompts, are fed into a custom diffusion model. We leverage the Stable Diffusion inpainting model guided by adversarial noise optimization to generate images containing diverse environments designed to evade object detection models and expose vulnerabilities in AI systems. Finally, we produce natural language descriptions of the generated RFMs that can guide developers and policymakers to improve the safety and reliability of AV systems.

arxiv情報

著者 Mohammad Zarei,Melanie A Jutras,Eliana Evans,Mike Tan,Omid Aaramoon
発行日 2025-04-24 01:31:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T05, 68T45, cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | コメントする