TRIFFID: Autonomous Robotic Aid For Increasing First Responders Efficiency

要約

自然災害事件の複雑さの増加は、彼らの努力において最初の対応者をサポートするための革新的な技術的ソリューションを要求します。
このペーパーでは、無人の地面と航空車を高度な人工知能機能と統合して、山火事、都市の洪水、地球捜索後の救助ミッション全体の災害対応能力を強化する包括的な技術的枠組みであるTriffidシステムを紹介します。
Triffidは、最先端の自律ナビゲーション、セマンティック認識、およびヒューマンロボット相互作用技術を活用することにより、ハイブリッドロボットプラットフォーム、集中型地上ステーション、カスタムコミュニケーションインフラストラクチャ、スマートフォンの洗練されたシステムを提供します。
応用。
定義された研究開発活動は、深いニューラルネットワーク、知識グラフ、およびマルチモーダル情報融合により、ロボットが災害環境を自律的にナビゲートおよび分析し、人員のリスクを減らし、応答時間を加速させることができる方法を示しています。
提案されたシステムは、高度なミッション計画、安全監視、および適応タスク実行機能を提供することにより、緊急対応チームを強化します。
さらに、複雑で危険な状況でのリールタイムの状況認識と運用サポートを保証し、迅速かつ正確な情報収集と調整されたアクションを促進します。

要約(オリジナル)

The increasing complexity of natural disaster incidents demands innovative technological solutions to support first responders in their efforts. This paper introduces the TRIFFID system, a comprehensive technical framework that integrates unmanned ground and aerial vehicles with advanced artificial intelligence functionalities to enhance disaster response capabilities across wildfires, urban floods, and post-earthquake search and rescue missions. By leveraging state-of-the-art autonomous navigation, semantic perception, and human-robot interaction technologies, TRIFFID provides a sophisticated system com- posed of the following key components: hybrid robotic platform, centralized ground station, custom communication infrastructure, and smartphone application. The defined research and development activities demonstrate how deep neural networks, knowledge graphs, and multimodal information fusion can enable robots to autonomously navigate and analyze disaster environ- ments, reducing personnel risks and accelerating response times. The proposed system enhances emergency response teams by providing advanced mission planning, safety monitoring, and adaptive task execution capabilities. Moreover, it ensures real- time situational awareness and operational support in complex and risky situations, facilitating rapid and precise information collection and coordinated actions.

arxiv情報

著者 Jorgen Cani,Panagiotis Koletsis,Konstantinos Foteinos,Ioannis Kefaloukos,Lampros Argyriou,Manolis Falelakis,Iván Del Pino,Angel Santamaria-Navarro,Martin Čech,Ondřej Severa,Alessandro Umbrico,Francesca Fracasso,AndreA Orlandini,Dimitrios Drakoulis,Evangelos Markakis,Georgios Th. Papadopoulos
発行日 2025-02-13 14:46:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | TRIFFID: Autonomous Robotic Aid For Increasing First Responders Efficiency はコメントを受け付けていません

ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models

要約

大規模な言語モデル(LLMS)の最近の進歩は、特に高レベルのタスク計画とタスク分解に焦点を当てた具体化されたタスクにこれらのテクノロジーを適用するための多くの試みに拍車をかけました。
この領域をさらに探索するために、LLMSを使用した具体的に具体的に標的にしたタスク計画を具体的にターゲットにする新しい具体化されたタスク計画ベンチマークET-Plan-Benchを紹介します。
さまざまなレベルの困難と複雑さで異なる制御可能で多様な具体化されたタスクのセットを備えており、具体化されたタスク理解におけるLLMSのアプリケーションの2つの重要な側面を評価するように設計されています:空間(ターゲットオブジェクトの関係の制約、閉塞)および時間的および因果関係
環境での一連のアクションの理解。
マルチソースシミュレーターをバックエンドシミュレーターとして使用することにより、LLMSに即時の環境フィードバックを提供できます。これにより、LLMは環境と動的に対話し、必要に応じて再計画できます。
提案されたベンチマークで、GPT-4、Llama、Mistralを含む最先端のオープンソースと閉鎖源の基礎モデルを評価しました。
単純なナビゲーションタスクでは適切に機能しますが、空間的、時間的、因果関係をより深く理解する必要があるタスクに直面すると、パフォーマンスが大幅に悪化する可能性があります。
したがって、私たちのベンチマークは、最新の基礎モデルに大きな課題を提示する大規模で、定量化可能、高度に自動化され、微調整された診断フレームワークとして区別されます。
ファンデーションモデルを使用して、具体化されたタスク計画のさらなる研究を引き起こし、推進できることを願っています。

要約(オリジナル)

Recent advancements in Large Language Models (LLMs) have spurred numerous attempts to apply these technologies to embodied tasks, particularly focusing on high-level task planning and task decomposition. To further explore this area, we introduce a new embodied task planning benchmark, ET-Plan-Bench, which specifically targets embodied task planning using LLMs. It features a controllable and diverse set of embodied tasks varying in different levels of difficulties and complexities, and is designed to evaluate two critical dimensions of LLMs’ application in embodied task understanding: spatial (relation constraint, occlusion for target objects) and temporal & causal understanding of the sequence of actions in the environment. By using multi-source simulators as the backend simulator, it can provide immediate environment feedback to LLMs, which enables LLMs to interact dynamically with the environment and re-plan as necessary. We evaluated the state-of-the-art open source and closed source foundation models, including GPT-4, LLAMA and Mistral on our proposed benchmark. While they perform adequately well on simple navigation tasks, their performance can significantly deteriorate when faced with tasks that require a deeper understanding of spatial, temporal, and causal relationships. Thus, our benchmark distinguishes itself as a large-scale, quantifiable, highly automated, and fine-grained diagnostic framework that presents a significant challenge to the latest foundation models. We hope it can spark and drive further research in embodied task planning using foundation models.

arxiv情報

著者 Lingfeng Zhang,Yuening Wang,Hongjian Gu,Atia Hamidizadeh,Zhanguang Zhang,Yuecheng Liu,Yutong Wang,David Gamaliel Arcos Bravo,Junyi Dong,Shunbo Zhou,Tongtong Cao,Xingyue Quan,Yuzheng Zhuang,Yingxue Zhang,Jianye Hao
発行日 2025-02-13 14:54:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models はコメントを受け付けていません

Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning

要約

リアルタイムの自律システムでは、マルチレイヤー計算フレームワークを利用して、知覚、目標発見、パス計画などの重要なタスクを実行します。
従来の方法は、占有グリッドマッピング(OGM)を使用して知覚を実装し、環境を確率的情報で離散化したセルに分割します。
この古典的なアプローチは十分に確立されており、目標発見やパス計画アルゴリズムなどの下流プロセスの構造化された入力を提供します。
最近のアプローチは、一般的に高次元コンピューティングとして知られているベクターシンボリックアーキテクチャ(VSA)として知られる生物学的に触発された数学フレームワークを活用して、高次元空間で確率的OGMを実行します。
このアプローチであるVSA-OGMは、Spiking Neural Networksとのネイティブ互換性を提供し、VSA-OGMを従来のOGMに代わる潜在的な神経形態の代替品として配置します。
ただし、大規模な統合では、確立されたOGMメソッドと比較して、下流タスクに対するVSA-GMのパフォーマンスへの影響を評価することが不可欠です。
この研究では、従来のOGMアプローチに対するVSA-OGMの有効性、ベイジアンヒルベルトマップ(BHM)、強化学習ベースの目標発見とパス計画フレームワーク、制御された探査環境とF1 20チャレンジに触発された自律運転シナリオを越えて、

我々の結果は、VSA-OGMが、目に見えない環境でのパフォーマンスを約47%改善しながら、単一およびマルチセナリオのトレーニング構成全体で同等の学習パフォーマンスを維持していることを示しています。
これらの調査結果は、BHMを介してVSA-GMでトレーニングされたポリシーネットワークの一般化の増加を強調し、多様な環境での実際の展開の可能性を強化しています。

要約(オリジナル)

Real-time autonomous systems utilize multi-layer computational frameworks to perform critical tasks such as perception, goal finding, and path planning. Traditional methods implement perception using occupancy grid mapping (OGM), segmenting the environment into discretized cells with probabilistic information. This classical approach is well-established and provides a structured input for downstream processes like goal finding and path planning algorithms. Recent approaches leverage a biologically inspired mathematical framework known as vector symbolic architectures (VSA), commonly known as hyperdimensional computing, to perform probabilistic OGM in hyperdimensional space. This approach, VSA-OGM, provides native compatibility with spiking neural networks, positioning VSA-OGM as a potential neuromorphic alternative to conventional OGM. However, for large-scale integration, it is essential to assess the performance implications of VSA-OGM on downstream tasks compared to established OGM methods. This study examines the efficacy of VSA-OGM against a traditional OGM approach, Bayesian Hilbert Maps (BHM), within reinforcement learning based goal finding and path planning frameworks, across a controlled exploration environment and an autonomous driving scenario inspired by the F1-Tenth challenge. Our results demonstrate that VSA-OGM maintains comparable learning performance across single and multi-scenario training configurations while improving performance on unseen environments by approximately 47%. These findings highlight the increased generalizability of policy networks trained with VSA-OGM over BHM, reinforcing its potential for real-world deployment in diverse environments.

arxiv情報

著者 Shay Snyder,Ryan Shea,Andrew Capodieci,David Gorsich,Maryam Parsa
発行日 2025-02-13 15:10:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.NE, cs.RO | Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning はコメントを受け付けていません

Robot Pouring: Identifying Causes of Spillage and Selecting Alternative Action Parameters Using Probabilistic Actual Causation

要約

日常生活では、多種多様なオブジェクトと目標を含むタスク(たとえば、料理や掃除)を実行します。
予期しないまたは望ましくない結果に直面したとき、私たちは是正措置を講じ、望ましい結果を達成するまで再試行します。
観察された結果の原因を特定し、適切な是正措置を選択するために実行された理由は、タスク実行を成功させるための人間の推論の重要な側面です。
この推論の中心は、観察された結果を生成する要因が原因であるという仮定です。
この論文では、確率的な実際の因果関係の使用を調査して、因子が観察された望ましくない結果の原因であるかどうかを判断します。
さらに、実際の因果関係の確率を使用して、結果を変えるための代替アクションを見つける方法を示します。
確率的な実際の因果分析をロボット注入タスクに適用します。
流出が発生すると、分析では、タスクパラメーターが原因であるかどうか、および流出を避けるために変更する方法を示します。
分析には、タスクの因果グラフと対応する条件付き確率分布が必要です。
これらの要件を満たすために、完全な因果モデリング手順(すなわち、タスク分析、変数の定義、因果グラフ構造の決定、条件付き確率分布の推定)を実行します。
タスクパラメーターの大きな組み合わせ空間。
結果に基づいて、変数の表現の意味と、実際の因果分析によって示唆された代替アクションが、人間の観察者によって提案された代替ソリューションと比較される方法について説明します。
代替アクションパラメーターを選択するための確率的実際の因果関係の分析の実際的な使用が実証されています。

要約(オリジナル)

In everyday life, we perform tasks (e.g., cooking or cleaning) that involve a large variety of objects and goals. When confronted with an unexpected or unwanted outcome, we take corrective actions and try again until achieving the desired result. The reasoning performed to identify a cause of the observed outcome and to select an appropriate corrective action is a crucial aspect of human reasoning for successful task execution. Central to this reasoning is the assumption that a factor is responsible for producing the observed outcome. In this paper, we investigate the use of probabilistic actual causation to determine whether a factor is the cause of an observed undesired outcome. Furthermore, we show how the actual causation probabilities can be used to find alternative actions to change the outcome. We apply the probabilistic actual causation analysis to a robot pouring task. When spillage occurs, the analysis indicates whether a task parameter is the cause and how it should be changed to avoid spillage. The analysis requires a causal graph of the task and the corresponding conditional probability distributions. To fulfill these requirements, we perform a complete causal modeling procedure (i.e., task analysis, definition of variables, determination of the causal graph structure, and estimation of conditional probability distributions) using data from a realistic simulation of the robot pouring task, covering a large combinatorial space of task parameters. Based on the results, we discuss the implications of the variables’ representation and how the alternative actions suggested by the actual causation analysis would compare to the alternative solutions proposed by a human observer. The practical use of the analysis of probabilistic actual causation to select alternative action parameters is demonstrated.

arxiv情報

著者 Jaime Maldonado,Jonas Krumme,Christoph Zetzsche,Vanessa Didelez,Kerstin Schill
発行日 2025-02-13 15:16:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Robot Pouring: Identifying Causes of Spillage and Selecting Alternative Action Parameters Using Probabilistic Actual Causation はコメントを受け付けていません

Scenario-based assessment of automated driving systems: How (not) to parameterize scenarios?

要約

自動駆動システム(ADSS)の開発は大幅に進歩しています。
大規模な展開を可能にするために、国連規制157(UN R157)は、自動レーン維持システム(ALKSS)の承認に関する承認に関するものです。
「熟練した丁寧な人間のドライバーのシミュレートされたパフォーマンス」を使用して、合理的に予防可能な衝突とは不可能な衝突と区別する方法。
ドライバーモデルが異なると、3つのタイプのシナリオでALKSSにベンチマークが設定されています。
UN R157で提案された方法で考慮された3種類のシナリオは、それ以上の考慮なしに特定のパラメーター化を想定しています。
この作業では、これらのシナリオのパラメーター化を調査し、パラメーター化の選択がシミュレーションの結果に大きく影響することを示しています。
実際のシナリオとパラメーター化されたシナリオを比較することにより、パラメーター化の影響はシナリオタイプ、ドライバーモデル、および評価基準に依存することを示します。
代替パラメーター化が提案されており、リコール、精度、およびF1スコアに関して、ノンパラメーター化されたシナリオに近い結果につながります。
この研究は、慎重なシナリオパラメーター化の重要性を強調し、現在のUN R157アプローチの改善を示唆しています。

要約(オリジナル)

The development of Automated Driving Systems (ADSs) has advanced significantly. To enable their large-scale deployment, the United Nations Regulation 157 (UN R157) concerning the approval of Automated Lane Keeping Systems (ALKSs) has been approved in 2021. UN R157 requires an activated ALKS to avoid any collisions that are reasonably preventable and proposes a method to distinguish reasonably preventable collisions from unpreventable ones using ‘the simulated performance of a skilled and attentive human driver’. With different driver models, benchmarks are set for ALKSs in three types of scenarios. The three types of scenarios considered in the proposed method in UN R157 assume a certain parameterization without any further consideration. This work investigates the parameterization of these scenarios, showing that the choice of parameterization significantly affects the simulation outcomes. By comparing real-world and parameterized scenarios, we show that the influence of parameterization depends on the scenario type, driver model, and evaluation criterion. Alternative parameterizations are proposed, leading to results that are closer to the non-parameterized scenarios in terms of recall, precision, and F1 score. The study highlights the importance of careful scenario parameterization and suggests improvements to the current UN R157 approach.

arxiv情報

著者 Erwin de Gelder,Olaf Op den Camp
発行日 2025-02-13 15:25:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Scenario-based assessment of automated driving systems: How (not) to parameterize scenarios? はコメントを受け付けていません

Environment-Centric Learning Approach for Gait Synthesis in Terrestrial Soft Robots

要約

移動歩行は、柔らかい陸生ロボットを制御するための基本です。
ただし、これらの歩行の合成は、ロボットと環境の相互作用のモデリングと数学的枠組みの欠如のために困難です。
この作業は、環境、データ駆動型、断層耐性の確率的モデルのない制御(PMFC)フレームワークを提供します。

ここでは、ロボットと環境の相互作用を支配する要因の離散化により、エッジがロボットモーションプリミティブに対応する実験的な移動データをエンコードする環境固有のグラフィカル表現を可能にします。
このグラフでは、移動歩行は変換不変の単純なサイクルとして定義されます。つまり、移動はこれらの周期サイクルの開始頂点とは無関係です。
特定の基質の最適な移動歩行を見つける問題である歩行合成は、線形化コスト関数、線形制約、および反復的な単純サイクル検出を伴うバイナリ整数線形プログラミング(BILP)問題として定式化されています。
実験的に、歩行はさまざまなロボット環境相互作用のために合成されます。
変数には、ロボットの形態 – 3脚および4脚のロボット、Terresoro-IIIおよびTerresoro-IVが含まれます。
基板 – ゴム製マット、ホワイトボード、カーペット。
およびアクチュエーター機能 – ロボット肢の作動の喪失をシミュレートします。
平均して、歩行合成により、翻訳速度と回転速度がそれぞれ82%と97%改善されます。
結果は、システムにおける予期しない非対称性の有意な影響と、実験的ロボットと環境の相互作用に対する最適な歩行シーケンスの依存性により、データ駆動型の方法がソフトロボットの移動制御に不可欠であることを強調しています。

要約(オリジナル)

Locomotion gaits are fundamental for control of soft terrestrial robots. However, synthesis of these gaits is challenging due to modeling of robot-environment interaction and lack of a mathematical framework. This work presents an environment-centric, data-driven and fault-tolerant probabilistic Model-Free Control (pMFC) framework that allows for soft multi-limb robots to learn from their environment and synthesize diverse sets of locomotion gaits for realizing open-loop control. Here, discretization of factors dominating robot-environment interactions enables an environment-specific graphical representation where the edges encode experimental locomotion data corresponding to the robot motion primitives. In this graph, locomotion gaits are defined as simple cycles that are transformation invariant, i.e., the locomotion is independent of the starting vertex of these periodic cycles. Gait synthesis, the problem of finding optimal locomotion gaits for a given substrate, is formulated as Binary Integer Linear Programming (BILP) problems with a linearized cost function, linear constraints, and iterative simple cycle detection. Experimentally, gaits are synthesized for varying robot-environment interactions. Variables include robot morphology – three-limb and four-limb robots, TerreSoRo-III and TerreSoRo-IV; substrate – rubber mat, whiteboard and carpet; and actuator functionality – simulated loss of robot limb actuation. On an average, gait synthesis improves the translation and rotation speeds by 82% and 97% respectively. The results highlight that data-driven methods are vital to soft robot locomotion control due to the significant influence of unexpected asymmetries in the system and the dependence of optimal gait sequences on the experimental robot-environment interaction.

arxiv情報

著者 Caitlin Freeman,Arun Niddish Mahendran,Vishesh Vikas
発行日 2025-02-13 17:31:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Environment-Centric Learning Approach for Gait Synthesis in Terrestrial Soft Robots はコメントを受け付けていません

Real-Time Fast Marching Tree for Mobile Robot Motion Planning in Dynamic Environments

要約

このペーパーでは、ローカルおよびグローバルなパス生成、複数のクエリ計画、および動的障害回避を特徴とするリアルタイム計画アルゴリズムであるリアルタイム高速マーチングツリー(RT-FMT)を提案します。
検索中、RT-FMTはグローバルソリューションをすばやく探し、その間にロボットが使用して実行をより速く開始できるローカルパスを生成します。
さらに、アルゴリズムは常にツリーを再配線して、枝が動的な障害物内に形成されないようにし、ロボットの近くにツリールートを維持し、異なる目標のためにツリーを複数回再利用できるようにします。
私たちのアルゴリズムは、プランナーの高速マーチングツリー(FMT*)とリアルタイムの急速な概要ランダムツリー(RT-RRT*)に基づいています。
シミュレーションを介して、RT-FMTは、ほとんどの場合、実行コストと到着時間の両方でRT- RRT*を上回ることを示します。
さらに、シミュレーションを介して、劣等な経路を取る可能性がわずかであるにもかかわらず、到着時間を短縮するために、グローバルパスを利用できるようになる前にローカルパスをとる価値があることを実証します。

要約(オリジナル)

This paper proposes the Real-Time Fast Marching Tree (RT-FMT), a real-time planning algorithm that features local and global path generation, multiple-query planning, and dynamic obstacle avoidance. During the search, RT-FMT quickly looks for the global solution and, in the meantime, generates local paths that can be used by the robot to start execution faster. In addition, our algorithm constantly rewires the tree to keep branches from forming inside the dynamic obstacles and to maintain the tree root near the robot, which allows the tree to be reused multiple times for different goals. Our algorithm is based on the planners Fast Marching Tree (FMT*) and Real-time Rapidly-Exploring Random Tree (RT-RRT*). We show via simulations that RT-FMT outperforms RT- RRT* in both execution cost and arrival time, in most cases. Moreover, we also demonstrate via simulation that it is worthwhile taking the local path before the global path is available in order to reduce arrival time, even though there is a small possibility of taking an inferior path.

arxiv情報

著者 Jefferson Silveira,Kleber Cabral,Sidney Givigi,Joshua A. Marshall
発行日 2025-02-13 18:08:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Real-Time Fast Marching Tree for Mobile Robot Motion Planning in Dynamic Environments はコメントを受け付けていません

A Bias-Correction Decentralized Stochastic Gradient Algorithm with Momentum Acceleration

要約

分散確率的最適化アルゴリズムは、大規模なデータセットを同時に処理し、モデルトレーニングを大幅に加速できます。
ただし、それらの有効性は、分散ネットワークとデータの不均一性のスパースによってしばしば妨げられます。
この論文では、運動量(EDM)と呼ばれる運動量加速分散確率勾配アルゴリズムを提案します。これは、データの不均一性からのバイアスを軽減し、収束率を高めるために一般的に使用される運動量技術を組み込みます。
私たちの理論分析は、EDMアルゴリズムが最適な解の近傍にサブリーニアリングに収束することを示しています。その半径は、非凸の対物性関数に適用される場合、データの不均一性に関係なく、その半径です。
強い凸性よりも弱い仮定であるpolyak-lojasiewicz状態では、ターゲット領域に直線的に収束します。
複雑な分散パラメーター更新構造の運動量を処理するために採用された分析手法は、十分にタイトな収束上限をもたらし、他の運動量ベースの分散アルゴリズムの理論分析のための新しい視点を提供します。

要約(オリジナル)

Distributed stochastic optimization algorithms can simultaneously process large-scale datasets, significantly accelerating model training. However, their effectiveness is often hindered by the sparsity of distributed networks and data heterogeneity. In this paper, we propose a momentum-accelerated distributed stochastic gradient algorithm, termed Exact-Diffusion with Momentum (EDM), which mitigates the bias from data heterogeneity and incorporates momentum techniques commonly used in deep learning to enhance convergence rate. Our theoretical analysis demonstrates that the EDM algorithm converges sub-linearly to the neighborhood of the optimal solution, the radius of which is irrespective of data heterogeneity, when applied to non-convex objective functions; under the Polyak-Lojasiewicz condition, which is a weaker assumption than strong convexity, it converges linearly to the target region. Our analysis techniques employed to handle momentum in complex distributed parameter update structures yield a sufficiently tight convergence upper bound, offering a new perspective for the theoretical analysis of other momentum-based distributed algorithms.

arxiv情報

著者 Yuchen Hu,Xi Chen,Weidong Liu,Xiaojun Mao
発行日 2025-02-13 16:14:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, math.OC, stat.ML | A Bias-Correction Decentralized Stochastic Gradient Algorithm with Momentum Acceleration はコメントを受け付けていません

A Differentiable Rank-Based Objective For Better Feature Learning

要約

この論文では、既存の統計的手法を活用して、データからの機能学習をよりよく理解します。
\ cite {azadkia2021simple}で導入されている条件付き独立(foci)による機能の順序付け、モデルフリーの変数選択方法を変更することでこれに取り組みます。
焦点は条件付き依存性のノンパラメトリック係数に基づいていますが、そのパラメトリックで微分可能な近似を導入します。
この近似相関係数を使用すると、Diffociと呼ばれる新しいアルゴリズムを提示します。これは、その微分可能性と学習可能なパラメーターのおかげで、より広範な機械学習の問題に適用できます。
3つのコンテキストでdiffociを提示します。(1)焦点とのベースライン比較を伴う可変選択方法として、(2)ニューラルネットワークでパラメータ化されたトレーニング可能なモデルとして、(3)一般的で広く適用可能なニューラルネットワークの正規者として、
偽の相関をより良く管理することで、機能学習を改善します。
おもちゃの例の基本的な変数の選択から、畳み込みネットワークの顕著性マップ比較に至るまで、ますます複雑な問題についてDiffociを評価します。
次に、敏感なデータに依存することなく分類を促進するために、公平性のコンテキストにDiffociを組み込む方法を示します。

要約(オリジナル)

In this paper, we leverage existing statistical methods to better understand feature learning from data. We tackle this by modifying the model-free variable selection method, Feature Ordering by Conditional Independence (FOCI), which is introduced in \cite{azadkia2021simple}. While FOCI is based on a non-parametric coefficient of conditional dependence, we introduce its parametric, differentiable approximation. With this approximate coefficient of correlation, we present a new algorithm called difFOCI, which is applicable to a wider range of machine learning problems thanks to its differentiable nature and learnable parameters. We present difFOCI in three contexts: (1) as a variable selection method with baseline comparisons to FOCI, (2) as a trainable model parametrized with a neural network, and (3) as a generic, widely applicable neural network regularizer, one that improves feature learning with better management of spurious correlations. We evaluate difFOCI on increasingly complex problems ranging from basic variable selection in toy examples to saliency map comparisons in convolutional networks. We then show how difFOCI can be incorporated in the context of fairness to facilitate classifications without relying on sensitive data.

arxiv情報

著者 Krunoslav Lehman Pavasovic,David Lopez-Paz,Giulio Biroli,Levent Sagun
発行日 2025-02-13 16:15:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | A Differentiable Rank-Based Objective For Better Feature Learning はコメントを受け付けていません

Proxy-informed Bayesian transfer learning with unknown sources

要約

一般化トレーニングデータの範囲外では、異なるデータソース間で転送される効果とそうでない効果に関する事前知識を活用する必要があります。
転送学習は、ソース(トレーニング)およびターゲット(予測)データのセットに関するこの知識を指定および改善するためのフレームワークです。
挑戦的なオープンな問題は、負の伝達の経験的現象に対処することです。これにより、転送学習者は、ソースデータを以前よりも考慮した後、ターゲットデータでより悪化します。
最初に、負の伝達に関するベイジアンの視点を紹介し、次にそれに対処する方法を紹介します。
私たちの定式化からの重要な洞察は、負の伝達が、ソースデータの譲渡不可能な原因に関する誤った特定の事前の情報に起因する可能性があることです。
提案された方法、確率的転送学習のためのプロキシ情報に基づいた堅牢な方法(プロンプト)は、ソースデータの事前知識を必要としません(データソースは「不明」かもしれません)。
したがって、潜在的な交絡因子の存在など、タスク間の違いが観察されない場合、プロンプトは適用されます。
さらに、学習者は、ターゲットタスクの観測にアクセスする必要はなく(「微調整することはできません)、代わりにプロキシ(間接)情報を使用する必要があります。
我々の理論的結果は、否定的な伝達の脅威はプロキシ情報の情報性に依存しないことを示しており、人間のフィードバックなどの騒々しい間接情報のみが利用可能な場合のプロンプトの有用性を強調しています。

要約(オリジナル)

Generalization outside the scope of one’s training data requires leveraging prior knowledge about the effects that transfer, and the effects that don’t, between different data sources. Transfer learning is a framework for specifying and refining this knowledge about sets of source (training) and target (prediction) data. A challenging open problem is addressing the empirical phenomenon of negative transfer, whereby the transfer learner performs worse on the target data after taking the source data into account than before. We first introduce a Bayesian perspective on negative transfer, and then a method to address it. The key insight from our formulation is that negative transfer can stem from misspecified prior information about non-transferable causes of the source data. Our proposed method, proxy-informed robust method for probabilistic transfer learning (PROMPT), does not require prior knowledge of the source data (the data sources may be ‘unknown’). PROMPT is thus applicable when differences between tasks are unobserved, such as in the presence of latent confounders. Moreover, the learner need not have access to observations in the target task (cannot ‘fine-tune’), and instead makes use of proxy (indirect) information. Our theoretical results show that the threat of negative transfer does not depend on the informativeness of the proxy information, highlighting the usefulness of PROMPT in cases where only noisy indirect information, such as human feedback, is available.

arxiv情報

著者 Sabina J. Sloman,Julien Martinelli,Samuel Kaski
発行日 2025-02-13 16:28:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Proxy-informed Bayesian transfer learning with unknown sources はコメントを受け付けていません