A Generalized Modeling Approach to Liquid-driven Ballooning Membranes

要約

ソフトロボット工学は、適応可能なロボットシステムに柔軟な材料の使用を進めています。
膜作動型のソフトロボットは、加圧された拡張可能な膜を使用して安定した大きな変形を達成することにより、従来のソフトロボットの制限に対処しますが、複雑な変形ダイナミクスのためにコントロールと状態の推定が依然として困難です。
この論文では、平面変形の下でモデルの形状と伸びに楕円体近似を採用して、液体駆動型のバルーン膜の新しいモデリングアプローチを提示します。
圧力データと制御された液体量からの固有のフィードバックのみに依存すると、このアプローチにより、正確な膜状態の推定が可能になります。
実験的検証によるバルーン膜ベースのアクチュエーターのための提案されたモデルの有効性を実証し、$ RMSE_ {H_2} = 0.80 \; $ mmのインデント深度誤差を取得します。
無意味なアクチュエータの高さ範囲の$。
力の推定では、誤差範囲は$ rmse_ {f} = 0.15 \; $ nであると取得されます。

要約(オリジナル)

Soft robotics is advancing the use of flexible materials for adaptable robotic systems. Membrane-actuated soft robots address the limitations of traditional soft robots by using pressurized, extensible membranes to achieve stable, large deformations, yet control and state estimation remain challenging due to their complex deformation dynamics. This paper presents a novel modeling approach for liquid-driven ballooning membranes, employing an ellipsoid approximation to model shape and stretch under planar deformation. Relying solely on intrinsic feedback from pressure data and controlled liquid volume, this approach enables accurate membrane state estimation. We demonstrate the effectiveness of the proposed model for ballooning membrane-based actuators by experimental validation, obtaining the indentation depth error of $RMSE_{h_2}=0.80\;$mm, which is $23\%$ of the indentation range and $6.67\%$ of the unindented actuator height range. For the force estimation, the error range is obtained to be $RMSE_{F}=0.15\;$N which is $10\%$ of the measured force range.

arxiv情報

著者 Mirroyal Ismayilov,Jeref Merlin,Christos Bergeles,Lukas Lindenroth
発行日 2025-02-14 10:18:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | A Generalized Modeling Approach to Liquid-driven Ballooning Membranes はコメントを受け付けていません

Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints

要約

この作業は、未知のロボット遷移モデルの下でのマルチロボット調整の問題に対処し、時間ウィンドウの時間的論理によって指定されたタスクがユーザー定義の確率のしきい値に満たされることを保証します。
(i)ロボットの推定タスク完了確率と予想される報酬に基づいてタスクが割り当てられる高レベルのタスク割り当て、および(ii)ロボットの低レベル分散ポリシー学習と実行を統合するBIレベルのフレームワークを提示します。
割り当てられたタスクを満たしながら、補助報酬を独立して最適化します。
ロボットダイナミクスの不確実性を処理するために、当社のアプローチは、リアルタイムタスク実行データを活用して、予想されるタスク完了確率と報酬を繰り返し改善し、明示的なロボット遷移モデルなしで適応型タスク割り当てを可能にします。
提案されたアルゴリズムを理論的に検証し、タスクの割り当てが望ましい確率のしきい値を高い信頼性で満たしていることを示しています。
最後に、包括的なシミュレーションを通じてフレームワークの有効性を実証します。

要約(オリジナル)

This work addresses the problem of multi-robot coordination under unknown robot transition models, ensuring that tasks specified by Time Window Temporal Logic are satisfied with user-defined probability thresholds. We present a bi-level framework that integrates (i) high-level task allocation, where tasks are assigned based on the robots’ estimated task completion probabilities and expected rewards, and (ii) low-level distributed policy learning and execution, where robots independently optimize auxiliary rewards while fulfilling their assigned tasks. To handle uncertainty in robot dynamics, our approach leverages real-time task execution data to iteratively refine expected task completion probabilities and rewards, enabling adaptive task allocation without explicit robot transition models. We theoretically validate the proposed algorithm, demonstrating that the task assignments meet the desired probability thresholds with high confidence. Finally, we demonstrate the effectiveness of our framework through comprehensive simulations.

arxiv情報

著者 Xiaoshan Lin,Roberto Tron
発行日 2025-02-14 10:39:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.FL, cs.RO | Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints はコメントを受け付けていません

Coordinated control of multiple autonomous surface vehicles: challenges and advances – a systematic review

要約

海上環境でのさまざまな活動における自律表面容器(ASV)の使用と実装の増加は、その制御に関する開発と研究の増加を促進すると予想されます。
特に、複数のASVの調整は、ロボット工学、制御理論、通信システム、および海洋科学の交差点で学際的な研究努力を必要とする新しい課題と機会を提示します。
これらの船舶を集合的に使用できる多種多様なミッションまたは目的により、さまざまな制御技術のアプリケーションと組み合わせが可能になります。
これには、以前に実行不可能だと思われる側面を考慮するための機械学習の調査が含まれます。
このレビューは、以前のレビューによって残された重要なギャップに対処しながら、調整されたASVコントロールの包括的な調査を提供します。
以前の作品とは異なり、体系的なアプローチを採用して、記事の選択における完全性を確保し、バイアスを最小限に抑えます。
カスタマイズされた制御戦略と、自律性の向上のための機械学習技術の統合に焦点を当てて、サブ作用ASVの複雑な世界を掘り下げます。
最近の進歩を統合し、新たな傾向を特定することにより、この分野を前進させる洞察を提供し、最先端の技術と将来の研究努力のガイダンスの包括的な概要の両方を提供します。

要約(オリジナル)

The increasing use and implementation of Autonomous Surface Vessels (ASVs) for various activities in maritime environments is expected to drive a rise in developments and research on their control. Particularly, the coordination of multiple ASVs presents novel challenges and opportunities, requiring interdisciplinary research efforts at the intersection of robotics, control theory, communication systems, and marine sciences. The wide variety of missions or objectives for which these vessels can be collectively used allows for the application and combination of different control techniques. This includes the exploration of machine learning to consider aspects previously deemed infeasible. This review provides a comprehensive exploration of coordinated ASV control while addressing critical gaps left by previous reviews. Unlike previous works, we adopt a systematic approach to ensure integrity and minimize bias in article selection. We delve into the complex world of sub-actuated ASVs with a focus on customized control strategies and the integration of machine learning techniques for increased autonomy. By synthesizing recent advances and identifying emerging trends, we offer insights that drive this field forward, providing both a comprehensive overview of state-of-the-art techniques and guidance for future research efforts.

arxiv情報

著者 Manuel Gantiva Osorioa,Carmelina Ierardia,Isabel Jurado Floresa,Mario Pereira Martína,Pablo Millán Gata
発行日 2025-02-14 11:02:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Coordinated control of multiple autonomous surface vehicles: challenges and advances – a systematic review はコメントを受け付けていません

Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models

要約

人間は、抽象的な取扱説明書を解釈することにより、複雑な操作タスクを理解して実行する並外れた能力を持っています。
ただし、ロボットの場合、抽象的な命令を解釈して実行可能アクションに変換することができないため、この機能は大きな課題のままです。
このペーパーでは、Robotが高レベルのマニュアル指示に導かれた複雑なアセンブリタスクを実行できるようにする新しいフレームワークであるManual2Skillを紹介します。
私たちのアプローチは、ビジョン言語モデル(VLM)を活用して、教育画像から構造化された情報を抽出し、この情報を使用して階層アセンブリグラフを構築します。
これらのグラフは、部品、サブアセンブリ、およびそれらの間の関係を表しています。
タスクの実行を容易にするために、ポーズ推定モデルは、各アセンブリステップでコンポーネントの相対的な6Dポーズを予測します。
同時に、モーション計画モジュールは、実際のロボット実装のための実用的なシーケンスを生成します。
いくつかの現実世界のIKEA家具アイテムを正常に組み立てることにより、Manual2Skillの有効性を実証します。
このアプリケーションは、効率と精度の両方で長老型操作タスクを管理する能力を強調し、取扱説明書から学習の実用性を大幅に向上させます。
この作業は、人間の能力に似た方法で複雑な操作タスクを理解し、実行できるロボットシステムを進める際の一歩を踏み出します。

要約(オリジナル)

Humans possess an extraordinary ability to understand and execute complex manipulation tasks by interpreting abstract instruction manuals. For robots, however, this capability remains a substantial challenge, as they cannot interpret abstract instructions and translate them into executable actions. In this paper, we present Manual2Skill, a novel framework that enables robots to perform complex assembly tasks guided by high-level manual instructions. Our approach leverages a Vision-Language Model (VLM) to extract structured information from instructional images and then uses this information to construct hierarchical assembly graphs. These graphs represent parts, subassemblies, and the relationships between them. To facilitate task execution, a pose estimation model predicts the relative 6D poses of components at each assembly step. At the same time, a motion planning module generates actionable sequences for real-world robotic implementation. We demonstrate the effectiveness of Manual2Skill by successfully assembling several real-world IKEA furniture items. This application highlights its ability to manage long-horizon manipulation tasks with both efficiency and precision, significantly enhancing the practicality of robot learning from instruction manuals. This work marks a step forward in advancing robotic systems capable of understanding and executing complex manipulation tasks in a manner akin to human capabilities.

arxiv情報

著者 Chenrui Tie,Shengxiang Sun,Jinxuan Zhu,Yiwei Liu,Jingxiang Guo,Yue Hu,Haonan Chen,Junting Chen,Ruihai Wu,Lin Shao
発行日 2025-02-14 11:25:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models はコメントを受け付けていません

CTE-MLO: Continuous-time and Efficient Multi-LiDAR Odometry with Localizability-aware Point Cloud Sampling

要約

近年、LIDARベースのローカリゼーションとマッピング方法は、信頼できるリアルタイムのローカリゼーション機能のおかげで、大きな進歩を遂げています。
単一のLidar匂いを考慮すると、実際のシナリオでハードウェアの障害と縮退に直面することがよくありますが、Lidarベースのローカリゼーションとマッピングシステムのパフォーマンスを向上させるために、マルチライダー匂い(MLO)が研究されています。
ただし、MLOは、複数のLIDARから融合された高密度のポイント雲によって導入される高い計算の複雑さに苦しむ可能性があり、連続時間測定特性は既存のLidar匂いによって絶えず無視されます。
これにより、連続時間で効率的なMLO、すなわちCTE-MLOが開発されるようになります。これは、連続時間の視点を通じてマルチライダー測定を使用して正確でリアルタイムの推定を実現できます。
このホワイトペーパーでは、ガウスプロセスの推定は、カルマンフィルターと自然に組み合わされており、ポイントストリーム内の各ライダーポイントが、時間の瞬間を使用して対応する連続時間軌道を照会することができます。
分散型マルチライダー同期スキームは、プライマリライダーの割り当てなしで、個別のLIDARのポイントを単一のポイントクラウドに組み合わせるために考案されています。
さらに、堅牢性を犠牲にすることなくMLOのリアルタイムパフォーマンスを改善することを目的として、ローカライズ性を考慮してポイントクラウドサンプリング戦略が設計されています。
この目的のために、CTE-MLOは、カルマンフィルターフレームワーク内の同期、ローカル化可能性対応サンプリング、連続時間推定、およびボクセルマップ管理を統合します。
提案された方法の有効性は、パブリックデータセットや実際のアプリケーションなど、さまざまなシナリオを通じて実証されています。
このコードは、コミュニティに利益をもたらすためにhttps://github.com/shenhm516/cte-mloで入手できます。

要約(オリジナル)

In recent years, LiDAR-based localization and mapping methods have achieved significant progress thanks to their reliable and real-time localization capability. Considering single LiDAR odometry often faces hardware failures and degeneracy in practical scenarios, Multi-LiDAR Odometry (MLO), as an emerging technology, is studied to enhance the performance of LiDAR-based localization and mapping systems. However, MLO can suffer from high computational complexity introduced by dense point clouds that are fused from multiple LiDARs, and the continuous-time measurement characteristic is constantly neglected by existing LiDAR odometry. This motivates us to develop a Continuous-Time and Efficient MLO, namely CTE-MLO, which can achieve accurate and real-time estimation using multi-LiDAR measurements through a continuous-time perspective. In this paper, the Gaussian process estimation is naturally combined with the Kalman filter, which enables each LiDAR point in a point stream to query the corresponding continuous-time trajectory using its time instants. A decentralized multi-LiDAR synchronization scheme is also devised to combine points from separate LiDARs into a single point cloud without the primary LiDAR assignment. Moreover, with the aim of improving the real-time performance of MLO without sacrificing robustness, a point cloud sampling strategy is designed with the consideration of localizability. To this end, CTE-MLO integrates synchronization, localizability-aware sampling, continuous-time estimation, and voxel map management within a Kalman filter framework, which can achieve high accuracy and robust continuous-time estimation within only a few linear iterations. The effectiveness of the proposed method is demonstrated through various scenarios, including public datasets and real-world applications. The code is available at https://github.com/shenhm516/CTE-MLO to benefit the community.

arxiv情報

著者 Hongming Shen,Zhenyu Wu,Yulin Hui,Wei Wang,Qiyang Lyu,Tianchen Deng,Yeqing Zhu,Bailing Tian,Danwei Wang
発行日 2025-02-14 13:53:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | CTE-MLO: Continuous-time and Efficient Multi-LiDAR Odometry with Localizability-aware Point Cloud Sampling はコメントを受け付けていません

HelmetPoser: A Helmet-Mounted IMU Dataset for Data-Driven Estimation of Human Head Motion in Diverse Conditions

要約

ヘルメットに取り付けられたウェアラブルポジショニングシステムは、産業、建設、緊急救助環境の安全性を高め、調整を促進するために重要です。
Lidar-inertial odometry(LIO)および視覚型臭気(VIO)を含むこれらのシステムは、ほこり、煙、限られた視覚的特徴などの環境条件の不利な状態により、局在化において課題に直面することがよくあります。
これらの制限に対処するために、データ駆動型のIMUポーズ推定を進めることを目的とした、グラウンドトゥルースを備えた新しいヘッドマウント慣性測定ユニット(IMU)データセットを提案します。
データセットは、ヘルメットに取り付けられたシステムを使用して人間のヘッドモーションパターンをキャプチャし、10人の参加者のデータがさまざまなアクティビティを実行しています。
IMUバイアスを修正し、ローカリゼーションの精度を向上させるために、特に長期メモリ(LSTM)と変圧器ネットワークのニューラルネットワークの適用を調査します。
さらに、さまざまなIMUデータウィンドウの寸法、モーションパターン、センサータイプにわたるこれらのメソッドのパフォーマンスを評価します。
公開されているデータセットをリリースし、ヘルメットベースのローカリゼーションの高度なニューラルネットワークアプローチの実現可能性を実証し、この分野での将来の研究のベースラインを確立するための評価メトリックを提供します。
データとコードは、https://lqiutong.github.io/helmetposer.github.io/にあります。

要約(オリジナル)

Helmet-mounted wearable positioning systems are crucial for enhancing safety and facilitating coordination in industrial, construction, and emergency rescue environments. These systems, including LiDAR-Inertial Odometry (LIO) and Visual-Inertial Odometry (VIO), often face challenges in localization due to adverse environmental conditions such as dust, smoke, and limited visual features. To address these limitations, we propose a novel head-mounted Inertial Measurement Unit (IMU) dataset with ground truth, aimed at advancing data-driven IMU pose estimation. Our dataset captures human head motion patterns using a helmet-mounted system, with data from ten participants performing various activities. We explore the application of neural networks, specifically Long Short-Term Memory (LSTM) and Transformer networks, to correct IMU biases and improve localization accuracy. Additionally, we evaluate the performance of these methods across different IMU data window dimensions, motion patterns, and sensor types. We release a publicly available dataset, demonstrate the feasibility of advanced neural network approaches for helmet-based localization, and provide evaluation metrics to establish a baseline for future studies in this field. Data and code can be found at https://lqiutong.github.io/HelmetPoser.github.io/.

arxiv情報

著者 Jianping Li,Qiutong Leng,Jinxing Liu,Xinhang Xu,Tongxin Jin,Muqing Cao,Thien-Minh Nguyen,Shenghai Yuan,Kun Cao,Lihua Xie
発行日 2025-02-14 14:45:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | HelmetPoser: A Helmet-Mounted IMU Dataset for Data-Driven Estimation of Human Head Motion in Diverse Conditions はコメントを受け付けていません

Integrated Multi-Simulation Environments for Aerial Robotics Research

要約

シミュレーションフレームワークは、ロボットアプリケーションの安全な開発において極めて重要な役割を果たします。
ただし、多くの場合、想定されているロボットシステムの異なるコンポーネントは、さまざまな環境/シミュレーターで最もよくシミュレートされます。
これは、プロジェクト全体を単一の統合ロボットフレームワークにシミュレートする上で重要な課題をもたらします。
具体的には、部分的にオープンまたは閉鎖シミュレータの場合、多くの場合、2つのコア制限が生じます。
i)指定されたロボット以外のシーンの俳優は、ROSやII)シーン内のオブジェクトのリアルタイム状態情報(ポーズ、速度など)の取得を防ぐことができないようなインターフェイスを介して、ランタイム中に制御することはできません。
この作業では、これらの制限に対処し、強力なシミュレーターSphinx(Parrot Droneが提供)によってシミュレートされた空中ドローンをGazebo Simulatorに統合するユースケースのソリューションについて説明します。
これは、既存のガゼボベースの環境に含まれるドローンの鏡面インスタンスを使用して達成します。
統合されたシミュレーション環境の有望なアプリケーションは、空中マルチロボットシナリオで一般的なターゲット追跡のタスクです。
したがって、当社の統合シミュレーションの有効性を実証するために、オウムのさまざまな動的追跡シナリオで提供されるデフォルトのPIDベースのコントローラーフレームワークを上回るモデル予測コントローラー(MPC)も実装します。

既存のガゼボベースのシミュレーションにANAFIドローンを含めることでソリューションをテストし、カスタマイズされたPIDコントローラーベースラインに対するシミュレーションおよび実際の追跡実験での厳密なテストを通じてMPCのパフォーマンスを評価します。
ソースコードは、https://github.com/robot-ception-group/anafi_simに公開されています。

要約(オリジナル)

Simulation frameworks play a pivotal role in the safe development of robotic applications. However, often different components of an envisioned robotic system are best simulated in different environments/simulators. This poses a significant challenge in simulating the entire project into a single integrated robotic framework. Specifically, for partially-open or closed-source simulators, often two core limitations arise. i) Actors in the scene other than the designated robots cannot be controlled during runtime via interfaces such as ROS and ii) retrieving real-time state information (such as pose, velocity etc.) of objects in the scene is prevented. In this work, we address these limitations and describe our solution for the use case of integrating aerial drones simulated by the powerful simulator Sphinx (provided by Parrot Drone) into the Gazebo simulator. We achieve this by means of a mirrored instance of a drone that is included into existing Gazebo-based environments. A promising application of our integrated simulation environment is the task of target tracking that is common in aerial multi-robot scenarios. Therefore, to demonstrate the effectiveness our our integrated simulation, we also implement a model predictive controller (MPC) that outperforms the default PID-based controller framework provided with the Parrot’s popular Anafi drone in various dynamic tracking scenarios thus enhancing the utility of the overall system. We test our solution by including the Anafi drone in an existing Gazebo-based simulation and evaluate the performance of the MPC through rigorous testing in simulated and real-world tracking experiments against a customized PID controller baseline. Source code is published on https://github.com/robot-perception-group/anafi_sim.

arxiv情報

著者 Pascal Goldschmid,Aamir Ahmad
発行日 2025-02-14 15:11:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Integrated Multi-Simulation Environments for Aerial Robotics Research はコメントを受け付けていません

Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding

要約

混合シェルブピッカールーティングの問題(MSPRP)は、倉庫物流における基本的な課題であり、ピッカーはSKUを効率的に取得するために混合シェルブ環境をナビゲートする必要があります。
従来のヒューリスティックと最適化ベースのアプローチは、スケーラビリティと闘っていますが、最近の機械学習方法は多くの場合、順次意思決定に依存しており、ソリューションの潜在性が高く、最適ではないエージェントの調整につながります。
この作業では、マルチエージェント補強学習を介してMSPRPのMIN-MAXバリアントを解くための新しい階層的および並列デコードアプローチを提案します。
私たちのアプローチは、エージェントアクションよりも共同分布を生成し、高速デコードと効果的なピッカー調整を可能にしますが、この方法では、多次元アクション空間での競合を回避するための順次アクション選択を導入します。
実験では、特に大規模および分散式インスタンスの場合、ソリューションの品質と推論速度の両方で最先端のパフォーマンスが示されています。
私たちのコードは、http://github.com/ltluttmann/mar4msprpで公開されています。

要約(オリジナル)

The Mixed-Shelves Picker Routing Problem (MSPRP) is a fundamental challenge in warehouse logistics, where pickers must navigate a mixed-shelves environment to retrieve SKUs efficiently. Traditional heuristics and optimization-based approaches struggle with scalability, while recent machine learning methods often rely on sequential decision-making, leading to high solution latency and suboptimal agent coordination. In this work, we propose a novel hierarchical and parallel decoding approach for solving the min-max variant of the MSPRP via multi-agent reinforcement learning. While our approach generates a joint distribution over agent actions, allowing for fast decoding and effective picker coordination, our method introduces a sequential action selection to avoid conflicts in the multi-dimensional action space. Experiments show state-of-the-art performance in both solution quality and inference speed, particularly for large-scale and out-of-distribution instances. Our code is publicly available at http://github.com/LTluttmann/marl4msprp.

arxiv情報

著者 Laurin Luttmann,Lin Xie
発行日 2025-02-14 15:42:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, stat.ML | Learning to Solve the Min-Max Mixed-Shelves Picker-Routing Problem via Hierarchical and Parallel Decoding はコメントを受け付けていません

Spatial-aware decision-making with ring attractors in reinforcement learning systems

要約

このペーパーでは、神経回路のダイナミクスに触発された数学モデルであるリングアトラクタの統合を、強化学習(RL)アクション選択プロセスに統合します。
空間情報と不確実性をコードする専門の脳に触発された構造として機能するリングアトラクタは、RLの学習速度と精度を改善するための生物学的にもっともらしいメカニズムを提供します。
彼らは、行動空間を明示的にエンコードし、神経活動の組織を促進し、深い強化学習(DRL)の文脈でニューラルネットワーク全体で空間表現の分布を可能にすることでそうします。
たとえば、ロボット制御における回転角度間の連続性を保存するか、ゲームのような環境での戦術的な動き間の隣接。
アクション選択プロセスでのリングアトラクタの適用には、アクションをリング上の特定の場所にマッピングし、選択したアクションを神経活動に基づいて解読することが含まれます。
外因性モデルを構築し、DRLエージェントの一部としてそれらを統合することにより、リングアトラクタの適用を調査します。
私たちのアプローチは、Atari 100Kベンチマークで最先端のパフォーマンスを大幅に向上させ、選択された最先端のベースライン全体でパフォーマンスを53%増加させます。
https://anonymous.4open.science/r/ra_rl-8026で利用可能なコードベース。

要約(オリジナル)

This paper explores the integration of ring attractors, a mathematical model inspired by neural circuit dynamics, into the Reinforcement Learning (RL) action selection process. Serving as specialized brain-inspired structures that encode spatial information and uncertainty, ring attractors offer a biologically plausible mechanism to improve learning speed and accuracy in RL. They do so by explicitly encoding the action space, facilitating the organization of neural activity, and enabling the distribution of spatial representations across the neural network in the context of Deep Reinforcement Learning (DRL). For example, preserving the continuity between rotation angles in robotic control or adjacency between tactical moves in game-like environments. The application of ring attractors in the action selection process involves mapping actions to specific locations on the ring and decoding the selected action based on neural activity. We investigate the application of ring attractors by both building an exogenous model and integrating them as part of DRL agents. Our approach significantly improves state-of-the-art performance on the Atari 100k benchmark, achieving a 53\% increase in performance across selected state-of-the-art baselines. Codebase available at https://anonymous.4open.science/r/RA_RL-8026.

arxiv情報

著者 Marcos Negre Saura,Richard Allmendinger,Wei Pan,Theodore Papamarkou
発行日 2025-02-14 15:42:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Spatial-aware decision-making with ring attractors in reinforcement learning systems はコメントを受け付けていません

AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting

要約

事前に訓練された基礎モデル(FMS)は、単変量の時系列予測タスクで例外的なパフォーマンスを示しています。
ただし、機能間の複雑な依存関係の管理や予測の不確実性の定量化など、いくつかの実際的な課題が続いています。
この研究は、アダプターを導入することにより、これらの重要な制限に取り組むことを目的としています。
多変量タスクのための事前に訓練された単変量時系FMSの効果的な使用を促進する機能空間変換。
アダプターは、多変量入力を適切な潜在スペースに投影し、各次元にFMを個別に適用することにより動作します。
表現学習と部分的に確率的なベイジアンニューラルネットワークに関する文献に触発され、さまざまなアダプターと最適化/推論戦略を紹介します。
合成データセットと実際のデータセットの両方で実施さ​​れた実験は、アダプターの有効性を確認し、ベースライン方法と比較して、予測精度と不確実性の定量化の大幅な強化を示しています。
私たちのフレームワークは、アダプターを多変量コンテキストで時系列FMを活用するためのモジュール式、スケーラブル、および効果的なソリューションとして位置付け、それにより、実際のアプリケーションでの幅広い採用を促進します。
https://github.com/abenechehab/adaptsでコードをリリースします。

要約(オリジナル)

Pre-trained foundation models (FMs) have shown exceptional performance in univariate time series forecasting tasks. However, several practical challenges persist, including managing intricate dependencies among features and quantifying uncertainty in predictions. This study aims to tackle these critical limitations by introducing adapters; feature-space transformations that facilitate the effective use of pre-trained univariate time series FMs for multivariate tasks. Adapters operate by projecting multivariate inputs into a suitable latent space and applying the FM independently to each dimension. Inspired by the literature on representation learning and partially stochastic Bayesian neural networks, we present a range of adapters and optimization/inference strategies. Experiments conducted on both synthetic and real-world datasets confirm the efficacy of adapters, demonstrating substantial enhancements in forecasting accuracy and uncertainty quantification compared to baseline methods. Our framework, AdaPTS, positions adapters as a modular, scalable, and effective solution for leveraging time series FMs in multivariate contexts, thereby promoting their wider adoption in real-world applications. We release the code at https://github.com/abenechehab/AdaPTS.

arxiv情報

著者 Abdelhakim Benechehab,Vasilii Feofanov,Giuseppe Paolo,Albert Thomas,Maurizio Filippone,Balázs Kégl
発行日 2025-02-14 15:46:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting はコメントを受け付けていません