ADAPT: An Autonomous Forklift for Construction Site Operation

要約

効率的な材料物流は、建設業界のコストとスケジュールを管理する上で重要な役割を果たします。
ただし、手動の材料の取り扱いは、非効率性、遅延、安全リスクに陥りやすいままです。
自律的なフォークリフトは、現場での物流を合理化するための有望なソリューションを提供し、人間のオペレーターへの依存を減らし、労働力不足を軽減します。
このペーパーでは、建設環境向けに設計された完全に自律的なオフロードフォークリフトであるAdapt(自律的な動的オールテレインパレットトランスポーター)の開発と評価を紹介します。
構造化された倉庫の設定とは異なり、建設現場は、動的障害、非構造化された地形、さまざまな気象条件など、大きな課題をもたらします。
これらの課題に対処するために、当社のシステムは、AI駆動型の知覚技術を意思決定、計画、制御のための従来のアプローチと統合し、複雑な環境での信頼できる操作を可能にします。
広範な実世界のテストを通じてシステムを検証し、さまざまな気象条件で経験豊富な人間のオペレーターとその継続的なパフォーマンスを比較します。
私たちの調査結果は、自律的な屋外フォークリフトが人間レベルのパフォーマンスの近くで動作し、より安全で効率的な建設物流への実行可能なパスを提供できることを示しています。

要約(オリジナル)

Efficient material logistics play a critical role in controlling costs and schedules in the construction industry. However, manual material handling remains prone to inefficiencies, delays, and safety risks. Autonomous forklifts offer a promising solution to streamline on-site logistics, reducing reliance on human operators and mitigating labor shortages. This paper presents the development and evaluation of ADAPT (Autonomous Dynamic All-terrain Pallet Transporter), a fully autonomous off-road forklift designed for construction environments. Unlike structured warehouse settings, construction sites pose significant challenges, including dynamic obstacles, unstructured terrain, and varying weather conditions. To address these challenges, our system integrates AI-driven perception techniques with traditional approaches for decision making, planning, and control, enabling reliable operation in complex environments. We validate the system through extensive real-world testing, comparing its continuous performance against an experienced human operator across various weather conditions. Our findings demonstrate that autonomous outdoor forklifts can operate near human-level performance, offering a viable path toward safer and more efficient construction logistics.

arxiv情報

著者 Johannes Huemer,Markus Murschitz,Matthias Schörghuber,Lukas Reisinger,Thomas Kadiofsky,Christoph Weidinger,Mario Niedermeyer,Benedikt Widy,Marcel Zeilinger,Csaba Beleznai,Tobias Glück,Andreas Kugi,Patrik Zips
発行日 2025-04-16 13:22:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | ADAPT: An Autonomous Forklift for Construction Site Operation はコメントを受け付けていません

WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation

要約

オブジェクトの目標ナビゲーション – 目に見えない環境で特定のオブジェクトを特定するためにエージェントを要求することは、具体化されたAIの中心的な課題です。
Vision-Language Model(VLM)ベースのエージェントの最近の進歩は、プロンプトを通じて有望な認識と意思決定能力を実証していますが、世界の将来の状態を予測することで環境とのリスクと費用のかかる相互作用を減らす完全なモジュール式世界モデル設計をまだ確立していません。
Vision-Language Models(VLMS)を搭載した新しい世界モデルベースのナビゲーションフレームワークであるWMNAVを紹介します。
決定の可能な結果を​​予測し、ポリシーモジュールにフィードバックを提供するための記憶を構築します。
環境の予測状態を保持するために、WMNAVは、ナビゲーションポリシーの動的な構成を提供するために、世界モデルメモリの一部としてオンライン維持されているCuriosity Value Mapを提案します。
WMNAVは、人間のような思考プロセスに従って分解することにより、世界モデル計画と観察のフィードバックの違いに基づいて決定を下すことにより、モデルの幻覚の影響を効果的に軽減します。
さらに効率を高めるために、2段階のアクション提案者戦略を実装します。広範な探査に続いて、正確なローカリゼーションが続きます。
HM3DおよびMP3Dの広範な評価WMNAVは、成功率と探査効率の両方で既存のゼロショットベンチマークを上回ります(絶対改善: +3.2%SRおよび +3.2%SPLがHM3D、 +13.5%SRおよび +1.1%SPL)。
プロジェクトページ:https://b0b8k1ng.github.io/wmnav/。

要約(オリジナル)

Object Goal Navigation-requiring an agent to locate a specific object in an unseen environment-remains a core challenge in embodied AI. Although recent progress in Vision-Language Model (VLM)-based agents has demonstrated promising perception and decision-making abilities through prompting, none has yet established a fully modular world model design that reduces risky and costly interactions with the environment by predicting the future state of the world. We introduce WMNav, a novel World Model-based Navigation framework powered by Vision-Language Models (VLMs). It predicts possible outcomes of decisions and builds memories to provide feedback to the policy module. To retain the predicted state of the environment, WMNav proposes the online maintained Curiosity Value Map as part of the world model memory to provide dynamic configuration for navigation policy. By decomposing according to a human-like thinking process, WMNav effectively alleviates the impact of model hallucination by making decisions based on the feedback difference between the world model plan and observation. To further boost efficiency, we implement a two-stage action proposer strategy: broad exploration followed by precise localization. Extensive evaluation on HM3D and MP3D validates WMNav surpasses existing zero-shot benchmarks in both success rate and exploration efficiency (absolute improvement: +3.2% SR and +3.2% SPL on HM3D, +13.5% SR and +1.1% SPL on MP3D). Project page: https://b0b8k1ng.github.io/WMNav/.

arxiv情報

著者 Dujun Nie,Xianda Guo,Yiqun Duan,Ruijun Zhang,Long Chen
発行日 2025-04-16 13:23:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation はコメントを受け付けていません

Stochastic Trajectory Optimization for Robotic Skill Acquisition From a Suboptimal Demonstration

要約

デモンストレーション(LFD)から学ぶことは、ロボットが新しいスキルを獲得するための重要な方法として浮上しています。
ただし、人間の好みを反映する形状特性を備えた最適ではないが、スローモーションなどの下位の動的属性を備えた軌道軌跡デモンストレーションが与えられた場合、ロボットは動作を模倣するだけでなく、動的パフォーマンスを最適化する必要があります。
この作業では、最適化ベースの方法を活用して、形状が実証された軌道の形状と似ている優れたパフォーマンスの軌道を検索します。
具体的には、動的タイムワーピング(DTW)を使用して、2つの軌跡の違いを定量化し、衝突コストなどの追加のパフォーマンスメトリックと組み合わせてコスト関数を構築します。
さらに、MSTOMPと呼ばれるモーションプランニング(STOMP)の確率的軌道最適化のマルチポリティバージョンを開発します。これは、パラメーターの変更により安定して堅牢です。
実証された軌道でジッターに対処するために、周波数領域のゲイン制御方法をさらに利用して、デモンストレーションを除去し、周波数ドメインの軌跡の違いを測定するスペクトル(MSES)の平均平方根誤差(MSES)と呼ばれる計算的に効率的なメトリックを提案します。
また、時間領域と周波数領域のメソッド間の接続を理論的に強調します。
最後に、シミュレーション実験と実際の実験の両方で方法を検証し、既存の方法と比較して最適化のパフォーマンスと安定性の改善を紹介します。
ソースコードは、https://ming-bot.github.io/mstomp.github.ioにあります。

要約(オリジナル)

Learning from Demonstration (LfD) has emerged as a crucial method for robots to acquire new skills. However, when given suboptimal task trajectory demonstrations with shape characteristics reflecting human preferences but subpar dynamic attributes such as slow motion, robots not only need to mimic the behaviors but also optimize the dynamic performance. In this work, we leverage optimization-based methods to search for a superior-performing trajectory whose shape is similar to that of the demonstrated trajectory. Specifically, we use Dynamic Time Warping (DTW) to quantify the difference between two trajectories and combine it with additional performance metrics, such as collision cost, to construct the cost function. Moreover, we develop a multi-policy version of the Stochastic Trajectory Optimization for Motion Planning (STOMP), called MSTOMP, which is more stable and robust to parameter changes. To deal with the jitter in the demonstrated trajectory, we further utilize the gain-controlling method in the frequency domain to denoise the demonstration and propose a computationally more efficient metric, called Mean Square Error in the Spectrum (MSES), that measures the trajectories’ differences in the frequency domain. We also theoretically highlight the connections between the time domain and the frequency domain methods. Finally, we verify our method in both simulation experiments and real-world experiments, showcasing its improved optimization performance and stability compared to existing methods. The source code can be found at https://ming-bot.github.io/MSTOMP.github.io.

arxiv情報

著者 Chenlin Ming,Zitong Wang,Boxuan Zhang,Zhanxiang Cao,Xiaoming Duan,Jianping He
発行日 2025-04-16 14:15:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Stochastic Trajectory Optimization for Robotic Skill Acquisition From a Suboptimal Demonstration はコメントを受け付けていません

Self-Supervised Traversability Learning with Online Prototype Adaptation for Off-Road Autonomous Driving

要約

オフロード環境で信頼性の高い安全な自律運転を実現するには、正確で効率的な地形横断性分析が必要です。
ただし、このタスクは、オフロードシナリオに合わせて調整された大規模なデータセットの不足、手動注釈の高コストと潜在的なエラー、モーション計画の厳しいリアルタイム要件、オンボードユニットの限られた計算能力など、いくつかの課題に直面しています。
これらの課題に対処するために、このペーパーでは、自己教師の学習を活用し、手動注釈の必要性を排除する新しい通過性学習方法を提案します。
初めて、鳥類目のビュー(BEV)表現が入力として使用され、計算の負担を軽減し、下流のモーション計画への適応性を改善します。
車両の操作中、提案された方法は、移動した領域のオンライン分析を実施し、プロトタイプを動的に更新して、現在の環境の横断性を適応的に評価し、動的シーンの変更を効果的に処理します。
パブリックデータセットと独自のデータセットの両方で最先端のベンチマークに対してアプローチを評価し、多様な季節と地理的場所をカバーしています。
実験結果は、私たちの方法が最近のアプローチを大幅に上回ることを示しています。
さらに、実際の車両実験は、この方法が10 Hzで動作し、リアルタイムの要件を満たしていることを示していますが、5.5 kmの自律運転実験は、生成された通過性コストマップの互換性と下流のモーション計画をさらに検証します。

要約(オリジナル)

Achieving reliable and safe autonomous driving in off-road environments requires accurate and efficient terrain traversability analysis. However, this task faces several challenges, including the scarcity of large-scale datasets tailored for off-road scenarios, the high cost and potential errors of manual annotation, the stringent real-time requirements of motion planning, and the limited computational power of onboard units. To address these challenges, this paper proposes a novel traversability learning method that leverages self-supervised learning, eliminating the need for manual annotation. For the first time, a Birds-Eye View (BEV) representation is used as input, reducing computational burden and improving adaptability to downstream motion planning. During vehicle operation, the proposed method conducts online analysis of traversed regions and dynamically updates prototypes to adaptively assess the traversability of the current environment, effectively handling dynamic scene changes. We evaluate our approach against state-of-the-art benchmarks on both public datasets and our own dataset, covering diverse seasons and geographical locations. Experimental results demonstrate that our method significantly outperforms recent approaches. Additionally, real-world vehicle experiments show that our method operates at 10 Hz, meeting real-time requirements, while a 5.5 km autonomous driving experiment further validates the generated traversability cost maps compatibility with downstream motion planning.

arxiv情報

著者 Yafeng Bu,Zhenping Sun,Xiaohui Li,Jun Zeng,Xin Zhang,Hui Shen
発行日 2025-04-16 14:17:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Self-Supervised Traversability Learning with Online Prototype Adaptation for Off-Road Autonomous Driving はコメントを受け付けていません

An Extended Generalized Prandtl-Ishlinskii Hysteresis Model for I2RIS Robot

要約

網膜手術には、人間の網膜の制約された解剖学的空間のため、極端な精度が必要です。
外科医がこのレベルの精度を達成するのを支援するために、器用な能力を備えた改善された統合ロボット眼内ヘビ(I2RI)が開発されました。
ただし、このような柔軟な腱駆動型ロボットは、しばしばヒステリシスの問題に悩まされており、正確な制御と位置付けに大きな挑戦に挑戦します。
特に、小規模なi2RIで多段階のヒステリシス現象を観察しました。
この論文では、ヒステリシスの適合精度を高めるために、拡張一般化されたPrandtl-Ishlinskii(EGPI)モデルを提案します。
このモデルには、単調な入力の領域で多段階のヒステリシスを記述できる新しいスイッチングメカニズムが組み込まれています。
I2RISデータの実験的検証は、EGPIモデルが、複数のモーター入力方向にわたってRMSE、NRMSE、およびMAEの観点から、従来の一般化Prandtl-Ishlinskii(GPI)モデルを上回ることを示しています。
私たちの研究のEGPIモデルは、低侵襲柔軟なロボットのマルチステージヒステリシスのモデリングの可能性を強調しています。

要約(オリジナル)

Retinal surgery requires extreme precision due to constrained anatomical spaces in the human retina. To assist surgeons achieve this level of accuracy, the Improved Integrated Robotic Intraocular Snake (I2RIS) with dexterous capability has been developed. However, such flexible tendon-driven robots often suffer from hysteresis problems, which significantly challenges precise control and positioning. In particular, we observed multi-stage hysteresis phenomena in the small-scale I2RIS. In this paper, we propose an Extended Generalized Prandtl-Ishlinskii (EGPI) model to increase the fitting accuracy of the hysteresis. The model incorporates a novel switching mechanism that enables it to describe multi-stage hysteresis in the regions of monotonic input. Experimental validation on I2RIS data demonstrate that the EGPI model outperforms the conventional Generalized Prandtl-Ishlinskii (GPI) model in terms of RMSE, NRMSE, and MAE across multiple motor input directions. The EGPI model in our study highlights the potential in modeling multi-stage hysteresis in minimally invasive flexible robots.

arxiv情報

著者 Yiyao Yue,Mojtaba Esfandiari,Pengyuan Du,Peter Gehlbach,Makoto Jinno,Adnan Munawar,Peter Kazanzides,Iulian Iordachita
発行日 2025-04-16 14:23:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | An Extended Generalized Prandtl-Ishlinskii Hysteresis Model for I2RIS Robot はコメントを受け付けていません

GripMap: An Efficient, Spatially Resolved Constraint Framework for Offline and Online Trajectory Planning in Autonomous Racing

要約

自動運転車の従来の軌道計画アプローチは、多くの場合、車両の位置に関係なく一定のままである固定車両モデルを想定しています。
これは、タイヤと表面が車両のダイナミクスにおける2つの力を伝達するパートナーであるという重要な事実を見落としています。
タイヤは車両にとどまる間、表面の状態は場所によって異なります。
これらの課題を認識して、このペーパーでは、自律レースに適用されるオフラインおよびオンライン計画アルゴリズムの両方で、空間的に動的制約を解決するための新しいフレームワークを提示します。
GripMapの概念を紹介します。これにより、Frenetフレームの車両動的制約の空間分解能が提供され、局所的にさまざまなグリップ条件への適応が可能になります。
これにより、空間的に不変の車両モデルで達成できない、場所固有の効果、より効率的な車両行動、および安全性の向上を補償することができます。
焦点は、低い貯蔵需要と完全なハッシュによる迅速なアクセスにあります。
このフレームワークは、提示された形式の実際のアプリケーションで有利であることが証明されました。
自律的なレースに触発された実験は、その有効性を示しています。
将来の作業では、このフレームワークは、リアルタイムでさまざまなグリップ条件に合わせて調整する将来の解釈可能な学習アルゴリズムを開発するための基礎層として機能します。

要約(オリジナル)

Conventional trajectory planning approaches for autonomous vehicles often assume a fixed vehicle model that remains constant regardless of the vehicle’s location. This overlooks the critical fact that the tires and the surface are the two force-transmitting partners in vehicle dynamics; while the tires stay with the vehicle, surface conditions vary with location. Recognizing these challenges, this paper presents a novel framework for spatially resolving dynamic constraints in both offline and online planning algorithms applied to autonomous racing. We introduce the GripMap concept, which provides a spatial resolution of vehicle dynamic constraints in the Frenet frame, allowing adaptation to locally varying grip conditions. This enables compensation for location-specific effects, more efficient vehicle behavior, and increased safety, unattainable with spatially invariant vehicle models. The focus is on low storage demand and quick access through perfect hashing. This framework proved advantageous in real-world applications in the presented form. Experiments inspired by autonomous racing demonstrate its effectiveness. In future work, this framework can serve as a foundational layer for developing future interpretable learning algorithms that adjust to varying grip conditions in real-time.

arxiv情報

著者 Frederik Werner,Ann-Kathrin Schwehn,Markus Lienkamp,Johannes Betz
発行日 2025-04-16 14:25:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | GripMap: An Efficient, Spatially Resolved Constraint Framework for Offline and Online Trajectory Planning in Autonomous Racing はコメントを受け付けていません

EmoACT: a Framework to Embed Emotions into Artificial Agents Based on Affect Control Theory

要約

ロボットと人工剤が日常生活にますます統合されるようになるにつれて、人間と対話する能力を向上させることが不可欠です。
人間の相互作用に重要な役割を果たす感情は、人工剤で具体化された場合、人間とロボットの相互作用(HRI)の自然性と透明性を改善できます。
この研究の目的は、合成感情の生成のために、相互作用に深く根ざした感情の心理モデルである感情制御理論(ACT)を採用することを目的としています。
ACTに触発されたプラットフォームに依存しないフレームワークが開発され、人間の認識への影響を評価するためにヒューマノイドロボットに実装されました。
結果は、感情的な表示の頻度が、ユーザーがロボットをどのように認識するかに影響を与えることを示しています。
さらに、適切な感情表現は、ロボットの感情的および認知的機関を知覚することを強化するようです。
調査結果は、合成感情をロボットに埋め込むために行為を採用できることを示唆しており、その結果、ロボットは単なる機械よりもソーシャルエージェントとして認識される効果的な人間とロボットの相互作用をもたらします。

要約(オリジナル)

As robots and artificial agents become increasingly integrated into daily life, enhancing their ability to interact with humans is essential. Emotions, which play a crucial role in human interactions, can improve the naturalness and transparency of human-robot interactions (HRI) when embodied in artificial agents. This study aims to employ Affect Control Theory (ACT), a psychological model of emotions deeply rooted in interaction, for the generation of synthetic emotions. A platform-agnostic framework inspired by ACT was developed and implemented in a humanoid robot to assess its impact on human perception. Results show that the frequency of emotional displays impacts how users perceive the robot. Moreover, appropriate emotional expressions seem to enhance the robot’s perceived emotional and cognitive agency. The findings suggest that ACT can be successfully employed to embed synthetic emotions into robots, resulting in effective human-robot interactions, where the robot is perceived more as a social agent than merely a machine.

arxiv情報

著者 Francesca Corrao,Alice Nardelli,Jennifer Renoux,Carmine Tommaso Recchiuto
発行日 2025-04-16 14:36:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | EmoACT: a Framework to Embed Emotions into Artificial Agents Based on Affect Control Theory はコメントを受け付けていません

Generative Deep Learning Framework for Inverse Design of Fuels

要約

現在の作業では、燃料の加速された逆設計を可能にするために、定量的構造 – プロパティ関係(QSPR)テクニックを備えた、共同最適化変動自動エンコーダー(CO-VAE)アーキテクチャを組み合わせた生成的な深い学習フレームワークが開発されています。
CO-VAEは、VAE潜在スペースと相まってプロパティ予測コンポーネントを統合し、分子再構成と研究オクタン数(RON)の正確な推定を強化します(関心のある燃料特性として選択)。
キュレーションされたRONデータベースで濃縮されたGDB-13データベースのサブセットがモデルトレーニングに使用されます。
ハイパーパラメーターのチューニングは、再構成の忠実度、化学的妥当性、およびRON予測のバランスを最適化するためにさらに利用されています。
その後、独立した回帰モデルを使用してRON予測を改良しますが、差動進化アルゴリズムを使用して、VAE潜在スペースを効率的にナビゲートし、高RONの有望な燃料分子候補を特定します。
この方法論は、包括的な潜在的な表現内で複雑な構造プロパティ関係を捉えることにより、従来の燃料スクリーニングアプローチの制限に対処します。
生成モデルは、広大な化学空間を体系的に探索するための柔軟なツールを提供し、優れたアンチノック特性を持つ燃料を発見するための道を開いています。
実証されたアプローチは、新しい燃料のde novo設計の適用性と信頼性を高めるために、追加の燃料特性と合成化可能性基準を組み込むために容易に拡張できます。

要約(オリジナル)

In the present work, a generative deep learning framework combining a Co-optimized Variational Autoencoder (Co-VAE) architecture with quantitative structure-property relationship (QSPR) techniques is developed to enable accelerated inverse design of fuels. The Co-VAE integrates a property prediction component coupled with the VAE latent space, enhancing molecular reconstruction and accurate estimation of Research Octane Number (RON) (chosen as the fuel property of interest). A subset of the GDB-13 database, enriched with a curated RON database, is used for model training. Hyperparameter tuning is further utilized to optimize the balance among reconstruction fidelity, chemical validity, and RON prediction. An independent regression model is then used to refine RON prediction, while a differential evolution algorithm is employed to efficiently navigate the VAE latent space and identify promising fuel molecule candidates with high RON. This methodology addresses the limitations of traditional fuel screening approaches by capturing complex structure-property relationships within a comprehensive latent representation. The generative model provides a flexible tool for systematically exploring vast chemical spaces, paving the way for discovering fuels with superior anti-knock properties. The demonstrated approach can be readily extended to incorporate additional fuel properties and synthesizability criteria to enhance applicability and reliability for de novo design of new fuels.

arxiv情報

著者 Kiran K. Yalamanchi,Pinaki Pal,Balaji Mohan,Abdullah S. AlRamadan,Jihad A. Badra,Yuanjiang Pei
発行日 2025-04-16 13:32:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph | Generative Deep Learning Framework for Inverse Design of Fuels はコメントを受け付けていません

Neural Contextual Bandits Under Delayed Feedback Constraints

要約

この論文では、遅延報酬フィードバックの課題に対処する神経文脈盗賊(CBS)の新しいアルゴリズムを提示します。ここでは、選択したアクションに対する報酬がランダムで未知の遅延の後に明らかになります。
このシナリオは、オンライン推奨システムや臨床試験などのアプリケーションで一般的です。ここでは、ユーザーのアクション(推奨事項や治療反応など)の結果または結果が時間をかけて測定して測定するために報酬フィードバックが遅れます。
遅延NeuralucBと呼ばれる提案されたアルゴリズムは、上位信頼境界(UCB)ベースの探査戦略を使用します。
独立した同一に分散されたサブエクスポンシャル報酬遅延の仮定の下で、T Length Horizo​​nに対する累積後悔の上限を導き出します。
さらに、Thompsonサンプリングベースの探査を使用するDelayed Neuraltsと呼ばれるアルゴリズムのバリアントを検討します。
MnistやMushroomなどの実際のデータセットでの数値実験とベンチマークアプローチとの比較は、提案されたアルゴリズムがさまざまな遅延を効果的に管理し、複雑な現実世界のシナリオに適していることを示しています。

要約(オリジナル)

This paper presents a new algorithm for neural contextual bandits (CBs) that addresses the challenge of delayed reward feedback, where the reward for a chosen action is revealed after a random, unknown delay. This scenario is common in applications such as online recommendation systems and clinical trials, where reward feedback is delayed because the outcomes or results of a user’s actions (such as recommendations or treatment responses) take time to manifest and be measured. The proposed algorithm, called Delayed NeuralUCB, uses an upper confidence bound (UCB)-based exploration strategy. Under the assumption of independent and identically distributed sub-exponential reward delays, we derive an upper bound on the cumulative regret over a T-length horizon. We further consider a variant of the algorithm, called Delayed NeuralTS, that uses Thompson Sampling-based exploration. Numerical experiments on real-world datasets, such as MNIST and Mushroom, along with comparisons to benchmark approaches, demonstrate that the proposed algorithms effectively manage varying delays and are well-suited for complex real-world scenarios.

arxiv情報

著者 Mohammadali Moghimi,Sharu Theresa Jose,Shana Moothedath
発行日 2025-04-16 13:47:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Neural Contextual Bandits Under Delayed Feedback Constraints はコメントを受け付けていません

Predictive Multiplicity in Survival Models: A Method for Quantifying Model Uncertainty in Predictive Maintenance Applications

要約

多くのアプリケーション、特に予測を含むアプリケーションでは、モデルはほぼ最適なパフォーマンスをもたらす可能性がありますが、個人レベルの結果には大幅に同意しない可能性があります。
予測多重性として知られるこの現象は、バイナリ、確率的、多ターゲット分類で正式に定義されており、予測システムの信頼性を損ないます。
ただし、その意味は、生存分析のコンテキストでは未開拓のままです。これには、検閲されたデータを適切に処理しながら、失敗または同様のイベントまでの時間を推定することが含まれます。
生存ベースのモデルにおける重要な懸念として予測的な多重性を枠組みし、それを定量化するために、曖昧さ、矛盾、およびあいまいさを正式に導入します。
これは、正確な個々のリスク推定値が不可欠なメンテナンススケジューリングなどの下流のタスクに特に関連しています。
予測多重性の理解と報告は、ハイステークス環境で展開されたモデルに信頼を築くのに役立ちます。
予測メンテナンスからのベンチマークデータセットに方法論を適用し、マルチプリティの概念をサバイバルモデルに拡張します。
私たちの調査結果は、あいまいさが着実に増加し、観察の最大40〜45%に達することを示しています。
矛盾は低くなりますが、同様の傾向を示します。
そして、あいまいさは軽度のままであり、いくつかのモデルに集中しています。
これらの結果は、複数の正確な生存モデルが、同じ機器の故障リスクと分解進行の矛盾する推定をもたらす可能性があることを示しています。
これは、プロセスの健康管理における信頼できる意思決定を確保するために、予測的な多重性を明示的に測定および伝達する必要性を強調しています。

要約(オリジナル)

In many applications, especially those involving prediction, models may yield near-optimal performance yet significantly disagree on individual-level outcomes. This phenomenon, known as predictive multiplicity, has been formally defined in binary, probabilistic, and multi-target classification, and undermines the reliability of predictive systems. However, its implications remain unexplored in the context of survival analysis, which involves estimating the time until a failure or similar event while properly handling censored data. We frame predictive multiplicity as a critical concern in survival-based models and introduce formal measures — ambiguity, discrepancy, and obscurity — to quantify it. This is particularly relevant for downstream tasks such as maintenance scheduling, where precise individual risk estimates are essential. Understanding and reporting predictive multiplicity helps build trust in models deployed in high-stakes environments. We apply our methodology to benchmark datasets from predictive maintenance, extending the notion of multiplicity to survival models. Our findings show that ambiguity steadily increases, reaching up to 40-45% of observations; discrepancy is lower but exhibits a similar trend; and obscurity remains mild and concentrated in a few models. These results demonstrate that multiple accurate survival models may yield conflicting estimations of failure risk and degradation progression for the same equipment. This highlights the need to explicitly measure and communicate predictive multiplicity to ensure reliable decision-making in process health management.

arxiv情報

著者 Mustafa Cavus
発行日 2025-04-16 15:04:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Predictive Multiplicity in Survival Models: A Method for Quantifying Model Uncertainty in Predictive Maintenance Applications はコメントを受け付けていません