EP-Diffuser: An Efficient Diffusion Model for Traffic Scene Generation and Prediction via Polynomial Representations

要約

予測の地平線が増加すると、エージェントの動きのマルチモーダルの性質により、トラフィックシーンの将来の進化を予測することがますます困難になります。
ほとんどの最先端(SOTA)予測モデルは、主に最も可能性の高い未来の予測に焦点を当てています。
ただし、自動運転車の安全な操作の場合、もっともらしい運動の代替品の分布をカバーすることも同様に重要です。
これに対処するために、可能なトラフィックシーンの進化の分布をキャプチャするために設計された新しいパラメーター効率の高い拡散ベースの生成モデルであるEp-Diffuserを紹介します。
道路のレイアウトとエージェントの履歴を条件に、私たちのモデルは予測因子として機能し、多様でもっともらしいシーンの継続を生成します。
Argoverse 2データセットでの予測の精度と妥当性の観点から、2つのSOTAモデルに対してEp-Diffuserをベンチマークします。
モデルサイズが大幅に小さくなりますが、私たちのアプローチは、非常に正確でもっともらしい交通シーンの予測の両方を達成します。
Waymo Open Datasetを使用して、分散排出(OOD)テスト設定でモデル一般化能力をさらに評価し、アプローチの優れた堅牢性を示します。
コードとモデルのチェックポイントは、https://github.com/continental/ep-diffuserにあります。

要約(オリジナル)

As the prediction horizon increases, predicting the future evolution of traffic scenes becomes increasingly difficult due to the multi-modal nature of agent motion. Most state-of-the-art (SotA) prediction models primarily focus on forecasting the most likely future. However, for the safe operation of autonomous vehicles, it is equally important to cover the distribution for plausible motion alternatives. To address this, we introduce EP-Diffuser, a novel parameter-efficient diffusion-based generative model designed to capture the distribution of possible traffic scene evolutions. Conditioned on road layout and agent history, our model acts as a predictor and generates diverse, plausible scene continuations. We benchmark EP-Diffuser against two SotA models in terms of accuracy and plausibility of predictions on the Argoverse 2 dataset. Despite its significantly smaller model size, our approach achieves both highly accurate and plausible traffic scene predictions. We further evaluate model generalization ability in an out-of-distribution (OoD) test setting using Waymo Open dataset and show superior robustness of our approach. The code and model checkpoints can be found here: https://github.com/continental/EP-Diffuser.

arxiv情報

著者 Yue Yao,Mohamed-Khalil Bouzidi,Daniel Goehring,Joerg Reichardt
発行日 2025-04-07 18:45:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | EP-Diffuser: An Efficient Diffusion Model for Traffic Scene Generation and Prediction via Polynomial Representations はコメントを受け付けていません

BC-ADMM: An Efficient Non-convex Constrained Optimizer with Robotic Applications

要約

非凸の制約最適化は、マルチエージェントナビゲーション、UAV軌道最適化、ソフトロボットシミュレーションなどのロボットアプリケーションで遍在しています。
この問題クラスでは、従来のオプティマイザーは小さなステップサイズと収束が遅いことに苦しんでいます。
乗数の交互方向方法(ADMM)のバリアントであるBC-ADMMを提案します。これは、バイコンベックス制約緩和を備えた非凸制約の最適化のクラスを解くことができます。
私たちのアルゴリズムは、問題を並行して簡単に解くことができる小規模なサブプロフェンスに分割することにより、より大きなステップサイズを可能にします。
私たちの方法には、理論的収束速度保証と漸近的な意味での実用的な収束保証の両方があることを示します。
4つのロボットアプリケーションの連続での数値実験により、BC-ADMMは、壁の時計時間の観点から、従来の勾配降下とニュートンの方法よりも速い収束を持っていることを示します。

要約(オリジナル)

Non-convex constrained optimizations are ubiquitous in robotic applications such as multi-agent navigation, UAV trajectory optimization, and soft robot simulation. For this problem class, conventional optimizers suffer from small step sizes and slow convergence. We propose BC-ADMM, a variant of Alternating Direction Method of Multiplier (ADMM), that can solve a class of non-convex constrained optimizations with biconvex constraint relaxation. Our algorithm allows larger step sizes by breaking the problem into small-scale sub-problems that can be easily solved in parallel. We show that our method has both theoretical convergence speed guarantees and practical convergence guarantees in the asymptotic sense. Through numerical experiments in a row of four robotic applications, we show that BC-ADMM has faster convergence than conventional gradient descent and Newton’s method in terms of wall clock time.

arxiv情報

著者 Zherong Pan,Kui Wu
発行日 2025-04-07 19:56:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.NA, cs.RO, math.NA, math.OC | BC-ADMM: An Efficient Non-convex Constrained Optimizer with Robotic Applications はコメントを受け付けていません

Trust Through Transparency: Explainable Social Navigation for Autonomous Mobile Robots via Vision-Language Models

要約

サービスおよび支援ロボットは、動的な社会環境でますます展開されています。
ただし、透明で説明可能な相互作用を確保することは、依然として重要な課題です。
このペーパーでは、ビジョン言語モデルとヒートマップを統合してナビゲーション中の透明度を向上させるマルチモーダルの説明可能性モジュールを紹介します。
提案されたシステムにより、ロボットは自然言語の概要を通じて観察結果を認識、分析、明確にすることができます。
ユーザー調査(n = 30)は、リアルタイムの説明に対する多数派の好みを示し、信頼と理解の改善を示しています。
私たちの実験は、混乱マトリックス分析を通じて検証され、人間の期待との一致レベルを評価しました。
実験およびシミュレーションの結果は、自律的なナビゲーションにおける説明可能性の有効性を強調し、信頼と解釈可能性を高めます。

要約(オリジナル)

Service and assistive robots are increasingly being deployed in dynamic social environments; however, ensuring transparent and explainable interactions remains a significant challenge. This paper presents a multimodal explainability module that integrates vision language models and heat maps to improve transparency during navigation. The proposed system enables robots to perceive, analyze, and articulate their observations through natural language summaries. User studies (n=30) showed a preference of majority for real-time explanations, indicating improved trust and understanding. Our experiments were validated through confusion matrix analysis to assess the level of agreement with human expectations. Our experimental and simulation results emphasize the effectiveness of explainability in autonomous navigation, enhancing trust and interpretability.

arxiv情報

著者 Oluwadamilola Sotomi,Devika Kodi,Aliasghar Arab
発行日 2025-04-07 20:16:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Trust Through Transparency: Explainable Social Navigation for Autonomous Mobile Robots via Vision-Language Models はコメントを受け付けていません

SPARK-Remote: A Cost-Effective System for Remote Bimanual Robot Teleoperation

要約

ロボットテレオペレーションにより、完全な自律性が困難な環境でのロボットシステムを人間の制御が可能にします。
低コストの遠隔操作デバイスとVR/ARテクノロジーの最近の進歩により、特に両手ロボットマニピュレーターのアクセシビリティが拡大しました。
ただし、対面からリモートテレオ操作への移行は、タスクのパフォーマンスに課題をもたらします。
双方向ロボットを動作させるための運動的にスケーリングされた低コストの遠隔操作システムであるSparkを紹介します。
その有効性は、3D SpacemouseやVR/ARコントローラーなどの既存のテクノロジーと比較されます。
さらに、SparkをSpark Remoteに拡張し、触覚グローブとリモートテレオ操作の力コントローラーを使用してセンサーベースの力フィードバックを統合します。
効果的な遠隔操作モードをテストするために、位置の精度、回転精度、ワークスペース内の大きな動き、および双方向のコラボレーションなど、運用特性を特徴とする5つの双方向操作タスクで、スパークおよびスパークリモートのバリエーションを評価します。
私たちの調査結果は、現実世界のアプリケーションの低コストの遠隔操作インターフェイスの改善に関する洞察を提供します。
補足資料、追加の実験、および定性的な結果については、プロジェクトWebページをご覧ください:https://bit.ly/41efcja

要約(オリジナル)

Robot teleoperation enables human control over robotic systems in environments where full autonomy is challenging. Recent advancements in low-cost teleoperation devices and VR/AR technologies have expanded accessibility, particularly for bimanual robot manipulators. However, transitioning from in-person to remote teleoperation presents challenges in task performance. We introduce SPARK, a kinematically scaled, low-cost teleoperation system for operating bimanual robots. Its effectiveness is compared to existing technologies like the 3D SpaceMouse and VR/AR controllers. We further extend SPARK to SPARK-Remote, integrating sensor-based force feedback using haptic gloves and a force controller for remote teleoperation. We evaluate SPARK and SPARK-Remote variants on 5 bimanual manipulation tasks which feature operational properties – positional precision, rotational precision, large movements in the workspace, and bimanual collaboration – to test the effective teleoperation modes. Our findings offer insights into improving low-cost teleoperation interfaces for real-world applications. For supplementary materials, additional experiments, and qualitative results, visit the project webpage: https://bit.ly/41EfcJa

arxiv情報

著者 Adam Imdieke,Karthik Desingh
発行日 2025-04-07 20:33:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | SPARK-Remote: A Cost-Effective System for Remote Bimanual Robot Teleoperation はコメントを受け付けていません

GSCE: A Prompt Framework with Enhanced Reasoning for Reliable LLM-driven Drone Control

要約

ドローンを含む大規模な言語モデル(LLMS)のロボット制御への統合は、自律システムに革命をもたらす可能性があります。
調査研究では、LLMを活用してロボット操作をサポートできることが実証されています。
ただし、複雑な推論でタスクに直面する場合、LLMSが生成するソリューションの信頼性について懸念と課題が提起されます。
この論文では、ドローンの信頼性の高いLLM駆動型制御を可能にするための強化された推論を備えた迅速なフレームワークを提案します。
私たちのフレームワークは、ガイドライン、スキルAPI、制約、つまりGSCEを使用して設計された新しい技術コンポーネントで構成されています。
GSCEは、信頼できる制約に準拠したコード生成によって紹介されています。
GSCEを使用して、幅広いレベルのタスクの複雑さを備えたドローンの制御のために徹底的な実験を行いました。
私たちの実験結果は、GSCEがベースラインアプローチと比較してタスクの成功率と完全性を大幅に改善できることを示しており、信頼性の高いLLM駆動型の自律ドローンシステムの可能性を強調しています。

要約(オリジナル)

The integration of Large Language Models (LLMs) into robotic control, including drones, has the potential to revolutionize autonomous systems. Research studies have demonstrated that LLMs can be leveraged to support robotic operations. However, when facing tasks with complex reasoning, concerns and challenges are raised about the reliability of solutions produced by LLMs. In this paper, we propose a prompt framework with enhanced reasoning to enable reliable LLM-driven control for drones. Our framework consists of novel technical components designed using Guidelines, Skill APIs, Constraints, and Examples, namely GSCE. GSCE is featured by its reliable and constraint-compliant code generation. We performed thorough experiments using GSCE for the control of drones with a wide level of task complexities. Our experiment results demonstrate that GSCE can significantly improve task success rates and completeness compared to baseline approaches, highlighting its potential for reliable LLM-driven autonomous drone systems.

arxiv情報

著者 Wenhao Wang,Yanyan Li,Long Jiao,Jiawei Yuan
発行日 2025-04-07 20:45:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | GSCE: A Prompt Framework with Enhanced Reasoning for Reliable LLM-driven Drone Control はコメントを受け付けていません

Path Database Guidance for Motion Planning

要約

ロボットモーション計画で以前の経験を使用する1つのアプローチは、パスのデータベースに以前に見られた問題に対するソリューションを保存することです。
このようなデータベースを使用する方法は、パスをクエリする方法と、新しい問題を考慮してクエリを使用する方法によって特徴付けられます。
この作業では、既存の作業を2つの方法で革新する新しい方法であるPATHデータベースガイダンス(PDG)を提示します。
最初に、データベースを使用して、検索ツリーのノードを決定するためにヒューリスティックを計算して拡張します。これは、一般的に(おそらく変換された)クエリパスを貼り付けるか、サンプリング分布をバイアスするために使用する以前の作業とは対照的です。
これにより、データベースガイダンスを活用したベースラインアルゴリズムに従って動的にインターリーブすることにより、他の検索方法との方法がより簡単に構成できることを実証します。
第二に、データベースを単一の固定事前として扱う他のメソッドとは対照的に、暗黙的に定義されたロボット構成スペースを検索する際に、データベース(したがってクエリのヒューリスティック)が更新されます。
シミュレーションにおけるさまざまな明示的に定義された環境分布におけるPDGの有効性を実験的に実証します。

要約(オリジナル)

One approach to using prior experience in robot motion planning is to store solutions to previously seen problems in a database of paths. Methods that use such databases are characterized by how they query for a path and how they use queries given a new problem. In this work we present a new method, Path Database Guidance (PDG), which innovates on existing work in two ways. First, we use the database to compute a heuristic for determining which nodes of a search tree to expand, in contrast to prior work which generally pastes the (possibly transformed) queried path or uses it to bias a sampling distribution. We demonstrate that this makes our method more easily composable with other search methods by dynamically interleaving exploration according to a baseline algorithm with exploitation of the database guidance. Second, in contrast to other methods that treat the database as a single fixed prior, our database (and thus our queried heuristic) updates as we search the implicitly defined robot configuration space. We experimentally demonstrate the effectiveness of PDG in a variety of explicitly defined environment distributions in simulation.

arxiv情報

著者 Amnon Attali,Praval Telagi,Marco Morales,Nancy M. Amato
発行日 2025-04-07 23:00:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | Path Database Guidance for Motion Planning はコメントを受け付けていません

Lazy-DaSH: Lazy Approach for Hypergraph-based Multi-robot Task and Motion Planning

要約

Lazy-Dashを紹介します。これは、最近の最新のマルチロボットタスクおよびモーションプランニングメソッドダッシュを改善します。これは、元の方法と比較してロボットとオブジェクトの数の2倍以上にスケーリングし、マルチマニピュレーターオブジェクトの再配置問題に適用されると数桁高速な計画時間を達成します。
高レベルのタスク計画レイヤーがタスクの完了に必要な計画スペースを識別する階層的アプローチを通じてこの改善を達成し、モーションの実現可能性はこれらのスペース内でのみゆっくりと検証されます。
対照的に、DASHはすべての可能なアクションのモーションの実現可能性を事前に補完し、状態空間表現を構築するためのコストが高くなります。
Lazy-Dashは、階層構造内の制約フィードバックメカニズムを利用して効率的なクエリパフォーマンスを維持し、モーションの実現可能性がクエリプロセスに効果的に伝達されるようにします。
より小さな状態空間表現を維持することにより、この方法は表現の構築時間とクエリ時間の両方を大幅に削減します。
4つの異なるシナリオでLazy-Dashを評価し、ロボットやオブジェクトの増加に対するスケーラビリティと、制約フィードバックメカニズムを介した競合を解決する際の適応性を示します。

要約(オリジナル)

We introduce Lazy-DaSH, an improvement over the recent state of the art multi-robot task and motion planning method DaSH, which scales to more than double the number of robots and objects compared to the original method and achieves an order of magnitude faster planning time when applied to a multi-manipulator object rearrangement problem. We achieve this improvement through a hierarchical approach, where a high-level task planning layer identifies planning spaces required for task completion, and motion feasibility is validated lazily only within these spaces. In contrast, DaSH precomputes the motion feasibility of all possible actions, resulting in higher costs for constructing state space representations. Lazy-DaSH maintains efficient query performance by utilizing a constraint feedback mechanism within its hierarchical structure, ensuring that motion feasibility is effectively conveyed to the query process. By maintaining smaller state space representations, our method significantly reduces both representation construction time and query time. We evaluate Lazy-DaSH in four distinct scenarios, demonstrating its scalability to increasing numbers of robots and objects, as well as its adaptability in resolving conflicts through the constraint feedback mechanism.

arxiv情報

著者 Seongwon Lee,James Motes,Isaac Ngui,Marco Morales,Nancy M. Amato
発行日 2025-04-07 23:01:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Lazy-DaSH: Lazy Approach for Hypergraph-based Multi-robot Task and Motion Planning はコメントを受け付けていません

Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning

要約

有用な強化学習(RL)エージェントを作成するために、ステップゼロは、タスクのニュアンスをキャプチャする適切な報酬関数を設計することです。
ただし、報酬エンジニアリングは、困難で時間のかかるプロセスになる可能性があります。
代わりに、Human-in-the-LoopRLメソッドは、人間のフィードバックから報酬機能を学習するという約束を保持しています。
最近の成功にもかかわらず、人間のループRLメソッドの多くは、成功した報酬機能を学習するために、依然として多数の人間の相互作用が必要です。
ヒューマンインザループRLメソッドのフィードバック効率を改善するため(つまり、人間の相互作用が少ない)、このペーパーでは、トレーニング前のデータ、SDPを紹介します。これは、報酬のない、最適なデータを活用して、スカラーおよび好みベースのRLアルゴリスムを改善します。
SDPでは、最小環境報酬を使用して、すべての低品質データを擬似標識することから始めます。
このプロセスを通じて、人間のラベル付けや好みを必要とせずに、報酬モデルを事前に訓練するための報酬ラベルを取得します。
このトレーニング前のフェーズは、報酬モデルに学習のヘッドスタートを提供し、低品質の遷移に低い報酬を割り当てる必要があることを認識できるようにします。
シミュレートされた教師と人間の両方の教師を使用した広範な実験を通じて、SDPは少なくとも、さまざまなシミュレートされたロボットタスクにわたって芸術の人間のRLパフォーマンスを満たすことができるが、しばしば大幅に改善できることがわかります。

要約(オリジナル)

To create useful reinforcement learning (RL) agents, step zero is to design a suitable reward function that captures the nuances of the task. However, reward engineering can be a difficult and time-consuming process. Instead, human-in-the-loop RL methods hold the promise of learning reward functions from human feedback. Despite recent successes, many of the human-in-the-loop RL methods still require numerous human interactions to learn successful reward functions. To improve the feedback efficiency of human-in-the-loop RL methods (i.e., require less human interaction), this paper introduces Sub-optimal Data Pre-training, SDP, an approach that leverages reward-free, sub-optimal data to improve scalar- and preference-based RL algorithms. In SDP, we start by pseudo-labeling all low-quality data with the minimum environment reward. Through this process, we obtain reward labels to pre-train our reward model without requiring human labeling or preferences. This pre-training phase provides the reward model a head start in learning, enabling it to recognize that low-quality transitions should be assigned low rewards. Through extensive experiments with both simulated and human teachers, we find that SDP can at least meet, but often significantly improve, state of the art human-in-the-loop RL performance across a variety of simulated robotic tasks.

arxiv情報

著者 Calarina Muslimani,Matthew E. Taylor
発行日 2025-04-07 23:17:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning はコメントを受け付けていません

Adaptive Multirobot Virtual Structure Control using Dual Quaternions

要約

小さなUAVグループの形成飛行のためのデュアルクォーターニオンベースの制御戦略が提案されています。
仮想構造の定義を通じて、形成の位置、方向、および形状パラメーターの調整された制御が有効になります。
この抽象化により、フォーメーション管理が簡素化され、低レベルのコントローラーが個々のUAVのコマンドを計算できるようになります。
コントローラーは、ポーズコントロールモジュールとジオメトリベースの適応戦略に分割され、効率的かつ正確なタスク実行を提供します。
シミュレーションと実験結果がアプローチを検証します。

要約(オリジナル)

A dual quaternion-based control strategy for formation flying of small UAV groups is proposed. Through the definition of a virtual structure, the coordinated control of formation’s position, orientation, and shape parameters is enabled. This abstraction simplifies formation management, allowing a low-level controller to compute commands for individual UAVs. The controller is divided into a pose control module and a geometry-based adaptive strategy, providing efficient and precise task execution. Simulation and experimental results validate the approach.

arxiv情報

著者 Juan Giribet,Alejandro Ghersin,Ignacio Mas
発行日 2025-04-07 23:19:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Adaptive Multirobot Virtual Structure Control using Dual Quaternions はコメントを受け付けていません

SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions — An EndoVis’24 Challenge

要約

外科的データサイエンスは、外科的ビデオ分析のためのエンドツーエンドのディープニューラルネットワーク(DNNS)の優れた性能により、急速な進歩を遂げています。
彼らの成功にもかかわらず、エンドツーエンドのDNNは、軽度の腐敗の影響を受けやすく、モデルのパフォーマンスを大幅に損なうことが証明されています。
この脆弱性は、特に外科的データサイエンスにおけるハイステークスの意思決定のために、最先端のテクノロジーの翻訳にとって大きな関心事となっています。
Segstrong-Cを紹介します。これは、献身的な外科データサイエンスのベンチマークと挑戦を紹介し、予期せぬがもっともらしい非逆の腐敗とそれを改善しようとする現代の方法の能力の下でモデルの劣化をよりよく理解することを目指しています。
包括的なベースライン実験と広範なコミュニティエンゲージメントからの参加提案を通じて、Segstrong-Cはモデルの故障の重要なテーマを明らかにし、堅牢性を改善するための有望な方向性を特定します。
チャレンジ受賞者のパフォーマンスは、腐敗タイプの未発表テストセットで平均0.9394 DSCと0.9301 NSDを達成し、出血、煙、および低輝度を達成し、0.1471 DSCと0.2584 NSDのインスピレーションを示しています。
結論として、Segstrong-Cチャレンジは、モデルの堅牢性を高めるためのいくつかの実用的なアプローチを特定しましたが、ほとんどのアプローチは、既知の、時には非常に深刻な制限に依存していました。
先を見据えて、私たちは、データの増強やトレーニングスケールを超えて、非逆数の堅牢性における知的多様性と創造性を拡大することを提唱し、腐敗に対する普遍的な堅牢性を高め、外科データ科学のより豊かなアプリケーションを可能にする新しいパラダイムを求めています。

要約(オリジナル)

Surgical data science has seen rapid advancement due to the excellent performance of end-to-end deep neural networks (DNNs) for surgical video analysis. Despite their successes, end-to-end DNNs have been proven susceptible to even minor corruptions, substantially impairing the model’s performance. This vulnerability has become a major concern for the translation of cutting-edge technology, especially for high-stakes decision-making in surgical data science. We introduce SegSTRONG-C, a benchmark and challenge in surgical data science dedicated, aiming to better understand model deterioration under unforeseen but plausible non-adversarial corruption and the capabilities of contemporary methods that seek to improve it. Through comprehensive baseline experiments and participating submissions from widespread community engagement, SegSTRONG-C reveals key themes for model failure and identifies promising directions for improving robustness. The performance of challenge winners, achieving an average 0.9394 DSC and 0.9301 NSD across the unreleased test sets with corruption types: bleeding, smoke, and low brightness, shows inspiring improvement of 0.1471 DSC and 0.2584 NSD in average comparing to strongest baseline methods with UNet architecture trained with AutoAugment. In conclusion, the SegSTRONG-C challenge has identified some practical approaches for enhancing model robustness, yet most approaches relied on conventional techniques that have known, and sometimes quite severe, limitations. Looking ahead, we advocate for expanding intellectual diversity and creativity in non-adversarial robustness beyond data augmentation or training scale, calling for new paradigms that enhance universal robustness to corruptions and may enable richer applications in surgical data science.

arxiv情報

著者 Hao Ding,Yuqian Zhang,Tuxun Lu,Ruixing Liang,Hongchao Shu,Lalithkumar Seenivasan,Yonghao Long,Qi Dou,Cong Gao,Yicheng Leng,Seok Bong Yoo,Eung-Joo Lee,Negin Ghamsarian,Klaus Schoeffmann,Raphael Sznitman,Zijian Wu,Yuxin Chen,Septimiu E. Salcudean,Samra Irshad,Shadi Albarqouni,Seong Tae Kim,Yueyi Sun,An Wang,Long Bai,Hongliang Ren,Ihsan Ullah,Ho-Gun Ha,Attaullah Khan,Hyunki Lee,Satoshi Kondo,Satoshi Kasai,Kousuke Hirasawa,Sita Tailor,Ricardo Sanchez-Matilla,Imanol Luengo,Tianhao Fu,Jun Ma,Bo Wang,Marcos Fernández-Rodríguez,Estevao Lima,João L. Vilaça,Mathias Unberath
発行日 2025-04-07 23:44:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions — An EndoVis’24 Challenge はコメントを受け付けていません