Adjusting Tissue Puncture Omnidirectionally In Situ with Pneumatic Rotatable Biopsy Mechanism and Hierarchical Airflow Management in Tortuous Luminal Pathways

要約

内腔カテーテルを用いたin situ組織生検は、低侵襲で合併症が少ないという特徴を持つ、疾患診断のための効率的なアプローチである。しかし、内腔カテーテルは、摩擦によるヒステリシスや狭いスペースのために、曲がりくねった管腔臓器内で組織を採取するために、内視鏡を遠位側に曲げたり近位側にねじったりして生検方向を調整するのに苦労している。ここでは、正確なin situ全方向生検のために、カテーテルをひねることなくサンプリング方向を調整できる空気圧駆動ロボットカテーテルを提案する。ロボットカテーテルの遠位端は、曲がりくねった管腔内臓器にカテーテルを展開するための空気圧式屈曲アクチュエータと、空気圧式回転生検機構(PRBM)で構成されている。階層的な気流制御により、PRBMは低気流下で生検方向を調整し、高気流下で生検針を展開することができ、in situでの組織の迅速な全方向サンプリングを可能にする。本稿では、生検針の反復的な展開評価、穿刺力測定、ファントム試験による検証を含む、提案するロボットカテーテルの設計、モデリング、特性評価について述べる。PRBMプロトタイプは、0.3MPaの陽圧で作動させた場合、360度に均等に分布する6つのサンプリング方向を有する。この空気圧駆動ロボットカテーテルは新しい生検戦略を提供し、最小限の侵襲で曲がりくねった管腔臓器のin situ多方向生検を容易にする可能性がある。

要約(オリジナル)

In situ tissue biopsy with an endoluminal catheter is an efficient approach for disease diagnosis, featuring low invasiveness and few complications. However, the endoluminal catheter struggles to adjust the biopsy direction by distal endoscope bending or proximal twisting for tissue sampling within the tortuous luminal organs, due to friction-induced hysteresis and narrow spaces. Here, we propose a pneumatically-driven robotic catheter enabling the adjustment of the sampling direction without twisting the catheter for an accurate in situ omnidirectional biopsy. The distal end of the robotic catheter consists of a pneumatic bending actuator for the catheter’s deployment in torturous luminal organs and a pneumatic rotatable biopsy mechanism (PRBM). By hierarchical airflow control, the PRBM can adjust the biopsy direction under low airflow and deploy the biopsy needle with higher airflow, allowing for rapid omnidirectional sampling of tissue in situ. This paper describes the design, modeling, and characterization of the proposed robotic catheter, including repeated deployment assessments of the biopsy needle, puncture force measurement, and validation via phantom tests. The PRBM prototype has six sampling directions evenly distributed across 360 degrees when actuated by a positive pressure of 0.3 MPa. The pneumatically-driven robotic catheter provides a novel biopsy strategy, potentially facilitating in situ multidirectional biopsies in tortuous luminal organs with minimum invasiveness.

arxiv情報

著者 Botao Lin,Tinghua Zhang,Sishen Yuan,Tiantian Wang,Jiaole Wang,Wu Yuan,Hongliang Ren
発行日 2025-06-03 15:54:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Adjusting Tissue Puncture Omnidirectionally In Situ with Pneumatic Rotatable Biopsy Mechanism and Hierarchical Airflow Management in Tortuous Luminal Pathways はコメントを受け付けていません

MultiDLO: Simultaneous Shape Tracking of Multiple Deformable Linear Objects with Global-Local Topology Preservation

要約

MultiDLOは、RGB-D画像シーケンスから、複数の絡み合った変形可能な線形オブジェクト(DLO)の形状を推定するリアルタイムアルゴリズムである。単一のDLOのみを追跡する先行手法とは異なり、MultiDLOは複数のオブジェクトを同時に扱う。グローバル-ローカルトポロジー保存アルゴリズムにおける測地線距離を使用して、オブジェクト間の同一性とオブジェクト内のトポロジーの両方を定義し、絡み合ったDLOが正確なローカルジオメトリーで区別されたままであることを保証する。MultiDLOアルゴリズムは、3つの絡み合うロープを含む2つの困難なシナリオで実証されており、実装はオープンソースでコミュニティに公開されている。

要約(オリジナル)

MultiDLO is a real-time algorithm for estimating the shapes of multiple, intertwining deformable linear objects (DLOs) from RGB-D image sequences. Unlike prior methods that track only a single DLO, MultiDLO simultaneously handles several objects. It uses the geodesic distance in the Global-Local Topology Preservation algorithm to define both inter-object identity and intra-object topology, ensuring entangled DLOs remain distinct with accurate local geometry. The MultiDLO algorithm is demonstrated on two challenging scenarios involving three entangling ropes, and the implementation is open-source and available for the community.

arxiv情報

著者 Jingyi Xiang,Holly Dinkel
発行日 2025-06-03 16:24:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | MultiDLO: Simultaneous Shape Tracking of Multiple Deformable Linear Objects with Global-Local Topology Preservation はコメントを受け付けていません

HAMMER: Heterogeneous, Multi-Robot Semantic Gaussian Splatting

要約

3Dガウススプラッティングは、幅広い視覚的、幾何学的、意味的情報をモデル化し、表現力豊かなシーン再構築を提供する。しかし、複数のロボットやデバイスからストリームされるデータを用いた効率的なリアルタイム地図再構成は、依然として課題である。そのため、我々はHAMMERを提案する。HAMMERは、広く利用可能なROS通信インフラストラクチャを活用し、ロボットの初期位置の事前知識がなく、デバイス上のポーズ推定量が変化する非同期ロボットデータストリームから、3D、メトリック意味マップを生成するサーバーベースの協調ガウススプラッティング手法である。HAMMERは、(i)ローカルSLAMポーズと画像データをグローバルフレームに変換するフレームアライメントモジュールと、(ii)ストリーミングデータからセマンティック3DGSマップを学習するオンラインモジュールで構成されています。HAMMERは、混合知覚モードを扱い、異なるデバイス間の画像前処理の差異を自動的に調整し、CLIP意味コードを3Dシーンに抽出し、オープン語彙言語クエリに使用する。我々の実世界実験では、HAMMERは競合するベースラインと比較して、より忠実度の高いマップ(2倍)を作成し、意味的目標条件付きナビゲーション(例えば、「ソファに行く」)のような下流のタスクに有用である。関連コンテンツはhammer-project.github.ioで入手可能。

要約(オリジナル)

3D Gaussian Splatting offers expressive scene reconstruction, modeling a broad range of visual, geometric, and semantic information. However, efficient real-time map reconstruction with data streamed from multiple robots and devices remains a challenge. To that end, we propose HAMMER, a server-based collaborative Gaussian Splatting method that leverages widely available ROS communication infrastructure to generate 3D, metric-semantic maps from asynchronous robot data-streams with no prior knowledge of initial robot positions and varying on-device pose estimators. HAMMER consists of (i) a frame alignment module that transforms local SLAM poses and image data into a global frame and requires no prior relative pose knowledge, and (ii) an online module for training semantic 3DGS maps from streaming data. HAMMER handles mixed perception modes, adjusts automatically for variations in image pre-processing among different devices, and distills CLIP semantic codes into the 3D scene for open-vocabulary language queries. In our real-world experiments, HAMMER creates higher-fidelity maps (2x) compared to competing baselines and is useful for downstream tasks, such as semantic goal-conditioned navigation (e.g., ‘go to the couch’). Accompanying content available at hammer-project.github.io.

arxiv情報

著者 Javier Yu,Timothy Chen,Mac Schwager
発行日 2025-06-03 16:34:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | HAMMER: Heterogeneous, Multi-Robot Semantic Gaussian Splatting はコメントを受け付けていません

Beacon-Based Feedback Control for Parking an Active-Joint Center-Articulated Mobile Robot

要約

本論文では、アクティブジョイント中心関節型移動ロボットの自律駐車制御戦略を提案する。まずロボットの運動学的モデルを導出し、次にゴール近傍の小さな範囲内で車両の姿勢を安定化させる制御則を提案する。制御則はリアプノフ法を用いて設計され、ロボットの極座標方程式に基づいている。ビーコンベースの誘導システムは、目標の位置と姿勢に関するフィードバックを提供する。シミュレーションにより、ロボットが任意の初期姿勢から正常に駐車できることを示す。

要約(オリジナル)

This paper presents an autonomous parking control strategy for an active-joint center-articulated mobile robot. We first derive a kinematic model of the robot, then propose a control law to stabilize the vehicle’s configuration within a small neighborhood of the goal. The control law, designed using Lyapunov techniques, is based on the robot’s polar coordinate equations. A beacon-based guidance system provides feedback on the target’s position and orientation. Simulations demonstrate the robot’s ability to park successfully from arbitrary initial poses.

arxiv情報

著者 Mehdi Delrobaei,Kenneth McIsaac
発行日 2025-06-03 17:11:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO, cs.SY, eess.SY | Beacon-Based Feedback Control for Parking an Active-Joint Center-Articulated Mobile Robot はコメントを受け付けていません

PAC Learning with Improvements

要約

機械学習における最も基本的な下界の一つは、ほぼ全ての非自明な設定において、誤差$epsilon$を学習するのに$1/epsilon$個のサンプルが必要であるということである(学習される分類器が複雑な場合、それ以上)。しかし、データ点が、そうすることで(望ましい)正の分類を受けられるなら、わずかな改善能力を持っているエージェントだとする。その場合、「十分に近い」だけで、実際に$textit{zero}$エラーを達成できるかもしれない。例えば、ある閾値$theta$に対して、$theta$以上のエージェントは合格し、$theta$以下のエージェントは不合格になる(つまり、線上の閾値を学習する)ような、ある仕事でのエージェントの技能を測定するための採用試験を想像する。また、エージェントは努力することで、ある少量$r$だけスキルレベルを向上させることができるとする。このように、エージェントが向上する能力は、標準的なモデルでは達成を望むことができなかった目標、すなわち誤差ゼロを可能にする可能性を秘めている。 本論文では、この現象をより広く探求し、一般的な結果を与えるとともに、エージェントの改善能力がどのような条件下で学習のサンプル複雑度を減少させることができるのか、あるいは逆に学習を難しくすることができるのかを検証する。また、どのような種類の改善を考慮したアルゴリズムが、限られた範囲で改善する能力を持つエージェントを考慮に入れることができるかを、理論的にも経験的にも検証する。

要約(オリジナル)

One of the most basic lower bounds in machine learning is that in nearly any nontrivial setting, it takes $\textit{at least}$ $1/\epsilon$ samples to learn to error $\epsilon$ (and more, if the classifier being learned is complex). However, suppose that data points are agents who have the ability to improve by a small amount if doing so will allow them to receive a (desired) positive classification. In that case, we may actually be able to achieve $\textit{zero}$ error by just being ‘close enough’. For example, imagine a hiring test used to measure an agent’s skill at some job such that for some threshold $\theta$, agents who score above $\theta$ will be successful and those who score below $\theta$ will not (i.e., learning a threshold on the line). Suppose also that by putting in effort, agents can improve their skill level by some small amount $r$. In that case, if we learn an approximation $\hat{\theta}$ of $\theta$ such that $\theta \leq \hat{\theta} \leq \theta + r$ and use it for hiring, we can actually achieve error zero, in the sense that (a) any agent classified as positive is truly qualified, and (b) any agent who truly is qualified can be classified as positive by putting in effort. Thus, the ability for agents to improve has the potential to allow for a goal one could not hope to achieve in standard models, namely zero error. In this paper, we explore this phenomenon more broadly, giving general results and examining under what conditions the ability of agents to improve can allow for a reduction in the sample complexity of learning, or alternatively, can make learning harder. We also examine both theoretically and empirically what kinds of improvement-aware algorithms can take into account agents who have the ability to improve to a limited extent when it is in their interest to do so.

arxiv情報

著者 Idan Attias,Avrim Blum,Keziah Naggita,Donya Saless,Dravyansh Sharma,Matthew Walter
発行日 2025-06-03 16:22:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.GT, cs.LG, stat.ML | PAC Learning with Improvements はコメントを受け付けていません

Sample complexity of Schrödinger potential estimation

要約

シュルオディンガー橋とSDEの確率的最適制御に基づく最新の生成モデリングアプローチにおいて重要な役割を果たす、シュルオディンガーポテンシャル推定の問題を扱う。単純な事前拡散過程が与えられたとき、これらの方法は、与えられた2つの分布$rrho_0$と$rrho_T^*$の間の経路を最小限の努力で探索する。この場合の最適なドリフトは、シュラン・ポテンシャルで表現できる。本論文では、時間$T$における限界分布のフィッティングを目的とした、許容可能な対数ポテンシャルのクラスに対する経験的カルバック・ライブラー(KL)リスク最小化器の一般化能力を研究する。対象分布$rho_T^*$と事前過程に関する合理的な仮定の下で、$rho_T^*$と推定対数ポテンシャルに対応する終端密度との間のKL-発散の非漸近的な高確率上界を導出する。特に、$rrho_0$と$rrho_T^*$の両方が無限のサポートを持っていても、$n$が無限大になるとき、過剰KL-リスクは$O(˶log^2 n / n)$の速さで減少することを示す。

要約(オリジナル)

We address the problem of Schr\’odinger potential estimation, which plays a crucial role in modern generative modelling approaches based on Schr\’odinger bridges and stochastic optimal control for SDEs. Given a simple prior diffusion process, these methods search for a path between two given distributions $\rho_0$ and $\rho_T^*$ requiring minimal efforts. The optimal drift in this case can be expressed through a Schr\’odinger potential. In the present paper, we study generalization ability of an empirical Kullback-Leibler (KL) risk minimizer over a class of admissible log-potentials aimed at fitting the marginal distribution at time $T$. Under reasonable assumptions on the target distribution $\rho_T^*$ and the prior process, we derive a non-asymptotic high-probability upper bound on the KL-divergence between $\rho_T^*$ and the terminal density corresponding to the estimated log-potential. In particular, we show that the excess KL-risk may decrease as fast as $O(\log^2 n / n)$ when the sample size $n$ tends to infinity even if both $\rho_0$ and $\rho_T^*$ have unbounded supports.

arxiv情報

著者 Nikita Puchkin,Iurii Pustovalov,Yuri Sapronov,Denis Suchkov,Alexey Naumov,Denis Belomestny
発行日 2025-06-03 16:26:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, math.ST, stat.ML, stat.TH | Sample complexity of Schrödinger potential estimation はコメントを受け付けていません

On the Benefits of Accelerated Optimization in Robust and Private Estimation

要約

我々は、加速勾配法、特にFrank-Wolfe法と投影勾配降下法に基づく、プライバシーと重尾行ロバスト性に対する利点について研究する。我々のアプローチは以下の通りである:Frank-Wolfe法に対して、我々の手法は、調整された学習率と制約集合上の$ell_2$ノルムの勾配の一様な下界に基づく。投影勾配降下を加速するために、Nesterovの運動量に基づく一般的な変法を用い、$mathbb{R}^p$上で目的を最適化する。これらの高速化により、反復の複雑さが減少し、経験的リスク最小化と集団リスク最小化の統計的保証が強化される。我々の解析は、非ランダムデータ、ランダムモデルフリーデータ、パラメトリックモデル(線形回帰と一般化線形モデル)の3つの設定をカバーする。方法論的には、ノイズの多い勾配に基づくプライバシーと頑健性の両方にアプローチする。ガウスメカニズムと高度な合成により差分プライバシーを確保し、幾何学的な平均中央値推定器を用いてヘビーテールの頑健性を実現し、共変量の次元依存性を鋭くする。最後に、本手法を既存の境界と比較し、本手法が最適収束を達成するシナリオを特定する。

要約(オリジナル)

We study the advantages of accelerated gradient methods, specifically based on the Frank-Wolfe method and projected gradient descent, for privacy and heavy-tailed robustness. Our approaches are as follows: For the Frank-Wolfe method, our technique is based on a tailored learning rate and a uniform lower bound on the gradient of the $\ell_2$-norm over the constraint set. For accelerating projected gradient descent, we use the popular variant based on Nesterov’s momentum, and we optimize our objective over $\mathbb{R}^p$. These accelerations reduce iteration complexity, translating into stronger statistical guarantees for empirical and population risk minimization. Our analysis covers three settings: non-random data, random model-free data, and parametric models (linear regression and generalized linear models). Methodologically, we approach both privacy and robustness based on noisy gradients. We ensure differential privacy via the Gaussian mechanism and advanced composition, and we achieve heavy-tailed robustness using a geometric median-of-means estimator, which also sharpens the dependency on the dimension of the covariates. Finally, we compare our rates to existing bounds and identify scenarios where our methods attain optimal convergence.

arxiv情報

著者 Laurentiu Andrei Marchis,Po-Ling Loh
発行日 2025-06-03 16:26:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 62F10, 62F35, 62J05, 62J07, 68P27, cs.LG, math.ST, stat.ML, stat.TH | On the Benefits of Accelerated Optimization in Robust and Private Estimation はコメントを受け付けていません

Torsion in Persistent Homology and Neural Networks

要約

トポロジカルデータ解析を組み込んだハイブリッド深層学習モデルにおけるねじれの役割を、オートエンコーダに焦点を当てて探る。ほとんどのTDAツールはフィールド係数を使用するが、これは整数ホモロジーに存在するねじれの特徴を隠してしまう。我々は、ねじれは符号化中に失われ、潜在空間で変化し、多くの場合、標準的な復号器では再構成されないことを示す。合成データと高次元データの両方を用いて、摂動に対するねじれの感度を評価し、いくつかのオートエンコーダーアーキテクチャにおけるねじれの回復可能性を評価する。我々の発見は、フィールドベースのアプローチの主要な限界を明らかにし、ロバストなデータ表現のために、ねじれ情報を保持するアーキテクチャや損失項の必要性を強調する。

要約(オリジナル)

We explore the role of torsion in hybrid deep learning models that incorporate topological data analysis, focusing on autoencoders. While most TDA tools use field coefficients, this conceals torsional features present in integer homology. We show that torsion can be lost during encoding, altered in the latent space, and in many cases, not reconstructed by standard decoders. Using both synthetic and high-dimensional data, we evaluate torsion sensitivity to perturbations and assess its recoverability across several autoencoder architectures. Our findings reveal key limitations of field-based approaches and underline the need for architectures or loss terms that preserve torsional information for robust data representation.

arxiv情報

著者 Maria Walch
発行日 2025-06-03 16:29:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, math.AT | Torsion in Persistent Homology and Neural Networks はコメントを受け付けていません

Why Shallow Networks Struggle to Approximate and Learn High Frequencies

要約

本論文では、特に機械精度、数値ノイズ、計算コストが実用上重要な要素である場合に、2層ニューラルネットワークが近似と学習の両方で高周波数の取り扱いに苦戦する理由を説明するために、数学的分析と計算分析を組み合わせた包括的な研究を発表する。具体的には、(1)有限精度の下で達成可能な最小の数値誤差、(2)与えられた精度を達成するのに必要な計算コスト、(3)摂動に対する手法の安定性、といった基本的な計算問題を調査する。我々の分析の核心は、表現の条件付けとその学習ダイナミクスにある。これらの疑問に対する明確な答えを、数値的な裏付けとともに提供する。

要約(オリジナル)

In this work, we present a comprehensive study combining mathematical and computational analysis to explain why a two-layer neural network struggles to handle high frequencies in both approximation and learning, especially when machine precision, numerical noise, and computational cost are significant factors in practice. Specifically, we investigate the following fundamental computational issues: (1) the minimal numerical error achievable under finite precision, (2) the computational cost required to attain a given accuracy, and (3) the stability of the method with respect to perturbations. The core of our analysis lies in the conditioning of the representation and its learning dynamics. Explicit answers to these questions are provided, along with supporting numerical evidence.

arxiv情報

著者 Shijun Zhang,Hongkai Zhao,Yimin Zhong,Haomin Zhou
発行日 2025-06-03 16:30:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML | Why Shallow Networks Struggle to Approximate and Learn High Frequencies はコメントを受け付けていません

Multi-Metric Adaptive Experimental Design under Fixed Budget with Validation

要約

オンライン実験における標準的なA/Bテストは、複数の候補を同時にテストする場合、統計的検出力の問題に直面する。一方、適応的実験計画(AED)だけでは、特に多くの指標(例えば、収益、安全性)と不均一な分散の場合、平均的な治療効果のような実験統計量を推論するには不十分である。本論文では、最適な治療を特定するための適応的探索フェーズと、治療の質を検証し統計量を推論するためのA/Bテストによる検証フェーズの2フェーズ構造を持つ固定予算マルチメトリックAEDフレームワークを提案する。我々はSHRVarを提案するが、これは逐次的半減法(sequential halving:SH)(Karninら、2013)を、新しい相対分散ベースのサンプリングと報酬z値に基づく消去戦略で一般化したものである。これは、指数関数的に減少する証明可能なエラー確率を達成し、ここで指数はSH (Karnin et al., 2013)とSHVar (Lalitha et al., 2023)の複雑さの尺度を一般化する。数値実験は我々の分析を検証し、この新しいフレームワークの優れた性能を実証する。

要約(オリジナル)

Standard A/B tests in online experiments face statistical power challenges when testing multiple candidates simultaneously, while adaptive experimental designs (AED) alone fall short in inferring experiment statistics such as the average treatment effect, especially with many metrics (e.g., revenue, safety) and heterogeneous variances. This paper proposes a fixed-budget multi-metric AED framework with a two-phase structure: an adaptive exploration phase to identify the best treatment, and a validation phase with an A/B test to verify the treatment’s quality and infer statistics. We propose SHRVar, which generalizes sequential halving (SH) (Karnin et al., 2013) with a novel relative-variance-based sampling and an elimination strategy built on reward z-values. It achieves a provable error probability that decreases exponentially, where the exponent generalizes the complexity measure for SH (Karnin et al., 2013) and SHVar (Lalitha et al., 2023) with homogeneous and heterogeneous variances, respectively. Numerical experiments verify our analysis and demonstrate the superior performance of this new framework.

arxiv情報

著者 Qining Zhang,Tanner Fiez,Yi Liu,Wenyang Liu
発行日 2025-06-03 16:41:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ML | Multi-Metric Adaptive Experimental Design under Fixed Budget with Validation はコメントを受け付けていません