Nano Drone-based Indoor Crime Scene Analysis

要約

ロボット工学、人工知能(AI)、コンピュータービジョン(CV)などの技術を犯罪現場分析(CSA)に適用して、命を保護し、正義を促進し、犯罪を阻止することができますが、自動化できるタスクの概要は不足しています。
ここでは、投機的なプロトタイピングアプローチに従います。まず、階段ツールを使用して、窓から犯罪シーンにアクセスし、証拠をマッピング/収集し、血液塗抹標本を分析するなど、あまり注意を払っていないように見えるタスクを迅速にレビューし、特定のタスクを特定します。
第二に、これら3つのタスクを75%、85%、および80%のパフォーマンスで実装する小さなドローンのプロトタイプを提示し、屋内犯罪現場の最小分析を実行します。
学んだ教訓は、次の作業の指導に向けて報告されています。

要約(オリジナル)

Technologies such as robotics, Artificial Intelligence (AI), and Computer Vision (CV) can be applied to crime scene analysis (CSA) to help protect lives, facilitate justice, and deter crime, but an overview of the tasks that can be automated has been lacking. Here we follow a speculative prototyping approach: First, the STAIR tool is used to rapidly review the literature and identify tasks that seem to have not received much attention, like accessing crime scenes through a window, mapping/gathering evidence, and analyzing blood smears. Secondly, we present a prototype of a small drone that implements these three tasks with 75%, 85%, and 80% performance, to perform a minimal analysis of an indoor crime scene. Lessons learned are reported, toward guiding next work.

arxiv情報

著者 Martin Cooney,Sivadinesh Ponrajan,Fernando Alonso-Fernandez
発行日 2025-05-13 13:42:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Nano Drone-based Indoor Crime Scene Analysis はコメントを受け付けていません

End-to-End Multi-Task Policy Learning from NMPC for Quadruped Locomotion

要約

四足ロボットは、車輪付きロボットがしばしば故障する複雑で非構造化されていない環境を横断することに優れています。
ただし、四足動物の非線形ダイナミクス、高度の自由度、およびリアルタイム制御の計算要求により、効率的で適応可能な移動を可能にすることは依然として困難です。
非線形モデル予測制御(NMPC)などの最適化ベースのコントローラーは強力なパフォーマンスを示していますが、正確な状態推定と高い計算オーバーヘッドへの依存により、実際の設定での展開が困難になります。
この作業では、専門家NMPCデモンストレーションを使用して単一のニューラルネットワークをトレーニングするために、生の固有受容センサー入力からの複数の移動行動のアクションを予測するために使用されるマルチタスク学習(MTL)フレームワークを紹介します。
シミュレーションと実際のハードウェアの両方で、四足動物のロボットGO1でアプローチを広範囲に評価し、専門家の行動を正確に再現し、スムーズな歩行スイッチングを可能にし、リアルタイムの展開のためのコントロールパイプラインを簡素化することを実証します。
当社のMTLアーキテクチャにより、統一されたポリシー内で多様な歩行を学習することができ、すべてのタスクで予測された共同ターゲットの高い$ r^{2} $スコアを達成します。

要約(オリジナル)

Quadruped robots excel in traversing complex, unstructured environments where wheeled robots often fail. However, enabling efficient and adaptable locomotion remains challenging due to the quadrupeds’ nonlinear dynamics, high degrees of freedom, and the computational demands of real-time control. Optimization-based controllers, such as Nonlinear Model Predictive Control (NMPC), have shown strong performance, but their reliance on accurate state estimation and high computational overhead makes deployment in real-world settings challenging. In this work, we present a Multi-Task Learning (MTL) framework in which expert NMPC demonstrations are used to train a single neural network to predict actions for multiple locomotion behaviors directly from raw proprioceptive sensor inputs. We evaluate our approach extensively on the quadruped robot Go1, both in simulation and on real hardware, demonstrating that it accurately reproduces expert behavior, allows smooth gait switching, and simplifies the control pipeline for real-time deployment. Our MTL architecture enables learning diverse gaits within a unified policy, achieving high $R^{2}$ scores for predicted joint targets across all tasks.

arxiv情報

著者 Anudeep Sajja,Shahram Khorshidi,Sebastian Houben,Maren Bennewitz
発行日 2025-05-13 13:46:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | End-to-End Multi-Task Policy Learning from NMPC for Quadruped Locomotion はコメントを受け付けていません

MC-Swarm: Minimal-Communication Multi-Agent Trajectory Planning and Deadlock Resolution for Quadrotor Swarm

要約

効果的なマルチエージェント軌道計画のために、軽量通信とその潜在的な非同期を考慮することが重要です。
このホワイトペーパーでは、非同期に動作し、初期計画段階を除いて通信を必要としない四肢群群の分散軌道計画アルゴリズムを紹介します。
さらに、私たちのアルゴリズムは、飛行中の非同期更新と通信の欠如の下での行き詰まりを保証しません。
これらのポイントを効果的に確保するために、2つの主要なモジュールを構築します:調整状態のアップデーターと軌道オプティマイザー。
Coordination State Updaterは、各エージェントの目標に向けてウェイポイントを計算し、デッドロックを考慮しながらサブゴールの最適化と、近隣エージェントおよび障害に関する安全上の制約を実行します。
次に、軌道オプティマイザーは、近隣のエージェントの非同期計画の更新でさえ衝突回避を保証する軌跡を生成します。
デッドロックの解決との衝突回避の理論的保証を提供し、ランダムフォレストや狭いギャップの迷路を含む複雑なシミュレーション環境での方法の有効性を評価します。
さらに、合計ミッション時間を短縮するために、軽量通信を使用してより速い調整状態の更新を設計します。
最後に、私たちのアプローチは、広範なシミュレーションと散らかった環境シナリオを使用した実際の実験を通じて検証されています。

要約(オリジナル)

For effective multi-agent trajectory planning, it is important to consider lightweight communication and its potential asynchrony. This paper presents a distributed trajectory planning algorithm for a quadrotor swarm that operates asynchronously and requires no communication except during the initial planning phase. Moreover, our algorithm guarantees no deadlock under asynchronous updates and absence of communication during flight. To effectively ensure these points, we build two main modules: coordination state updater and trajectory optimizer. The coordination state updater computes waypoints for each agent toward its goal and performs subgoal optimization while considering deadlocks, as well as safety constraints with respect to neighbor agents and obstacles. Then, the trajectory optimizer generates a trajectory that ensures collision avoidance even with the asynchronous planning updates of neighboring agents. We provide a theoretical guarantee of collision avoidance with deadlock resolution and evaluate the effectiveness of our method in complex simulation environments, including random forests and narrow-gap mazes. Additionally, to reduce the total mission time, we design a faster coordination state update using lightweight communication. Lastly, our approach is validated through extensive simulations and real-world experiments with cluttered environment scenarios.

arxiv情報

著者 Yunwoo Lee,Jungwon Park
発行日 2025-05-13 14:05:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | MC-Swarm: Minimal-Communication Multi-Agent Trajectory Planning and Deadlock Resolution for Quadrotor Swarm はコメントを受け付けていません

Beyond Predefined Actions: Integrating Behavior Trees and Dynamic Movement Primitives for Robot Learning from Demonstration

要約

動作ツリー(BTS)や動的モーションプリミティブ(DMP)などの解釈可能なポリシー表現は、人間のデモンストレーションからロボットスキル転送を可能にしますが、それぞれが制限に直面しています。BTSは専門家操作の低レベルアクションを必要としますが、DMPは高レベルのタスクロジックを欠いています。
DMPコントローラーをBTフレームワークに統合し、単一のデモンストレーションからBT構造とDMPアクションを共同で学習し、事前定義されたアクションの必要性を削除することにより、これらの制限に対処します。
さらに、BT決定ロジックとDMPモーション生成を組み合わせることにより、当社の方法は、自律システムのポリシーの解釈可能性、モジュール性、および適応性を高めます。
私たちのアプローチは、低レベルの動きを複製することを学び、部分的なデモンストレーションを一貫性のある容易な全体的なポリシーに組み合わせることの両方をすぐに得ることができます。

要約(オリジナル)

Interpretable policy representations like Behavior Trees (BTs) and Dynamic Motion Primitives (DMPs) enable robot skill transfer from human demonstrations, but each faces limitations: BTs require expert-crafted low-level actions, while DMPs lack high-level task logic. We address these limitations by integrating DMP controllers into a BT framework, jointly learning the BT structure and DMP actions from single demonstrations, thereby removing the need for predefined actions. Additionally, by combining BT decision logic with DMP motion generation, our method enhances policy interpretability, modularity, and adaptability for autonomous systems. Our approach readily affords both learning to replicate low-level motions and combining partial demonstrations into a coherent and easy-to-modify overall policy.

arxiv情報

著者 David Cáceres Domínguez,Erik Schaffernicht,Todor Stoyanov
発行日 2025-05-13 14:45:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Beyond Predefined Actions: Integrating Behavior Trees and Dynamic Movement Primitives for Robot Learning from Demonstration はコメントを受け付けていません

Augmented Reality for RObots (ARRO): Pointing Visuomotor Policies Towards Visual Robustness

要約

人間の専門家のデモンストレーションで訓練された視覚運動ポリシーは、最近、幅広いロボット操作タスクで強力なパフォーマンスを示しています。
ただし、これらのポリシーは、バックグラウンドまたはロボットの具体化の変化に起因するドメインシフトに非常に敏感なままであり、一般化能力を制限します。
このホワイトペーパーでは、追加のトレーニングを必要とせずにシーンのタスクに関係なく領域を効率的にマスクするために、ゼロショットのオープンボキャブラリーセグメンテーションとオブジェクト検出モデルを活用する新しいキャリブレーションのない視覚表現であるArroを提示します。
視覚的なディストラクタをフィルタリングし、トレーニングと推論の両方で仮想ガイドをオーバーレイすることにより、アラロはシーンのバリエーションに対する堅牢性を向上させ、追加のデータ収集の必要性を減らします。
シミュレーションと現実世界の両方の環境でのいくつかの卓上操作タスクに関する拡散ポリシーでアラロを広範囲に評価し、OctoやOpenVLAなどのジェネラリストロボットポリシーとの互換性と有効性をさらに実証します。
評価のすべての設定にわたって、ARROは一貫したパフォーマンスの向上を生み出し、選択的なマスキングが異なるオブジェクトを選択できるようにし、セグメンテーション条件に挑戦することさえ堅牢性を示します。
結果を紹介するビデオは、augmentedreality-for-robots.github.ioで入手できます

要約(オリジナル)

Visuomotor policies trained on human expert demonstrations have recently shown strong performance across a wide range of robotic manipulation tasks. However, these policies remain highly sensitive to domain shifts stemming from background or robot embodiment changes, which limits their generalization capabilities. In this paper, we present ARRO, a novel calibration-free visual representation that leverages zero-shot open-vocabulary segmentation and object detection models to efficiently mask out task-irrelevant regions of the scene without requiring additional training. By filtering visual distractors and overlaying virtual guides during both training and inference, ARRO improves robustness to scene variations and reduces the need for additional data collection. We extensively evaluate ARRO with Diffusion Policy on several tabletop manipulation tasks in both simulation and real-world environments, and further demonstrate its compatibility and effectiveness with generalist robot policies, such as Octo and OpenVLA. Across all settings in our evaluation, ARRO yields consistent performance gains, allows for selective masking to choose between different objects, and shows robustness even to challenging segmentation conditions. Videos showcasing our results are available at: augmented-reality-for-robots.github.io

arxiv情報

著者 Reihaneh Mirjalili,Tobias Jülg,Florian Walter,Wolfram Burgard
発行日 2025-05-13 14:46:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Augmented Reality for RObots (ARRO): Pointing Visuomotor Policies Towards Visual Robustness はコメントを受け付けていません

NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance

要約

動的なオープンワールド環境でのナビゲーションの学習は、ロボットにとって重要でありながら挑戦的なスキルです。
ほとんどの以前の方法は、高価な現実世界のデモンストレーションから正確なローカリゼーションとマッピングまたは学習に依存しています。
このホワイトペーパーでは、シミュレーションのみで訓練されたエンドツーエンドのフレームワークであるナビゲーション拡散ポリシー(NAVDP)を提案し、多様な現実世界環境で異なる実施形態にゼロショット転送を可能にすることができます。
NAVDPのネットワークの重要な要素は、拡散ベースの軌道生成と、共有ポリシートランスからエンコードされたローカル観測トークンのみに条件付けられた軌跡選択の批評家機能の組み合わせです。
シミュレーションにおけるグローバル環境の特権情報を考えると、拡散ポリシーを訓練し、対照的なネガティブサンプルで批評家の価値関数ターゲットを策定するために、良質のデモンストレーションを拡大します。
デモンストレーション生成アプローチは、1日あたり約2,500の軌道/GPU、実際のデータ収集よりも20 $ \ Times $が効率的であり、1244シーンで363.2kmの軌跡を備えた大規模なナビゲーションデータセットをもたらします。
このシミュレーションデータセットでトレーニングされたNAVDPは、多様な屋内および屋外環境で、四足動物、車輪付き、およびヒューマノイドロボットで最先端のパフォーマンスと一貫した優れた一般化能力を実現します。
さらに、ガウスのスプラッティングを使用して、ドメイン内からシムへの微調整を行い、SIMからリアルのギャップをさらに橋渡しする予備の試みを提示します。
実験では、このような実際のデータを追加すると、一般化能力を損なうことなく、成功率を30 \%改善できることが示されています。

要約(オリジナル)

Learning navigation in dynamic open-world environments is an important yet challenging skill for robots. Most previous methods rely on precise localization and mapping or learn from expensive real-world demonstrations. In this paper, we propose the Navigation Diffusion Policy (NavDP), an end-to-end framework trained solely in simulation and can zero-shot transfer to different embodiments in diverse real-world environments. The key ingredient of NavDP’s network is the combination of diffusion-based trajectory generation and a critic function for trajectory selection, which are conditioned on only local observation tokens encoded from a shared policy transformer. Given the privileged information of the global environment in simulation, we scale up the demonstrations of good quality to train the diffusion policy and formulate the critic value function targets with contrastive negative samples. Our demonstration generation approach achieves about 2,500 trajectories/GPU per day, 20$\times$ more efficient than real-world data collection, and results in a large-scale navigation dataset with 363.2km trajectories across 1244 scenes. Trained with this simulation dataset, NavDP achieves state-of-the-art performance and consistently outstanding generalization capability on quadruped, wheeled, and humanoid robots in diverse indoor and outdoor environments. In addition, we present a preliminary attempt at using Gaussian Splatting to make in-domain real-to-sim fine-tuning to further bridge the sim-to-real gap. Experiments show that adding such real-to-sim data can improve the success rate by 30\% without hurting its generalization capability.

arxiv情報

著者 Wenzhe Cai,Jiaqi Peng,Yuqiang Yang,Yujian Zhang,Meng Wei,Hanqing Wang,Yilun Chen,Tai Wang,Jiangmiao Pang
発行日 2025-05-13 16:20:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance はコメントを受け付けていません

Optimal Trajectory Planning with Collision Avoidance for Autonomous Vehicle Maneuvering

要約

並列駐車や垂直駐車などの自律運転操作を実行するには、生成されたパスに従うために、継続的な速度とステアリング調整が必要です。
その結果、パスの品質は、車両操作のパフォーマンスの制限要因です。
ほとんどのパス計画アプローチには衝突のないルートの見つけることが含まれますが、最適な軌道計画には、初期状態から最終状態への最良の移行を解決し、運動学モデルで許可されているすべてのパスでのアクションを最小限に抑えます。
ここでは、柔軟で効率的な最適な軌道生成を可能にする連続的な凸最適化に基づいた新しい方法を提案します。
目的は、センサーの盲点を避けながら、モーション要件を満たすために、最速の時間、最短距離、および最も少ないパスセグメントを達成することです。
私たちのアプローチでは、車両の運動学は離散化されたデュビンモデルで表されます。
衝突を回避するために、各ウェイポイントは、車両の範囲を指定するポリゴンに最も近い距離を表す線形不平等によって制約されます。
スムーズで有効な軌道を促進するために、解決された運動学的状態と制御変数は、モデルのコスト関数のペナルティ条件によって制約および正規化され、ステアリング角、加速、速度の制限を含む物理的な制限を実施します。
この論文では、いくつかの駐車場シナリオについて得られた軌跡を分析します。
結果は、提案された手法によって生成された効率的で衝突のない動きを示しています。

要約(オリジナル)

To perform autonomous driving maneuvers, such as parallel or perpendicular parking, a vehicle requires continual speed and steering adjustments to follow a generated path. In consequence, the path’s quality is a limiting factor of the vehicle maneuver’s performance. While most path planning approaches include finding a collision-free route, optimal trajectory planning involves solving the best transition from initial to final states, minimizing the action over all paths permitted by a kinematic model. Here we propose a novel method based on sequential convex optimization, which permits flexible and efficient optimal trajectory generation. The objective is to achieve the fastest time, shortest distance, and fewest number of path segments to satisfy motion requirements, while avoiding sensor blind-spots. In our approach, vehicle kinematics are represented by a discretized Dubins model. To avoid collisions, each waypoint is constrained by linear inequalities representing closest distance of obstacles to a polygon specifying the vehicle’s extent. To promote smooth and valid trajectories, the solved kinematic state and control variables are constrained and regularized by penalty terms in the model’s cost function, which enforces physical restrictions including limits for steering angle, acceleration and speed. In this paper, we analyze trajectories obtained for several parking scenarios. Results demonstrate efficient and collision-free motion generated by the proposed technique.

arxiv情報

著者 Jason Zalev
発行日 2025-05-13 16:36:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Optimal Trajectory Planning with Collision Avoidance for Autonomous Vehicle Maneuvering はコメントを受け付けていません

MUBox: A Critical Evaluation Framework of Deep Machine Unlearning

要約

最近の法的枠組みは、忘れられる権利を義務付けており、ユーザー要求に応じて特定のデータの削除を義務付けています。
機械学習モデルから学習情報を選択的に削除することにより、Machine -Rearningは有望なソリューションとして浮上しました。
このペーパーでは、深い学習における未学習の方法を評価するために設計された包括的なプラットフォームであるMuboxを紹介します。
MUBoxは、11の多様な評価メトリックで6つの実用的なシナリオでテストされた23の高度な未学習技術を統合します。
これにより、研究者と実践者は、(1)さまざまなシナリオにわたるさまざまなマシンの未学習方法の有効性を評価および比較できます。
(2)現在の評価メトリックのパフォーマンスの不十分な影響を調べる。
(3)統一されたフレームワークで学習している機械に関する詳細な比較研究を実施する。
Muboxを活用すると、これらの未学習の方法を深い学習に体系的に評価し、いくつかの重要な洞察を明らかにします。(a)トップティアの会場で公開されたものや、学習の不格な競技の勝者を含む、最先端の未学習方法でさえ、多様なシナリオ全体で一貫性のない有効性を示します。
以前の研究では、ランダムな忘却やクラスごとの学習の不明確などの簡素化された設定に主に焦点を当てており、より困難な未学習のタスクにわたるより広範な評価の必要性を強調しています。
(b)単一の評価メトリックがモデルユーティリティの有効性、効率、保存を包括的にキャプチャできないため、不正なパフォーマンスを評価することは依然として非自明の問題です。
私たちの調査結果は、複数のメトリックを採用して、学習方法のバランスのとれた全体的な評価を実現する必要性を強調しています。
(c)預言の文脈では、私たちの評価は、特定のタイプの中毒攻撃に大きく依存している既存のアプローチの有効性の有意な変動性を明らかにしています。

要約(オリジナル)

Recent legal frameworks have mandated the right to be forgotten, obligating the removal of specific data upon user requests. Machine Unlearning has emerged as a promising solution by selectively removing learned information from machine learning models. This paper presents MUBox, a comprehensive platform designed to evaluate unlearning methods in deep learning. MUBox integrates 23 advanced unlearning techniques, tested across six practical scenarios with 11 diverse evaluation metrics. It allows researchers and practitioners to (1) assess and compare the effectiveness of different machine unlearning methods across various scenarios; (2) examine the impact of current evaluation metrics on unlearning performance; and (3) conduct detailed comparative studies on machine unlearning in a unified framework. Leveraging MUBox, we systematically evaluate these unlearning methods in deep learning and uncover several key insights: (a) Even state-of-the-art unlearning methods, including those published in top-tier venues and winners of unlearning competitions, demonstrate inconsistent effectiveness across diverse scenarios. Prior research has predominantly focused on simplified settings, such as random forgetting and class-wise unlearning, highlighting the need for broader evaluations across more difficult unlearning tasks. (b) Assessing unlearning performance remains a non-trivial problem, as no single evaluation metric can comprehensively capture the effectiveness, efficiency, and preservation of model utility. Our findings emphasize the necessity of employing multiple metrics to achieve a balanced and holistic assessment of unlearning methods. (c) In the context of depoisoning, our evaluation reveals significant variability in the effectiveness of existing approaches, which is highly dependent on the specific type of poisoning attacks.

arxiv情報

著者 Xiang Li,Bhavani Thuraisingham,Wenqi Wei
発行日 2025-05-13 13:50:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG | MUBox: A Critical Evaluation Framework of Deep Machine Unlearning はコメントを受け付けていません

Model Steering: Learning with a Reference Model Improves Generalization Bounds and Scaling Laws

要約

この論文は、$ \ textBf {Model Steering} $という名前の戦略的データ選択または重み付けを通じて、ターゲットモデルのトレーニングをガイドおよび強化するための参照として訓練されたモデルを使用する新たな学習パラダイムを形式化します。
大規模な基礎モデルのトレーニングなど、さまざまなコンテキストでアドホック方法が使用されていますが、その根本的な原則は十分に理解されていないままであり、最適なパフォーマンスにつながります。
この作業では、$ \ textbf {drrhoリスク最小化} $と呼ばれるモデルステアリングの理論主導のフレームワークを提案します。
一般化分析を通じて、このアプローチが参照モデルなしでトレーニングと比較して一般化とデータの効率を改善する理由についての理論的洞察を提供します。
私たちの知る限り、このような理論的洞察が新しい学習パラダイムに対して提供されるのはこれが初めてであり、モデルステアリングの理解と実践を大幅に向上させます。
これらの洞察と対照学習とDROの関係に基づいて、DRRHO-Clipと呼ばれる参照モデルを使用して、対照的な言語イメージ前登録(CLIP)の新しい方法を紹介します。
広範な実験は、理論的洞察を検証し、参照モデルのないクリップと比較して優れたスケーリング法を明らかにし、既存のヒューリスティックアプローチに対するその強さを示します。

要約(オリジナル)

This paper formalizes an emerging learning paradigm that uses a trained model as a reference to guide and enhance the training of a target model through strategic data selection or weighting, named $\textbf{model steering}$. While ad-hoc methods have been used in various contexts, including the training of large foundation models, its underlying principles remain insufficiently understood, leading to sub-optimal performance. In this work, we propose a theory-driven framework for model steering called $\textbf{DRRho risk minimization}$, which is rooted in Distributionally Robust Optimization (DRO). Through a generalization analysis, we provide theoretical insights into why this approach improves generalization and data efficiency compared to training without a reference model. To the best of our knowledge, this is the first time such theoretical insights are provided for the new learning paradigm, which significantly enhance our understanding and practice of model steering. Building on these insights and the connection between contrastive learning and DRO, we introduce a novel method for Contrastive Language-Image Pretraining (CLIP) with a reference model, termed DRRho-CLIP. Extensive experiments validate the theoretical insights, reveal a superior scaling law compared to CLIP without a reference model, and demonstrate its strength over existing heuristic approaches.

arxiv情報

著者 Xiyuan Wei,Ming Lin,Fanjiang Ye,Fengguang Song,Liangliang Cao,My T. Thai,Tianbao Yang
発行日 2025-05-13 14:01:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Model Steering: Learning with a Reference Model Improves Generalization Bounds and Scaling Laws はコメントを受け付けていません

Clustering of Incomplete Data via a Bipartite Graph Structure

要約

データクラスタリングのグラフ学習には、さまざまなグラフ構造を介してさまざまなスペクトルと構造の制約を組み込んだグラフ学習にはさまざまなアプローチがあります。
いくつかの方法は、ノードがセンターとメンバーの2つのクラスに分割される二部グラフモデルに依存しています。
これらのモデルは通常、メンバーノードからの観測に加えて、センターノードのデータへのアクセスを必要とします。
ただし、多くの実際のシナリオでは、このような追加データが常に利用できるとは限りません。
さらに、グラフ学習用の一般的なガウスモデルは、金融市場で一般的な重尾分布を使用したデータのモデリングにおける有効性が限られていることを実証しています。
この論文では、これらの課題に対処する二部グラフモデルに基づいてクラスタリング方法を提案します。
まず、センターノードに関する情報を必要とせずに、不完全なデータからクラスターを推測できます。
第二に、重い尾のデータを効果的に処理するように設計されています。
実際の財務データを使用した数値実験は、データクラスタリングの提案方法の効率を検証します。

要約(オリジナル)

There are various approaches to graph learning for data clustering, incorporating different spectral and structural constraints through diverse graph structures. Some methods rely on bipartite graph models, where nodes are divided into two classes: centers and members. These models typically require access to data for the center nodes in addition to observations from the member nodes. However, such additional data may not always be available in many practical scenarios. Moreover, popular Gaussian models for graph learning have demonstrated limited effectiveness in modeling data with heavy-tailed distributions, which are common in financial markets. In this paper, we propose a clustering method based on a bipartite graph model that addresses these challenges. First, it can infer clusters from incomplete data without requiring information about the center nodes. Second, it is designed to effectively handle heavy-tailed data. Numerical experiments using real financial data validate the efficiency of the proposed method for data clustering.

arxiv情報

著者 Amirhossein Javaheri,Daniel P. Palomar
発行日 2025-05-13 14:06:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Clustering of Incomplete Data via a Bipartite Graph Structure はコメントを受け付けていません