Minimally sufficient structures for information-feedback policies

要約

このホワイトペーパーでは、ロボットが埋め込まれてやり取りされている物理的な世界で、望ましい結果を必要とするロボットタスクを検討します。
この目的を達成するには、物理​​的な世界の有用な表現とフィルターの状態をめぐるポリシーを維持するフィルターを設計する必要があります。
フィルターは、限られたセンシング、メモリ、および計算に基づいた物理世界のロボットの視点と見なされ、情報状態の空間を介した遷移システムとして表されます。
この目的のために、相互作用は、センサーマッピングと情報フィードバックポリシーを通じて、内部および外部システム、フィルター、および物理世界の結合に起因します。
このセットアップでは、特定のタスクを達成するために、十分な構造、つまり十分な内部システムとセンサーを探します。
これらの構造が、内部システムの状態で存在するように定義できる情報フィードバックポリシーを満たすために必要かつ十分な条件を確立します。
また、穏やかな仮定の下では、アクションと観測の履歴について記述されている特定の計画/ポリシーを表すことができる最小限の内部システムが存在し、ユニークであることを示しています。
最後に、結果が適用され、多角形の環境での距離最適なナビゲーションの十分な構造を決定します。

要約(オリジナル)

In this paper, we consider robotic tasks which require a desirable outcome to be achieved in the physical world that the robot is embedded in and interacting with. Accomplishing this objective requires designing a filter that maintains a useful representation of the physical world and a policy over the filter states. A filter is seen as the robot’s perspective of the physical world based on limited sensing, memory, and computation and it is represented as a transition system over a space of information states. To this end, the interactions result from the coupling of an internal and an external system, a filter, and the physical world, respectively, through a sensor mapping and an information-feedback policy. Within this setup, we look for sufficient structures, that is, sufficient internal systems and sensors, for accomplishing a given task. We establish necessary and sufficient conditions for these structures to satisfy for information-feedback policies that can be defined over the states of an internal system to exist. We also show that under mild assumptions, minimal internal systems that can represent a particular plan/policy described over the action-observation histories exist and are unique. Finally, the results are applied to determine sufficient structures for distance-optimal navigation in a polygonal environment.

arxiv情報

著者 Basak Sakcak,Vadim K. Weinstein,Kalle G. Timperi,Steven M. LaValle
発行日 2025-02-19 16:16:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Minimally sufficient structures for information-feedback policies はコメントを受け付けていません

Soft Synergies: Model Order Reduction of Hybrid Soft-Rigid Robots via Optimal Strain Parameterization

要約

ソフトロボットは、厳格なロボットよりも顕著な適応性と安全性の利点を提供しますが、複雑で非線形のダイナミクスのモデリングは依然として困難です。
ひずみベースのモデルは最近、そのようなシステムを説明する有望な候補として浮上していますが、それらは高次元的で時間がかかる傾向があります。
このホワイトペーパーでは、ひずみベースのモデリングと適切な直交分解(POD)を組み合わせることにより、ソフトおよびハイブリッドロボットの新しいモデル順序削減アプローチを紹介します。
このメソッドは、シミュレーションデータから最適な結合ひずみ基底関数、または機械的相乗効果を識別し、最小数の一般化された座標でソフトロボット構成の説明を可能にします。
縮小されたオーダーモデル(ROM)は、正確性を維持しながら、構成空間の大幅な次元削減を達成します。
厳密なテストは、静的および動的条件下でのソフトマニピュレーターのROMの補間と外挿機能を示しています。
このアプローチは、ヘビのような過剰に冗長な剛性マニピュレーターと、柔らかく硬いコンポーネントを備えた閉鎖鎖システムでさらに検証され、その幅広い適用性を示しています。
さらに、このアプローチは、2つの位置マーカーのみを使用して実際の6アクチュエーターソフトマニピュレーターの形状推定のために活用され、その実用性を示しています。
最後に、ROMの動的および静的動作は、並列ハイブリッドソフトリギッドシステムに対して実験的に検証され、高次モデル(HOM)と実際のシステムを表す際のその効果を強調します。
このポッドベースのROMは、重要な計算スピードアップを提供し、複雑なソフトおよびハイブリッドロボットのリアルタイムシミュレーションと制御への道を開いています。

要約(オリジナル)

Soft robots offer remarkable adaptability and safety advantages over rigid robots, but modeling their complex, nonlinear dynamics remains challenging. Strain-based models have recently emerged as a promising candidate to describe such systems, however, they tend to be high-dimensional and time-consuming. This paper presents a novel model order reduction approach for soft and hybrid robots by combining strain-based modeling with Proper Orthogonal Decomposition (POD). The method identifies optimal coupled strain basis functions — or mechanical synergies — from simulation data, enabling the description of soft robot configurations with a minimal number of generalized coordinates. The reduced order model (ROM) achieves substantial dimensionality reduction in the configuration space while preserving accuracy. Rigorous testing demonstrates the interpolation and extrapolation capabilities of the ROM for soft manipulators under static and dynamic conditions. The approach is further validated on a snake-like hyper-redundant rigid manipulator and a closed-chain system with soft and rigid components, illustrating its broad applicability. Moreover, the approach is leveraged for shape estimation of a real six-actuator soft manipulator using only two position markers, showcasing its practical utility. Finally, the ROM’s dynamic and static behavior is validated experimentally against a parallel hybrid soft-rigid system, highlighting its effectiveness in representing the High-Order Model (HOM) and the real system. This POD-based ROM offers significant computational speed-ups, paving the way for real-time simulation and control of complex soft and hybrid robots.

arxiv情報

著者 Abdulaziz Y. Alkayas,Anup Teejo Mathew,Daniel Feliu-Talegon,Ping Deng,Thomas George Thuruthel,Federico Renda
発行日 2025-02-19 16:23:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Soft Synergies: Model Order Reduction of Hybrid Soft-Rigid Robots via Optimal Strain Parameterization はコメントを受け付けていません

The NavINST Dataset for Multi-Sensor Autonomous Navigation

要約

Navinst Laboratoryは、都市環境のさまざまなロードテスト軌跡から包括的な多感覚データセットを開発しました。
このデータセットには、複数のコマーシャルグレードのIMUSとハイエンドの戦術グレードIMUが含まれています。
さらに、ソリッドステートリダーなどの幅広い知覚ベースのセンサーが含まれています。これは、最初のデータセットの1つであり、機械的なLIDAR、4つの電子的なスキャンレーダー、単眼カメラ、2つのステレオカメラです。
データセットには、車両の走行距離計から派生した前方速度測定と、正確に後処理されたハイエンドGNS/IMUデータも含まれており、正確なグラウンドトゥルースポジショニングとナビゲーション情報を提供します。
NAVINSTデータセットは、高精度のポジショニング、ナビゲーション、マッピング、コンピュータービジョン、多感覚融合の高度な研究をサポートするように設計されています。
自動運転車の堅牢なアルゴリズムの開発と検証に最適なリッチなマルチセンサーデータを提供します。
最後に、それはROSと完全に統合されており、研究コミュニティの使いやすさとアクセシビリティを確保します。
完全なデータセットおよび開発ツールは、https://navinst.github.ioで入手できます。

要約(オリジナル)

The NavINST Laboratory has developed a comprehensive multisensory dataset from various road-test trajectories in urban environments, featuring diverse lighting conditions, including indoor garage scenarios with dense 3D maps. This dataset includes multiple commercial-grade IMUs and a high-end tactical-grade IMU. Additionally, it contains a wide array of perception-based sensors, such as a solid-state LiDAR – making it one of the first datasets to do so – a mechanical LiDAR, four electronically scanning RADARs, a monocular camera, and two stereo cameras. The dataset also includes forward speed measurements derived from the vehicle’s odometer, along with accurately post-processed high-end GNSS/IMU data, providing precise ground truth positioning and navigation information. The NavINST dataset is designed to support advanced research in high-precision positioning, navigation, mapping, computer vision, and multisensory fusion. It offers rich, multi-sensor data ideal for developing and validating robust algorithms for autonomous vehicles. Finally, it is fully integrated with the ROS, ensuring ease of use and accessibility for the research community. The complete dataset and development tools are available at https://navinst.github.io.

arxiv情報

著者 Paulo Ricardo Marques de Araujo,Eslam Mounier,Qamar Bader,Emma Dawson,Shaza I. Kaoud Abdelaziz,Ahmed Zekry,Mohamed Elhabiby,Aboelmagd Noureldin
発行日 2025-02-19 16:31:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | The NavINST Dataset for Multi-Sensor Autonomous Navigation はコメントを受け付けていません

Traffic Scene Generation from Natural Language Description for Autonomous Vehicles with Large Language Model

要約

テキストからスセンの生成は、通常、所定のパスに沿って重要なシナリオを生成することにより、環境の多様性を制限します。
これらの制約に対処するために、大規模な言語モデル(LLM)を活用して、自然言語の説明に基づいてCarlaシミュレーターの多様なトラフィックシナリオを自律的に生成する新しいテキストからトラフィックへのシーンフレームワークを提案します。
パイプラインは、いくつかの重要な段階で構成されています。(1)自然言語の入力が分解される迅速な分析。
(2)データベースから最適な道路を選択する道路検索。
(3)エージェントの計画、詳細なエージェントの種類と行動。
(4)シナリオ要件に合わせて道路のランキング、スコアリングロード。
(5)シミュレータで計画されたシナリオをレンダリングするシーン生成。
このフレームワークは、日常的なトラフィックシナリオと重要なトラフィックシナリオの両方をサポートし、その適用性を高めます。
私たちのアプローチは、エージェントの計画と道路の選択を多様化するだけでなく、SafeBenchの平均衝突率を8%から3.5%に大幅に削減することを実証します。
さらに、私たちのフレームワークは、キャプションタスクを運転するためのナレーションと推論を改善します。
当社の貢献とリソースは、https://basiclab.github.io/ttsgで公開されています。

要約(オリジナル)

Text-to-scene generation typically limits environmental diversity by generating key scenarios along predetermined paths. To address these constraints, we propose a novel text-to-traffic scene framework that leverages a large language model (LLM) to autonomously generate diverse traffic scenarios for the CARLA simulator based on natural language descriptions. Our pipeline comprises several key stages: (1) Prompt Analysis, where natural language inputs are decomposed; (2) Road Retrieval, selecting optimal roads from a database; (3) Agent Planning, detailing agent types and behaviors; (4) Road Ranking, scoring roads to match scenario requirements; and (5) Scene Generation, rendering the planned scenarios in the simulator. This framework supports both routine and critical traffic scenarios, enhancing its applicability. We demonstrate that our approach not only diversifies agent planning and road selection but also significantly reduces the average collision rate from 8% to 3.5% in SafeBench. Additionally, our framework improves narration and reasoning for driving captioning tasks. Our contributions and resources are publicly available at https://basiclab.github.io/TTSG.

arxiv情報

著者 Bo-Kai Ruan,Hao-Tang Tsui,Yung-Hui Li,Hong-Han Shuai
発行日 2025-02-19 16:32:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Traffic Scene Generation from Natural Language Description for Autonomous Vehicles with Large Language Model はコメントを受け付けていません

Uncertainty quantification for Markov chains with application to temporal difference learning

要約

マルコフチェーンは、統計的な機械学習の基本であり、マルコフチェーンモンテカルロ(MCMC)サンプリングや時間的差異(TD)学習(RL)などの主要な方法論を支えています。
それらの広範な使用を考えると、収束、不確実性、および安定性に関する厳格な確率的保証を確立することが重要です。
この作業では、マルコフチェーンのベクトルおよびマトリックス値関数の新しい、高次元濃度の不平等とベリーエッシーンの境界を開発し、従属データを処理するための既存の理論ツールの重要な制限に対処します。
これらの結果を活用して、RLのポリシー評価に広く使用されている方法であるTD学習アルゴリズムを分析します。
私たちの分析は、漸近的分散を対数因子に合わせて一致させる鋭い高確率の一貫性保証をもたらします。
さらに、凸距離で測定されたTD推定器のガウス近似のために、$ o(t^{ – \ frac {1} {4} {4}} \ log t)$分布収束率を確立します。
これらの調査結果は、RLアルゴリズムの統計的推論に関する新しい洞察を提供し、古典的な確率的近似理論と最新の強化学習アプリケーションの間のギャップを埋めます。

要約(オリジナル)

Markov chains are fundamental to statistical machine learning, underpinning key methodologies such as Markov Chain Monte Carlo (MCMC) sampling and temporal difference (TD) learning in reinforcement learning (RL). Given their widespread use, it is crucial to establish rigorous probabilistic guarantees on their convergence, uncertainty, and stability. In this work, we develop novel, high-dimensional concentration inequalities and Berry-Esseen bounds for vector- and matrix-valued functions of Markov chains, addressing key limitations in existing theoretical tools for handling dependent data. We leverage these results to analyze the TD learning algorithm, a widely used method for policy evaluation in RL. Our analysis yields a sharp high-probability consistency guarantee that matches the asymptotic variance up to logarithmic factors. Furthermore, we establish a $O(T^{-\frac{1}{4}}\log T)$ distributional convergence rate for the Gaussian approximation of the TD estimator, measured in convex distance. These findings provide new insights into statistical inference for RL algorithms, bridging the gaps between classical stochastic approximation theory and modern reinforcement learning applications.

arxiv情報

著者 Weichen Wu,Yuting Wei,Alessandro Rinaldo
発行日 2025-02-19 15:33:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Uncertainty quantification for Markov chains with application to temporal difference learning はコメントを受け付けていません

Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class

要約

クラス分布の不均衡の処理表形式データ上の分類器を構築することは、長年の関心の問題となっています。
人気のあるアプローチの1つは、合成されたデータを使用してトレーニングデータセットを増強することです。
古典的な増強技術は、既存の少数派クラスの例の線形補間に限定されていましたが、最近、より高い容量の深い生成モデルがより大きな約束を提供しています。
ただし、深い生成モデルを構築する際のクラス分布における不均衡の処理も困難な問題であり、不均衡な分類器モデルトレーニングとして広範囲に研究されていません。
最先端の深い生成モデルは、多数派の例よりもかなり低品質の少数派の例をもたらすことを示しています。
%このホワイトペーパーでは、少数派クラスを過小評価する生成モデルの不均衡なデータトレーニングを訓練した不均衡なデータセットを観察することから始めます。
少数派と多数派の分布が重複する地域のクラスを導入することにより、バイナリクラスのラベルを三元クラスラベルに変換するという新しい手法を提案します。
トレーニングセットのこの前処理だけで、いくつかの最先端の拡散およびGANベースのモデルにまたがるデータの品質が大幅に向上することを示します。
合成データを使用して分類器をトレーニングしている間、トレーニングデータからオーバーラップクラスを削除し、精度の向上の理由を正当化します。
4つの実際のデータセット、5つの異なる分類子、5つの生成モデルで広範な実験を実行し、この方法が最新モデルのシンセサイザーパフォーマンスだけでなく、分類器のパフォーマンスも強化することを実証します。

要約(オリジナル)

Handling imbalance in class distribution when building a classifier over tabular data has been a problem of long-standing interest. One popular approach is augmenting the training dataset with synthetically generated data. While classical augmentation techniques were limited to linear interpolation of existing minority class examples, recently higher capacity deep generative models are providing greater promise. However, handling of imbalance in class distribution when building a deep generative model is also a challenging problem, that has not been studied as extensively as imbalanced classifier model training. We show that state-of-the-art deep generative models yield significantly lower-quality minority examples than majority examples. %In this paper, we start with the observation that imbalanced data training of generative models trained imbalanced dataset which under-represent the minority class. We propose a novel technique of converting the binary class labels to ternary class labels by introducing a class for the region where minority and majority distributions overlap. We show that just this pre-processing of the training set, significantly improves the quality of data generated spanning several state-of-the-art diffusion and GAN-based models. While training the classifier using synthetic data, we remove the overlap class from the training data and justify the reasons behind the enhanced accuracy. We perform extensive experiments on four real-life datasets, five different classifiers, and five generative models demonstrating that our method enhances not only the synthesizer performance of state-of-the-art models but also the classifier performance.

arxiv情報

著者 Annie D’souza,Swetha M,Sunita Sarawagi
発行日 2025-02-19 15:36:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class はコメントを受け付けていません

Mixup Regularization: A Probabilistic Perspective

要約

近年、混合の正則化は、トレーニングデータの凸の組み合わせに関するトレーニングにより、ディープラーニングモデルの一般化パフォーマンスを改善する効果的な方法として人気を博しています。
多くの混合バリアントが調査されていますが、条件付き密度の推定と確率的機械学習に対する技術の適切な採用は、比較的未開拓のままです。
この作業では、条件付き密度推定タスクに適した確率的融合に基づいた混合の正規化のための新しいフレームワークを紹介します。
指数ファミリーのメンバーに従って配布されたデータの場合、尤度関数を対数線形プーリングを使用して分析的に融合できることを示します。
さらに、確率的混合の拡張を提案します。これにより、ニューラルネットワークの任意の中間層での入力の融合が可能になります。
標準の混合バリアントとのアプローチを比較する理論分析を提供します。
合成および実際のデータセットの経験的結果は、既存の混合バリアントと比較して、提案されたフレームワークの利点を示しています。

要約(オリジナル)

In recent years, mixup regularization has gained popularity as an effective way to improve the generalization performance of deep learning models by training on convex combinations of training data. While many mixup variants have been explored, the proper adoption of the technique to conditional density estimation and probabilistic machine learning remains relatively unexplored. This work introduces a novel framework for mixup regularization based on probabilistic fusion that is better suited for conditional density estimation tasks. For data distributed according to a member of the exponential family, we show that likelihood functions can be analytically fused using log-linear pooling. We further propose an extension of probabilistic mixup, which allows for fusion of inputs at an arbitrary intermediate layer of the neural network. We provide a theoretical analysis comparing our approach to standard mixup variants. Empirical results on synthetic and real datasets demonstrate the benefits of our proposed framework compared to existing mixup variants.

arxiv情報

著者 Yousef El-Laham,Niccolo Dalmasso,Svitlana Vyetrenko,Vamsi Potluru,Manuela Veloso
発行日 2025-02-19 15:39:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Mixup Regularization: A Probabilistic Perspective はコメントを受け付けていません

Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets

要約

合成データは、ヘルスケアやファイナンスなどのセクターのプライバシー強化テクノロジー(PET)として注目を集めています。
実際のアプリケーションで合成データを使用する場合、保護保証を提供することが重要です。
文献では、表形式データに対して2つのファミリーのアプローチが提案されています。一方で、類似性に基づいた方法は、トレーニングと合成データの類似性のレベルを見つけることを目的としています。
実際、生成されたデータが一貫して列車データと同一である場合、生成されたデータが一貫してあまりにも同一である場合、プライバシー違反が発生する可能性があります。
一方、攻撃ベースの方法は、合成データセットに対する意図的な攻撃を引き起こします。
これらの攻撃の成功率は、合成データセットの安全性を明らかにしています。
この論文では、より代表的なスペースにデータを埋め込むことにより、合成データセットのプライバシー評価を改善する対照的な方法を紹介します。
これは、多数のデータ型と属性を取り巻く障害を克服します。
また、類似性測定および攻撃ベクトルとして直感的な距離メトリックを使用することもできます。
公開されているデータセットを使用した一連の実験では、対照的な学習ベースの埋め込みを使用する場合と使用せずに、類似性ベースの方法と攻撃ベースの方法のパフォーマンスを比較します。
私たちの結果は、GDPRが言及するプライバシーの条件を明示的にモデル化するより高度なメトリックと同様に、比較的効率的で実装しやすいプライバシーメトリックが等しくパフォーマンスできることを示しています。

要約(オリジナル)

Synthetic data has garnered attention as a Privacy Enhancing Technology (PET) in sectors such as healthcare and finance. When using synthetic data in practical applications, it is important to provide protection guarantees. In the literature, two family of approaches are proposed for tabular data: on the one hand, Similarity-based methods aim at finding the level of similarity between training and synthetic data. Indeed, a privacy breach can occur if the generated data is consistently too similar or even identical to the train data. On the other hand, Attack-based methods conduce deliberate attacks on synthetic datasets. The success rates of these attacks reveal how secure the synthetic datasets are. In this paper, we introduce a contrastive method that improves privacy assessment of synthetic datasets by embedding the data in a more representative space. This overcomes obstacles surrounding the multitude of data types and attributes. It also makes the use of intuitive distance metrics possible for similarity measurements and as an attack vector. In a series of experiments with publicly available datasets, we compare the performances of similarity-based and attack-based methods, both with and without use of the contrastive learning-based embeddings. Our results show that relatively efficient, easy to implement privacy metrics can perform equally well as more advanced metrics explicitly modeling conditions for privacy referred to by the GDPR.

arxiv情報

著者 Milton Nicolás Plasencia Palacios,Sebastiano Saccani,Gabriele Sgroi,Alexander Boudewijn,Luca Bortolussi
発行日 2025-02-19 15:52:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG | Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets はコメントを受け付けていません

Evaluation of EAS directions based on TAIGA HiSCORE data using fully connected neural networks

要約

広範なエアシャワーの方向を使用してガンマ量子の源を決定し、一次粒子のエネルギーを推定する上で重要な役割を果たします。
Taiga実験の非イメージングチェレンコフ検出器ステーションヒスコアの配列からのデータは、光電子の数と検出時間を登録して、シャワーの方向を高い精度で推定することができます。
この作業では、シャワーの方向推定値を取得するために、ガンマQuantaのモンテカルロシミュレーションTaiga Hiscoreデータでトレーニングされた人工ニューラルネットワークを使用します。
ニューラルネットワークは、いくつかのヒスコアステーションからの部分的なデータを入力として使用して、スキップ接続を備えた多層パーセプトロンです。
複合推定値は、ニューラルネットワークによる複数の個々の推定値から導き出されます。
最初の段階で得られた方向推定値を使用して、入力データを変換して推定値を改善する2段階アルゴリズムを適用します。
最終推定値の平均誤差は0.25度未満です。
このアプローチは、Taiga実験で使用されるいくつかのタイプの検出器からのデータのマルチモーダル分析に使用されます。

要約(オリジナル)

The direction of extensive air showers can be used to determine the source of gamma quanta and plays an important role in estimating the energy of the primary particle. The data from an array of non-imaging Cherenkov detector stations HiSCORE in the TAIGA experiment registering the number of photoelectrons and detection time can be used to estimate the shower direction with high accuracy. In this work, we use artificial neural networks trained on Monte Carlo-simulated TAIGA HiSCORE data for gamma quanta to obtain shower direction estimates. The neural networks are multilayer perceptrons with skip connections using partial data from several HiSCORE stations as inputs; composite estimates are derived from multiple individual estimates by the neural networks. We apply a two-stage algorithm in which the direction estimates obtained in the first stage are used to transform the input data and refine the estimates. The mean error of the final estimates is less than 0.25 degrees. The approach will be used for multimodal analysis of the data from several types of detectors used in the TAIGA experiment.

arxiv情報

著者 A. P. Kryukov,S. P. Polyakov,Yu. Yu. Dubenskaya,E. O. Gres,E. B. Postnikov,P. A. Volchugov,D. P. Zhurov
発行日 2025-02-19 16:12:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: astro-ph.HE, astro-ph.IM, cs.LG | Evaluation of EAS directions based on TAIGA HiSCORE data using fully connected neural networks はコメントを受け付けていません

Generalization bounds for mixing processes via delayed online-to-PAC conversions

要約

非I.I.Dで統計学習アルゴリズムの一般化誤差を研究します。
設定、トレーニングデータが固定混合プロセスからサンプリングされます。
遅延フィードバックを伴うオンライン学習の削減に基づいて、このシナリオの分析フレームワークを開発します。
特に、後悔のあるオンライン学習アルゴリズムの存在(遅延フィードバックを伴うオンライン学習の特別に構築されたゲームにおける固定統計学習アルゴリズムに対して)を意味することを示しています)は、データシーケンスがあっても、上記の統計学習方法の低い一般化エラーを意味することを示しています。
混合時系列からサンプリング。
レートは、オンライン学習ゲームの遅延量と連続したデータポイント間の依存度との間のトレードオフを示しています。
プロセスの混合時間の。

要約(オリジナル)

We study the generalization error of statistical learning algorithms in a non-i.i.d. setting, where the training data is sampled from a stationary mixing process. We develop an analytic framework for this scenario based on a reduction to online learning with delayed feedback. In particular, we show that the existence of an online learning algorithm with bounded regret (against a fixed statistical learning algorithm in a specially constructed game of online learning with delayed feedback) implies low generalization error of said statistical learning method even if the data sequence is sampled from a mixing time series. The rates demonstrate a trade-off between the amount of delay in the online learning game and the degree of dependence between consecutive data points, with near-optimal rates recovered in a number of well-studied settings when the delay is tuned appropriately as a function of the mixing time of the process.

arxiv情報

著者 Baptiste Abeles,Eugenio Clerico,Gergely Neu
発行日 2025-02-19 16:17:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Generalization bounds for mixing processes via delayed online-to-PAC conversions はコメントを受け付けていません