Signature Isolation Forest


Functional Isolation Forest (FIF)は、機能データ用に設計された最新の異常検出(AD)アルゴリズムである。FIFは、線形内積を通して描画された辞書に各曲線観察を投影することにより異常スコアを計算する、ツリー分割手順に依存する。このような線形内積と辞書は、アルゴリズムの性能に大きく影響する先験的な選択であり、特に複雑なデータセットでは信頼できない結果につながる可能性がある。本研究では、ラフパス理論のシグネチャ変換を活用した新しいADアルゴリズムクラスである「シグネチャ分離フォレスト(Signature Isolation Forest)」を導入することで、これらの課題に対処する。我々の目的は、特にFIF内積の線形性と辞書の選択をターゲットとした2つのアルゴリズムの提案を通じて、FIFによって課される制約を取り除くことである。我々の手法の妥当性を示す実世界応用ベンチマークを含むいくつかの数値実験を提供する。


Functional Isolation Forest (FIF) is a recent state-of-the-art Anomaly Detection (AD) algorithm designed for functional data. It relies on a tree partition procedure where an abnormality score is computed by projecting each curve observation on a drawn dictionary through a linear inner product. Such linear inner product and the dictionary are a priori choices that highly influence the algorithm’s performances and might lead to unreliable results, particularly with complex datasets. This work addresses these challenges by introducing \textit{Signature Isolation Forest}, a novel AD algorithm class leveraging the rough path theory’s signature transform. Our objective is to remove the constraints imposed by FIF through the proposition of two algorithms which specifically target the linearity of the FIF inner product and the choice of the dictionary. We provide several numerical experiments, including a real-world applications benchmark showing the relevance of our methods.


著者 Marta Campi,Guillaume Staerman,Gareth W. Peters,Tomoko Matsui
発行日 2024-10-03 17:05:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG, stat.ML | コメントする

Fair Allocation in Dynamic Mechanism Design




We consider a dynamic mechanism design problem where an auctioneer sells an indivisible good to groups of buyers in every round, for a total of $T$ rounds. The auctioneer aims to maximize their discounted overall revenue while adhering to a fairness constraint that guarantees a minimum average allocation for each group. We begin by studying the static case ($T=1$) and establish that the optimal mechanism involves two types of subsidization: one that increases the overall probability of allocation to all buyers, and another that favors the groups which otherwise have a lower probability of winning the item. We then extend our results to the dynamic case by characterizing a set of recursive functions that determine the optimal allocation and payments in each round. Notably, our results establish that in the dynamic case, the seller, on the one hand, commits to a participation bonus to incentivize truth-telling, and on the other hand, charges an entry fee for every round. Moreover, the optimal allocation once more involves subsidization, which its extent depends on the difference in future utilities for both the seller and buyers when allocating the item to one group versus the others. Finally, we present an approximation scheme to solve the recursive equations and determine an approximately optimal and fair allocation efficiently.


著者 Alireza Fallah,Michael I. Jordan,Annie Ulichney
発行日 2024-10-03 17:05:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.GT, cs.LG, econ.TH | コメントする

Highly Adaptive Ridge


本論文では、Highly Adaptive Ridge (HAR)を提案する。これは、平方可積分断面導関数を持つ右連続関数のクラスにおいて、$n^{-1/3}$無次元L2収束率を達成する回帰手法である。これはノンパラメトリックな大きな関数クラスで、特に表データに適している。HARはまさに、飽和0次テンソル積スプライン基底展開に基づく特定のデータ適応カーネルを持つカーネルリッジ回帰である。シミュレーションと実データを用いて我々の理論を確認する。特に小さなデータセットにおいて、最新のアルゴリズムよりも優れた性能を実証する。


In this paper we propose the Highly Adaptive Ridge (HAR): a regression method that achieves a $n^{-1/3}$ dimension-free L2 convergence rate in the class of right-continuous functions with square-integrable sectional derivatives. This is a large nonparametric function class that is particularly appropriate for tabular data. HAR is exactly kernel ridge regression with a specific data-adaptive kernel based on a saturated zero-order tensor-product spline basis expansion. We use simulation and real data to confirm our theory. We demonstrate empirical performance better than state-of-the-art algorithms for small datasets in particular.


著者 Alejandro Schuler,Alexander Hagemeister,Mark van der Laan
発行日 2024-10-03 17:06:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG, stat.ML | コメントする

Understanding and Mitigating Miscalibration in Prompt Tuning for Vision-Language Models


機械学習モデルを実世界に安全に展開するためには、信頼性の校正が重要である。しかし、CLIPのような視覚言語モデルにおけるこのような問題は、特にファインチューニングの後では、十分に対処されていない。一方、KgCoOpの正則化は、信頼度を維持するが、精度が向上するため、基本クラスの信頼度が低下する。この観察結果にヒントを得て、我々は動的外れ値正則化(Dynamic Outlier Regularization: DOR)を導入し、微調整後の基本クラスと新クラスの両方における信頼度の較正を保証する。特に、大規模な語彙からサンプリングされた(基本クラスではなく)新しいテキストラベルの特徴偏差を最小化することを提案する。事実上、DORは、基本クラスに対する制約を緩和する一方で、新しいラベルに対するテキスト発散の増大を防ぐ。広範な実験により、DORは基本クラスと新規クラスに対する現在の微調整手法の適合性能を向上できることが実証された。


Confidence calibration is critical for the safe deployment of machine learning models in the real world. However, such issue in vision-language models like CLIP, particularly after fine-tuning, has not been fully addressed. In this work, we demonstrate that existing prompt tuning methods usually lead to a trade-off of calibration between base and new classes: the cross-entropy loss in CoOp causes overconfidence in new classes by increasing textual label divergence, whereas the regularization of KgCoOp maintains the confidence level but results in underconfidence in base classes due to the improved accuracy. Inspired by the observations, we introduce Dynamic Outlier Regularization (DOR) to ensure the confidence calibration on both base and new classes after fine-tuning. In particular, we propose to minimize the feature deviation of novel textual labels (instead of base classes) sampled from a large vocabulary. In effect, DOR prevents the increase in textual divergence for new labels while easing restrictions on base classes. Extensive experiments demonstrate that DOR can enhance the calibration performance of current fine-tuning methods on base and new classes.


著者 Shuoyuan Wang,Yixuan Li,Hongxin Wei
発行日 2024-10-03 17:06:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG | コメントする

Collaborative learning of common latent representations in routinely collected multivariate ICU physiological signals


集中治療室(ICU)では、多変量の時系列データが豊富に存在するため、機械学習(ML)を用いて患者の表現型解析を強化する機会がある。電子カルテ(EHR)に焦点を当てた先行研究とは対照的に、ここでは日常的に収集される生理学的時系列データを用いた表現型分類のためのMLアプローチを提案する。我々の新しいアルゴリズムは、患者間で共通の生理学的状態を識別するために、協調フィルタリングの概念とLong Short-Term Memory (LSTM)ネットワークを統合する。脳損傷患者における頭蓋内圧亢進(IH)検出のために実世界のICU臨床データでテストしたところ、我々の手法は曲線下面積(AUC)0.889、平均精度(AP)0.725を達成した。さらに、我々のアルゴリズムは、生理学的信号のより構造化された潜在的表現の学習において、オートエンコーダを凌駕した。これらの知見は、日常的に収集される多変量時系列を活用して臨床治療を改善する、患者の表現型決定に我々の手法が有望であることを強調している。


In Intensive Care Units (ICU), the abundance of multivariate time series presents an opportunity for machine learning (ML) to enhance patient phenotyping. In contrast to previous research focused on electronic health records (EHR), here we propose an ML approach for phenotyping using routinely collected physiological time series data. Our new algorithm integrates Long Short-Term Memory (LSTM) networks with collaborative filtering concepts to identify common physiological states across patients. Tested on real-world ICU clinical data for intracranial hypertension (IH) detection in patients with brain injury, our method achieved an area under the curve (AUC) of 0.889 and average precision (AP) of 0.725. Moreover, our algorithm outperforms autoencoders in learning more structured latent representations of the physiological signals. These findings highlight the promise of our methodology for patient phenotyping, leveraging routinely collected multivariate time series to improve clinical care practices.


著者 Hollan Haule,Ian Piper,Patricia Jones,Tsz-Yan Milly Lo,Javier Escudero
発行日 2024-10-03 17:18:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG | コメントする

NETS: A Non-Equilibrium Transport Sampler


非平衡輸送サンプラー(Non-Equilibrium Transport Sampler:NETS)と呼ばれる、正規化されていない確率分布からサンプリングするアルゴリズムを提案する。NETSは、Jarzynskiの等式に基づくアニールされた重要度サンプリング(AIS)の変形と見なすことができ、非平衡サンプリングを実行するために使用される確率微分方程式は、AISで使用される不偏重みの影響を低減する追加的な学習ドリフト項で補強される。このドリフトは、サンプリングを支配する確率微分方程式の解をバックプロパゲートすることなく、全ての目的関数を不偏的に推定できる。また、これらの目的関数の中には、推定分布の目標からのカルバック・ライブラー発散を制御するものもあることを証明する。NETSは不偏であることが示され、さらに、有効サンプルサイズを最大化するために学習後に調整可能な拡散係数を持つ。標準的なベンチマーク、高次元のガウス混合分布、統計的格子場の理論に基づくモデルにおいて、本手法の有効性を実証し、関連研究や既存のベースラインの性能を上回ることを示す。


We propose an algorithm, termed the Non-Equilibrium Transport Sampler (NETS), to sample from unnormalized probability distributions. NETS can be viewed as a variant of annealed importance sampling (AIS) based on Jarzynski’s equality, in which the stochastic differential equation used to perform the non-equilibrium sampling is augmented with an additional learned drift term that lowers the impact of the unbiasing weights used in AIS. We show that this drift is the minimizer of a variety of objective functions, which can all be estimated in an unbiased fashion without backpropagating through solutions of the stochastic differential equations governing the sampling. We also prove that some these objectives control the Kullback-Leibler divergence of the estimated distribution from its target. NETS is shown to be unbiased and, in addition, has a tunable diffusion coefficient which can be adjusted post-training to maximize the effective sample size. We demonstrate the efficacy of the method on standard benchmarks, high-dimensional Gaussian mixture distributions, and a model from statistical lattice field theory, for which it surpasses the performances of related work and existing baselines.


著者 Michael S. Albergo,Eric Vanden-Eijnden
発行日 2024-10-03 17:35:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cond-mat.stat-mech, cs.LG, hep-lat | コメントする

Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits


我々は、離散時間における無限地平の平均報酬型レストレス・バンディット問題を考察する。我々は、漸進的に大きな腕の部分集合を最適分布に向かわせるように設計された新しいクラスの政策を提案する。本論文では、$N$武装問題に対して、$O(1/sqrt{N})$の最適性ギャップで漸近的に最適であることを示す。我々のアプローチは、最適への収束を保証するためにGAP(Global Attractor Property)に依存するインデックス政策や優先順位政策に焦点を当てた多くの既存の研究や、同期化仮定(Synchronization Assumption)を必要とする最近開発されたシミュレーションに基づく政策とは異なる。


We consider the infinite-horizon, average-reward restless bandit problem in discrete time. We propose a new class of policies that are designed to drive a progressively larger subset of arms toward the optimal distribution. We show that our policies are asymptotically optimal with an $O(1/\sqrt{N})$ optimality gap for an $N$-armed problem, assuming only a unichain and aperiodicity assumption. Our approach departs from most existing work that focuses on index or priority policies, which rely on the Global Attractor Property (GAP) to guarantee convergence to the optimum, or a recently developed simulation-based policy, which requires a Synchronization Assumption (SA).


著者 Yige Hong,Qiaomin Xie,Yudong Chen,Weina Wang
発行日 2024-10-03 17:37:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: 90C40, cs.LG, G.3, math.OC, math.PR | コメントする

SynthFormer: Equivariant Pharmacophore-based Generation of Molecules for Ligand-Based Drug Design


創薬は複雑で資源集約的なプロセスであり、新薬を患者に届けるためには多大な時間とコストを投資する必要がある。最近の生成的機械学習(ML)手法の進歩は、化学的空間を効率的に探索することにより、初期段階の創薬を加速する有望な手段を提供する。本稿では、in silicoの生成的アプローチと実用的なin vitroの方法論の間のギャップを取り上げ、分子探索を最適化するための統合の必要性を強調する。SynthFormerは、ファーマコフォアの3D等変量エンコーダを利用し、合成可能な分子を合成ツリーとして生成する新しいMLモデルである。従来の手法とは異なり、SynthFormerは3D情報を組み込んで合成経路を提供するため、様々なタンパク質において良好なドッキングスコアを持つ分子を生成する能力が向上している。我々の貢献には、3D情報を用いた効率的な化学空間探索のための新しい方法論、3Dファーマコフォア表現を分子に変換するためのSynthformerと呼ばれる新しいアーキテクチャ、創薬最適化のための試薬を組織化する意味のある埋め込み空間が含まれる。Synthformerは、うまくドッキングする分子を生成し、合成経路に制限された後期段階の最適化を効果的に行うことができる。


Drug discovery is a complex and resource-intensive process, with significant time and cost investments required to bring new medicines to patients. Recent advancements in generative machine learning (ML) methods offer promising avenues to accelerate early-stage drug discovery by efficiently exploring chemical space. This paper addresses the gap between in silico generative approaches and practical in vitro methodologies, highlighting the need for their integration to optimize molecule discovery. We introduce SynthFormer, a novel ML model that utilizes a 3D equivariant encoder for pharmacophores to generate fully synthesizable molecules, constructed as synthetic trees. Unlike previous methods, SynthFormer incorporates 3D information and provides synthetic paths, enhancing its ability to produce molecules with good docking scores across various proteins. Our contributions include a new methodology for efficient chemical space exploration using 3D information, a novel architecture called Synthformer for translating 3D pharmacophore representations into molecules, and a meaningful embedding space that organizes reagents for drug discovery optimization. Synthformer generates molecules that dock well and enables effective late-stage optimization restricted by synthesis paths.


著者 Zygimantas Jocys,Henriette M. G. Willems,Katayoun Farrahi
発行日 2024-10-03 17:38:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG | コメントする

E(n) Equivariant Topological Neural Networks




Graph neural networks excel at modeling pairwise interactions, but they cannot flexibly accommodate higher-order interactions and features. Topological deep learning (TDL) has emerged recently as a promising tool for addressing this issue. TDL enables the principled modeling of arbitrary multi-way, hierarchical higher-order interactions by operating on combinatorial topological spaces, such as simplicial or cell complexes, instead of graphs. However, little is known about how to leverage geometric features such as positions and velocities for TDL. This paper introduces E(n)-Equivariant Topological Neural Networks (ETNNs), which are E(n)-equivariant message-passing networks operating on combinatorial complexes, formal objects unifying graphs, hypergraphs, simplicial, path, and cell complexes. ETNNs incorporate geometric node features while respecting rotation, reflection, and translation equivariance. Moreover, ETNNs are natively ready for settings with heterogeneous interactions. We provide a theoretical analysis to show the improved expressiveness of ETNNs over architectures for geometric graphs. We also show how E(n)-equivariant variants of TDL models can be directly derived from our framework. The broad applicability of ETNNs is demonstrated through two tasks of vastly different scales: i) molecular property prediction on the QM9 benchmark and ii) land-use regression for hyper-local estimation of air pollution with multi-resolution irregular geospatial data. The results indicate that ETNNs are an effective tool for learning from diverse types of richly structured data, as they match or surpass SotA equivariant TDL models with a significantly smaller computational burden, thus highlighting the benefits of a principled geometric inductive bias.


著者 Claudio Battiloro,Ege Karaismailoğlu,Mauricio Tec,George Dasoulas,Michelle Audirac,Francesca Dominici
発行日 2024-10-03 17:44:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.LG, cs.NE | コメントする

Preble: Efficient Distributed Prompt Scheduling for LLM Serving


大規模言語モデル(LLM)へのプロンプトは、単純なユーザへの質問を超えて進化している。LLMが複雑な問題を解決するために、今日では、プロンプトにドメイン固有の指示、ツールの使い方の説明、教科書の章のような長い文脈を含めることが行われている。そのため、プロンプトの多くの部分はリクエスト間で繰り返される。最近の研究では、プロンプトのKV状態をキャッシュして再利用することが提案されている。しかし、それらはすべて単一GPUによる最適化に限定されており、一方、本番のLLMサービングシステムはもともと分散型である。 本稿では、プロンプト共有をターゲットとし最適化する初の分散LLMサービングプラットフォームであるPrebleを提案する。新しいスケジューリングアルゴリズムと階層的スケジューリングメカニズムにより、KV状態の再利用と計算負荷分散を協調最適化する分散スケジューリングシステムを設計した。つのオープンソースLLMにおける実際のワークロードとリクエスト到着パターンを用いたPrebleの評価により、PrebleはSOTAサービングシステムを平均待ち時間で1.5倍から14.5倍、p99待ち時間で2倍から10倍上回ることが示された。


Prompts to large language models (LLMs) have evolved beyond simple user questions. For LLMs to solve complex problems, today’s practices are to include domain-specific instructions, illustration of tool usages, and/or long context such as textbook chapters in prompts. As such, many parts of prompts are repetitive across requests. Recent works propose to cache and reuse KV state of prompts. However, they are all confined to a single-GPU optimization, while production LLM serving systems are distributed by nature. This paper proposes Preble, the first distributed LLM serving platform that targets and optimizes for prompt sharing. We designed a distributed scheduling system that co-optimizes KV state reuse and computation load-balancing with a new scheduling algorithm and a hierarchical scheduling mechanism. Our evaluation of Preble with real workloads and request arrival patterns on two open-source LLMs shows that Preble outperforms the SOTA serving systems by 1.5X to 14.5X on average latency and 2X to 10X on p99 latency.


著者 Vikranth Srivatsa,Zijian He,Reyna Abhyankar,Dongming Li,Yiying Zhang
発行日 2024-10-03 17:50:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.DC, cs.LG | コメントする