Three Types of Calibration with Properties and their Semantic and Formal Relationships

要約

「信頼性」とアルゴリズムの公平性に関する議論に支えられて、予測システムのキャリブレーションは学者の注目を集めています。
バニラの定義とキャリブレーションの理解は、雨の可能性がpであると予測されているすべての日に、単純に言えば、雨の日の実際の頻度はpでした。
しかし、注目の高まりは、「キャリブレーション」の膨大な多様な新しい概念につながりました。
概念のいくつかは比類のない、異なる目的に役立つ、またはお互いを暗示しています。
この作業では、キャリブレーションを動機付ける2つのアカウントを提供します。予測特性の自己実現と、予測に依存する意思決定者の発生した損失の正確な推定です。
私たちは、反射原則を介して前者を実証し、後者は保険数理の公平性によって実証します。
両方のアカウントについて、結果分配のプロパティ$ \ gamma $、たとえば平均または中央値を介してプロトタイプの定義を策定します。
$ \ gamma $ qualibrationと呼ばれる自己実現のプロトタイプの定義は、特定の条件下での特定のタイプのスワップ後悔に相当します。
これらの意味は、Omniprediction Learning Paradigmに強く関連しています。
正確な損失推定のプロトタイプの定義は、Zhao et alから採用された決定キャリブレーションの変更です。
[73]。
バイナリの結果の場合、両方のプロトタイプの定義は、参照特性の適切な選択の下で一致します。
高次元の結果セットの場合、両方のプロトタイプの定義は、プロパティに関する分布キャリブレーションと呼ばれるバイナリ定義の自然な拡張によって包含される可能性があります。
最後に、マルチブランド化を取得するためによく使用されるキャリブレーションの両方のアカウントでのグループの役割についてコメントすることでコメントします。
要するに、この作業は、概念と定義の断片化された地形をナビゲートするために、キャリブレーションのセマンティックマップを提供します。

要約(オリジナル)

Fueled by discussions around ‘trustworthiness’ and algorithmic fairness, calibration of predictive systems has regained scholars attention. The vanilla definition and understanding of calibration is, simply put, on all days on which the rain probability has been predicted to be p, the actual frequency of rain days was p. However, the increased attention has led to an immense variety of new notions of ‘calibration.’ Some of the notions are incomparable, serve different purposes, or imply each other. In this work, we provide two accounts which motivate calibration: self-realization of forecasted properties and precise estimation of incurred losses of the decision makers relying on forecasts. We substantiate the former via the reflection principle and the latter by actuarial fairness. For both accounts we formulate prototypical definitions via properties $\Gamma$ of outcome distributions, e.g., the mean or median. The prototypical definition for self-realization, which we call $\Gamma$-calibration, is equivalent to a certain type of swap regret under certain conditions. These implications are strongly connected to the omniprediction learning paradigm. The prototypical definition for precise loss estimation is a modification of decision calibration adopted from Zhao et al. [73]. For binary outcome sets both prototypical definitions coincide under appropriate choices of reference properties. For higher-dimensional outcome sets, both prototypical definitions can be subsumed by a natural extension of the binary definition, called distribution calibration with respect to a property. We conclude by commenting on the role of groupings in both accounts of calibration often used to obtain multicalibration. In sum, this work provides a semantic map of calibration in order to navigate a fragmented terrain of notions and definitions.

arxiv情報

著者 Rabanus Derr,Jessie Finocchiaro,Robert C. Williamson
発行日 2025-04-25 14:46:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Three Types of Calibration with Properties and their Semantic and Formal Relationships はコメントを受け付けていません

SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems

要約

Koopmanオペレーターは、動的制御システムの機械学習の理論的バックボーンとして機能します。ここで、演算子は拡張動的モード分解(EDMD)によってヒューリスティックに近似されます。
この論文では、斬新な安定性と証明書指向のEDMDベースのコントローラー設計フレームワークであるSafeDMDを提案します。
私たちのアプローチは、閉ループ保証を提供するために、データ駆動型の方法で生成された信頼できる代理モデルを活用しています。
特に、基礎となる非線形システムの安定化が保証された半定義プログラミングに基づくコントローラー設計を確立します。
中央成分として、原点で消え、タスクを制御するように調整される比例誤差境界を導き出します。
いくつかのベンチマークの例を使用して開発された方法を説明し、最新の方法よりも利点を強調します。

要約(オリジナル)

The Koopman operator serves as the theoretical backbone for machine learning of dynamical control systems, where the operator is heuristically approximated by extended dynamic mode decomposition (EDMD). In this paper, we propose SafEDMD, a novel stability- and certificate-oriented EDMD-based controller design framework. Our approach leverages a reliable surrogate model generated in a data-driven fashion in order to provide closed-loop guarantees. In particular, we establish a controller design based on semi-definite programming with guaranteed stabilization of the underlying nonlinear system. As central ingredient, we derive proportional error bounds that vanish at the origin and are tailored to control tasks. We illustrate the developed method by means of several benchmark examples and highlight the advantages over state-of-the-art methods.

arxiv情報

著者 Robin Strässer,Manuel Schaller,Karl Worthmann,Julian Berberich,Frank Allgöwer
発行日 2025-04-25 14:51:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | SafEDMD: A Koopman-based data-driven controller design framework for nonlinear dynamical systems はコメントを受け付けていません

Generative Auto-Bidding with Value-Guided Explorations

要約

動的かつ競争力のあるオンライン環境内で入札決定を最適化する強力な能力を備えた自動入居は、広告プラットフォームにとって極めて重要な戦略となっています。
既存のアプローチは通常、ルールベースの戦略または強化学習(RL)技術を採用しています。
ただし、ルールベースの戦略には、時変市場の状況に適応する柔軟性が欠けており、RLベースの方法は、マルコフ決定プロセス(MDP)フレームワーク内で本質的な歴史的依存関係と観察を把握するのに苦労しています。
さらに、これらのアプローチは、多様な広告目標にわたって戦略の適応性を確保する上で課題に直面していることがよくあります。
さらに、安定したオンライン戦略の展開とメンテナンスを促進するためにオフライントレーニング方法がますます採用されているため、文書化された行動パターンと、固定オフラインデータセットでのトレーニングに起因する行動崩壊の問題がますます重要になります。
これらの制限に対処するために、このペーパーでは、価値ガイド付きの探索(与えられた)を備えた新しいオフライン生成自動融合フレームワークを紹介します。
スコアベースのReturn-to-Go(RTG)モジュールを通じて、さまざまな広告目標を収容しました。
さらに、統合されたアクション探索メカニズムをRTGベースの評価方法で提供し、安定性を提供する更新を確保しながら、新しいアクションを調査しました。
学習可能な値関数は、アクションの探求の方向を導き、分散除外(OOD)の問題を軽減するためにも設計されています。
2つのオフラインデータセットと実際の展開での実験結果は、オフライン評価とオンラインA/Bテストの両方で最先端のベースラインをアウトパフォーマンスしたことを示しています。
このフレームワークのコアメソッドを適用することにより、Neurips 2024競争で1位を誇らしげに確保しました。「AIGBトラック:生成モデルを使用した自動入金エージェントの学習」。

要約(オリジナル)

Auto-bidding, with its strong capability to optimize bidding decisions within dynamic and competitive online environments, has become a pivotal strategy for advertising platforms. Existing approaches typically employ rule-based strategies or Reinforcement Learning (RL) techniques. However, rule-based strategies lack the flexibility to adapt to time-varying market conditions, and RL-based methods struggle to capture essential historical dependencies and observations within Markov Decision Process (MDP) frameworks. Furthermore, these approaches often face challenges in ensuring strategy adaptability across diverse advertising objectives. Additionally, as offline training methods are increasingly adopted to facilitate the deployment and maintenance of stable online strategies, the issues of documented behavioral patterns and behavioral collapse resulting from training on fixed offline datasets become increasingly significant. To address these limitations, this paper introduces a novel offline Generative Auto-bidding framework with Value-Guided Explorations (GAVE). GAVE accommodates various advertising objectives through a score-based Return-To-Go (RTG) module. Moreover, GAVE integrates an action exploration mechanism with an RTG-based evaluation method to explore novel actions while ensuring stability-preserving updates. A learnable value function is also designed to guide the direction of action exploration and mitigate Out-of-Distribution (OOD) problems. Experimental results on two offline datasets and real-world deployments demonstrate that GAVE outperforms state-of-the-art baselines in both offline evaluations and online A/B tests. By applying the core methods of this framework, we proudly secured first place in the NeurIPS 2024 competition, ‘AIGB Track: Learning Auto-Bidding Agents with Generative Models’.

arxiv情報

著者 Jingtong Gao,Yewen Li,Shuai Mao,Peng Jiang,Nan Jiang,Yejing Wang,Qingpeng Cai,Fei Pan,Peng Jiang,Kun Gai,Bo An,Xiangyu Zhao
発行日 2025-04-25 15:04:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG | Generative Auto-Bidding with Value-Guided Explorations はコメントを受け付けていません

Equi-Euler GraphNet: An Equivariant, Temporal-Dynamics Informed Graph Neural Network for Dual Force and Trajectory Prediction in Multi-Body Systems

要約

マルチボディダイナミカルシステムの正確なリアルタイムモデリングは、業界全体でデジタルツインアプリケーションを可能にするために不可欠です。
多くのデータ駆動型アプローチはシステムのダイナミクスを学ぶことを目的としていますが、内部負荷とシステムの軌跡を共同で予測することは依然として重要な課題です。
この二重の予測は、障害検出と予測維持のために特に重要です。ここでは、内部負荷が接触力(障害の初期の指標としての断片)であり、動きに影響を与える前に摩耗または不整合を反映しています。
これらの力は、分解モデル(亀裂の成長など)への入力としても機能し、損傷の予測と残りの耐用年数推定を可能にします。
マルチボディシステムの内部力とグローバルな軌跡を同時に予測する物理情報に基づいたグラフニューラルネットワーク(GNN)であるEqui-Euler GraphNetを提案します。
このメッシュフリーフレームワークでは、ノードはシステムコンポーネントを表し、エッジはインタラクションをエンコードします。
Equi-Euler GraphNetは、2つの帰納的バイアスを導入します。(1)Edid Edgeメッセージをユークリッド変換の下で一貫した相互作用力として解釈する等量のメッセージパススキーム。
(2)オイラーの統合に基づいて、時間の経過とともに遠方の相互作用の影響を捉えるための時間を意識した反復ノード更新メカニズム。
円筒形のローラーベアリングに合わせて、ローリング要素の制約された動きからリングダイナミクスを切り離します。
高忠実度の多目的シミュレーションでトレーニングされたEqui-Euler GraphNetは、トレーニングの分布を超えて一般化し、目に見えない速度、負荷、および構成の下で負荷と軌跡を正確に予測します。
軌道予測に焦点を当てた最先端のGNNよりも優れており、最小限のエラー蓄積で数千の時間ステップにわたって安定したロールアウトを提供します。
同等の精度を維持しながら、従来のソルバーよりも最大200倍のスピードアップを達成するため、デジタル双子、設計、メンテナンスの効率的な縮小順序モデルとして機能します。

要約(オリジナル)

Accurate real-time modeling of multi-body dynamical systems is essential for enabling digital twin applications across industries. While many data-driven approaches aim to learn system dynamics, jointly predicting internal loads and system trajectories remains a key challenge. This dual prediction is especially important for fault detection and predictive maintenance, where internal loads-such as contact forces-act as early indicators of faults, reflecting wear or misalignment before affecting motion. These forces also serve as inputs to degradation models (e.g., crack growth), enabling damage prediction and remaining useful life estimation. We propose Equi-Euler GraphNet, a physics-informed graph neural network (GNN) that simultaneously predicts internal forces and global trajectories in multi-body systems. In this mesh-free framework, nodes represent system components and edges encode interactions. Equi-Euler GraphNet introduces two inductive biases: (1) an equivariant message-passing scheme, interpreting edge messages as interaction forces consistent under Euclidean transformations; and (2) a temporal-aware iterative node update mechanism, based on Euler integration, to capture influence of distant interactions over time. Tailored for cylindrical roller bearings, it decouples ring dynamics from constrained motion of rolling elements. Trained on high-fidelity multiphysics simulations, Equi-Euler GraphNet generalizes beyond the training distribution, accurately predicting loads and trajectories under unseen speeds, loads, and configurations. It outperforms state-of-the-art GNNs focused on trajectory prediction, delivering stable rollouts over thousands of time steps with minimal error accumulation. Achieving up to a 200x speedup over conventional solvers while maintaining comparable accuracy, it serves as an efficient reduced-order model for digital twins, design, and maintenance.

arxiv情報

著者 Vinay Sharma,Rémi Tanguy Oddon,Pietro Tesini,Jens Ravesloot,Cees Taal,Olga Fink
発行日 2025-04-25 15:07:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, physics.comp-ph | Equi-Euler GraphNet: An Equivariant, Temporal-Dynamics Informed Graph Neural Network for Dual Force and Trajectory Prediction in Multi-Body Systems はコメントを受け付けていません

Online learning to accelerate nonlinear PDE solvers: applied to multiphase porous media flow

要約

オンライン/適応学習に基づく非線形部分微分方程式(PDE)のシステムのための新しいタイプの非線形ソルバー加速度を提案します。
多孔質媒体の多相流のコンテキストで適用されます。
提案された方法は、4つの柱に依存しています。(i)機械学習モデルの入力パラメーターとしての無次元数、(ii)オフライントレーニングのための単純化された数値モデル(2次元)、(iii)非線形ソルバーチューニングパラメーター(数値緩和)、(IV)、およびマシン学習モデルのリアルタイム改善のためのオンライン学習の動的制御。
この戦略は、単一のグローバルパラメーター、緩和係数を動的に変更し、各数値モデルの属性を実行中に適応的に学習することにより、非線形反復の数を減らします。
さらに、この作業は、無次元パラメーター(機械学習機能)で感度研究を実行し、さまざまな機械学習モデルの有効性を評価し、より複雑で現実的な3次元モデルでのメソッドを使用して非線形反復の減少を示し、機械学習モデルを完全にカッピングして、オープンソースマルチフェーズフローシミュレータに計算時間を達成します。

要約(オリジナル)

We propose a novel type of nonlinear solver acceleration for systems of nonlinear partial differential equations (PDEs) that is based on online/adaptive learning. It is applied in the context of multiphase flow in porous media. The proposed method rely on four pillars: (i) dimensionless numbers as input parameters for the machine learning model, (ii) simplified numerical model (two-dimensional) for the offline training, (iii) dynamic control of a nonlinear solver tuning parameter (numerical relaxation), (iv) and online learning for real-time improvement of the machine learning model. This strategy decreases the number of nonlinear iterations by dynamically modifying a single global parameter, the relaxation factor, and by adaptively learning the attributes of each numerical model on-the-run. Furthermore, this work performs a sensitivity study in the dimensionless parameters (machine learning features), assess the efficacy of various machine learning models, demonstrate a decrease in nonlinear iterations using our method in more intricate, realistic three-dimensional models, and fully couple a machine learning model into an open-source multiphase flow simulator achieving up to 85\% reduction in computational time.

arxiv情報

著者 Vinicius L S Silva,Pablo Salinas,Claire E Heaney,Matthew Jackson,Christopher C Pain
発行日 2025-04-25 15:15:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.flu-dyn | Online learning to accelerate nonlinear PDE solvers: applied to multiphase porous media flow はコメントを受け付けていません

Continuum limit of $p$-biharmonic equations on graphs

要約

このホワイトペーパーでは、グラフ上の$ p $ biharmonic方程式を研究します。グラフは、ポイントクラウド処理で発生し、ハイパーグラフの観点からグラフ$ p $ -laplacianの自然な拡張として解釈できます。
ランダムな幾何学グラフを考慮し、データポイントの数が無限になると、溶液の漸近挙動が調査されます。
連続体限界は、均一なノイマン境界条件を備えた適切に加重された$ p $ biharmonic方程式であることを示します。
結果は、非ローカルおよびグラフポアソン方程式の溶液と勾配の均一な$ l^p $推定に依存しています。
ソリューションの$ l^\ infty $の推定値も副産物として取得されます。

要約(オリジナル)

This paper studies the $p$-biharmonic equation on graphs, which arises in point cloud processing and can be interpreted as a natural extension of the graph $p$-Laplacian from the perspective of hypergraph. The asymptotic behavior of the solution is investigated when the random geometric graph is considered and the number of data points goes to infinity. We show that the continuum limit is an appropriately weighted $p$-biharmonic equation with homogeneous Neumann boundary conditions. The result relies on the uniform $L^p$ estimates for solutions and gradients of nonlocal and graph Poisson equations. The $L^\infty$ estimates of solutions are also obtained as a byproduct.

arxiv情報

著者 Kehan Shi,Martin Burger
発行日 2025-04-25 15:20:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 35J30, 35R02, 65N12, cs.LG, cs.NA, math.AP, math.NA | Continuum limit of $p$-biharmonic equations on graphs はコメントを受け付けていません

An Axiomatic Assessment of Entropy- and Variance-based Uncertainty Quantification in Regression

要約

不確実性の定量化(UQ)は機械学習において重要ですが、不確実性測定のほとんどの(公理的)研究は分類に焦点を当てており、正式な正当化と評価が限られている回帰設定にギャップを残しています。
この作業では、一連の公理を紹介して、監視された回帰のアレアトリック、認識論、および完全な不確実性の尺度を厳密に評価します。
予測的な指数ファミリを利用することにより、不確実性の表現と対応する不確実性測定のために一般的に使用されるアプローチを一般化できます。
より具体的には、制限と課題に関する広く使用されているエントロピーおよび分散ベースの測定値を分析します。
私たちの調査結果は、回帰におけるUQの原則的な基盤を提供し、信頼できる不確実性評価のための理論的洞察と実用的なガイドラインを提供します。

要約(オリジナル)

Uncertainty quantification (UQ) is crucial in machine learning, yet most (axiomatic) studies of uncertainty measures focus on classification, leaving a gap in regression settings with limited formal justification and evaluations. In this work, we introduce a set of axioms to rigorously assess measures of aleatoric, epistemic, and total uncertainty in supervised regression. By utilizing a predictive exponential family, we can generalize commonly used approaches for uncertainty representation and corresponding uncertainty measures. More specifically, we analyze the widely used entropy- and variance-based measures regarding limitations and challenges. Our findings provide a principled foundation for UQ in regression, offering theoretical insights and practical guidelines for reliable uncertainty assessment.

arxiv情報

著者 Christopher Bülte,Yusuf Sale,Timo Löhr,Paul Hofman,Gitta Kutyniok,Eyke Hüllermeier
発行日 2025-04-25 15:44:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | An Axiomatic Assessment of Entropy- and Variance-based Uncertainty Quantification in Regression はコメントを受け付けていません

Boosting-Enabled Robust System Identification of Partially Observed LTI Systems Under Heavy-Tailed Noise

要約

部分的に観察された線形時間不変(LTI)システムのシステム識別の問題を考慮します。
入出力データが与えられている場合、一般的な重尾型ノイズプロセスの下でシステムパラメーターを識別するための非症状の保証を提供します。
ガウスやガウスのノイズを想定している以前の作品とは異なり、2番目の瞬間のみを認めるために必要な大幅に広いノイズ分布を考慮します。
この設定では、堅牢な統計からツールを活用して、ブーストのアイデアを活用する新しいシステム識別アルゴリズムを提案します。
ノイズの仮定がはるかに弱いにもかかわらず、提案されているアルゴリズムが、サブガウスノイズの下で導出されたものとほぼ一致するサンプルの複雑さの境界を達成することを示します。
特に、私たちの境界は、規定された障害確率に対数依存性を保持することを確立します。
興味深いことに、興奮性の入力プロセスで有限の4番目の瞬間を必要とすることにより、そのような境界を達成できることを示します。

要約(オリジナル)

We consider the problem of system identification of partially observed linear time-invariant (LTI) systems. Given input-output data, we provide non-asymptotic guarantees for identifying the system parameters under general heavy-tailed noise processes. Unlike previous works that assume Gaussian or sub-Gaussian noise, we consider significantly broader noise distributions that are required to admit only up to the second moment. For this setting, we leverage tools from robust statistics to propose a novel system identification algorithm that exploits the idea of boosting. Despite the much weaker noise assumptions, we show that our proposed algorithm achieves sample complexity bounds that nearly match those derived under sub-Gaussian noise. In particular, we establish that our bounds retain a logarithmic dependence on the prescribed failure probability. Interestingly, we show that such bounds can be achieved by requiring just a finite fourth moment on the excitatory input process.

arxiv情報

著者 Vinay Kanakeri,Aritra Mitra
発行日 2025-04-25 15:57:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC | Boosting-Enabled Robust System Identification of Partially Observed LTI Systems Under Heavy-Tailed Noise はコメントを受け付けていません

Efficient Budget Allocation for Large-Scale LLM-Enabled Virtual Screening

要約

大規模なプールからトップの代替品の小さなサブセットを特定することを目的としたスクリーニングタスクは、ビジネスの意思決定プロセスで一般的です。
これらのタスクは、多くの場合、各代替のパフォーマンスを評価するために実質的な人間の努力を必要とし、時間がかかり、費用がかかります。
大規模な言語モデル(LLMS)の最近の進歩、特に人間の評価とうまく一致する出力を生成する能力に動機付けられているため、スクリーニングを実質的に実施するためのLLM-Human-Evaluatorアプローチを実質的に削減するためのLLM-Human-Haluatorアプローチを検討します。
仮想スクリーニングでスケーラビリティと費用対効果を達成するために、LLM出力の確率的性質とそのコスト構造が、あらゆる代替品にわたって効率的な予算配分を必要とすることを特定します。
これに対処するために、現在の最高$ M $の代替品を評価し続け、Explore-First Top $ M $ $ M $のgreedy(efg-$ m $)アルゴリズムを設計し続けるシンプルかつ効果的なアプローチである、$ m $ $ $ $ $の貪欲な評価メカニズムを使用することを提案します。
EFG-$ M $は、サンプル最適であり、大規模な仮想スクリーニングで一貫していることを証明しています。
驚くべきことに、アルゴリズムが選択されたサブセット内で自然に無関心に基づいたランキングを誘導するボーナスランキング効果も明らかにします。
実用性をさらに高めるために、スクリーニングのパフォーマンスと計算効率を改善するために、一連のアルゴリズムバリアントを設計します。
数値実験は結果を検証し、アルゴリズムの有効性を実証します。
最後に、LLMベースの仮想スクリーニングに関するケーススタディを実施します。
この研究では、LLMだけが直接照会されたときに有意義なスクリーニングとランキングの結果を提供しないかもしれないが、それらをサンプル最適なアルゴリズムと統合すると、費用対効果の高い大規模な仮想スクリーニングの可能性が解除されることを示しています。

要約(オリジナル)

Screening tasks that aim to identify a small subset of top alternatives from a large pool are common in business decision-making processes. These tasks often require substantial human effort to evaluate each alternative’s performance, making them time-consuming and costly. Motivated by recent advances in large language models (LLMs), particularly their ability to generate outputs that align well with human evaluations, we consider an LLM-as-human-evaluator approach for conducting screening virtually, thereby reducing the cost burden. To achieve scalability and cost-effectiveness in virtual screening, we identify that the stochastic nature of LLM outputs and their cost structure necessitate efficient budget allocation across all alternatives. To address this, we propose using a top-$m$ greedy evaluation mechanism, a simple yet effective approach that keeps evaluating the current top-$m$ alternatives, and design the explore-first top-$m$ greedy (EFG-$m$) algorithm. We prove that EFG-$m$ is both sample-optimal and consistent in large-scale virtual screening. Surprisingly, we also uncover a bonus ranking effect, where the algorithm naturally induces an indifference-based ranking within the selected subset. To further enhance practicality, we design a suite of algorithm variants to improve screening performance and computational efficiency. Numerical experiments validate our results and demonstrate the effectiveness of our algorithms. Lastly, we conduct a case study on LLM-based virtual screening. The study shows that while LLMs alone may not provide meaningful screening and ranking results when directly queried, integrating them with our sample-optimal algorithms unlocks their potential for cost-effective, large-scale virtual screening.

arxiv情報

著者 Zaile Li,Weiwei Fan,L. Jeff Hong
発行日 2025-04-25 15:59:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML | Efficient Budget Allocation for Large-Scale LLM-Enabled Virtual Screening はコメントを受け付けていません

Enhancing Strawberry Yield Forecasting with Backcasted IoT Sensor Data and Machine Learning

要約

世界的に急速に人口増加しているため、デジタル対応の農業部門は、持続可能な食料生産と、農家やさまざまな利害関係者の資源管理に関する情報に基づいた決定を下すために重要です。
さまざまな環境(温度、湿度など)のリアルタイム観測を収集するモノのインターネット(IoT)テクノロジーの展開および生産に影響を与える運用要因(灌漑など)は、AIベースの収量予測などの追加の新しいダウンストリームタスクを可能にする重要なステップと見なされます。
ただし、AIモデルには大量のデータが必要なため、これは多くのシーズンにわたってIoTの観測を収集する必要がある実際の動的な農場環境で実用的な課題を生み出します。
この研究では、2つの成長期のイチゴ生産ポリトゥンネルにIoTセンサーを展開して、水使用、外部および内部温度、外湿度、土壌水分、土壌温度、光合成活性放射などの環境データを収集しました。
センサーの観測は、4シーズンの期間にわたる手動で提供された収量記録と組み合わされました。
2つの追加シーズンのIoT観測の欠落のギャップを埋めるために、近くの気象局と既存のポリトゥンネル観測からの歴史的な気象データを使用して、合成センサーの観測を生成するAIベースのバックキャスティングアプローチを提案します。
実際の観測と合成観測の組み合わせを使用して、アプローチを評価するために、AIベースの収量予測モデルを構築しました。
我々の結果は、合成データを組み込むことで収量予測の精度が向上し、合成データを組み込んだモデルが履歴収量、天気記録、実際のセンサーデータでのみトレーニングされたものよりも優れていることを実証しました。

要約(オリジナル)

Due to rapid population growth globally, digitally-enabled agricultural sectors are crucial for sustainable food production and making informed decisions about resource management for farmers and various stakeholders. The deployment of Internet of Things (IoT) technologies that collect real-time observations of various environmental (e.g., temperature, humidity, etc.) and operational factors (e.g., irrigation) influencing production is often seen as a critical step to enable additional novel downstream tasks, such as AI-based yield forecasting. However, since AI models require large amounts of data, this creates practical challenges in a real-world dynamic farm setting where IoT observations would need to be collected over a number of seasons. In this study, we deployed IoT sensors in strawberry production polytunnels for two growing seasons to collect environmental data, including water usage, external and internal temperature, external and internal humidity, soil moisture, soil temperature, and photosynthetically active radiation. The sensor observations were combined with manually provided yield records spanning a period of four seasons. To bridge the gap of missing IoT observations for two additional seasons, we propose an AI-based backcasting approach to generate synthetic sensor observations using historical weather data from a nearby weather station and the existing polytunnel observations. We built an AI-based yield forecasting model to evaluate our approach using the combination of real and synthetic observations. Our results demonstrated that incorporating synthetic data improved yield forecasting accuracy, with models incorporating synthetic data outperforming those trained only on historical yield, weather records, and real sensor data.

arxiv情報

著者 Tewodros Alemu Ayall,Andy Li,Matthew Beddows,Milan Markovic,Georgios Leontidis
発行日 2025-04-25 16:02:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Enhancing Strawberry Yield Forecasting with Backcasted IoT Sensor Data and Machine Learning はコメントを受け付けていません