Student-t processes as infinite-width limits of posterior Bayesian neural networks

要約

ベイジアンニューラルネットワーク(BNNS)の漸近特性は、特に無限の幅の制限におけるガウスプロセスによる近似に関して、広範囲に研究されています。
これらの結果を拡張して、後部BNNは学生Tプロセスによって近似できることを示し、モデリングの不確実性においてより大きな柔軟性を提供します。
具体的には、BNNのパラメーターがガウスの事前分布に従い、最後の隠れ層とガウスの尤度関数の両方の分散が逆ガンマ事前分布に従う場合、結果として生成される後部BNNは学生に収束します。
Tプロセスは、無限幅の制限で。
当社の証明は、wassersteinメトリックを活用して、学生-Tプロセス近似の収束率を制御することを確立します。

要約(オリジナル)

The asymptotic properties of Bayesian Neural Networks (BNNs) have been extensively studied, particularly regarding their approximations by Gaussian processes in the infinite-width limit. We extend these results by showing that posterior BNNs can be approximated by Student-t processes, which offer greater flexibility in modeling uncertainty. Specifically, we show that, if the parameters of a BNN follow a Gaussian prior distribution, and the variance of both the last hidden layer and the Gaussian likelihood function follows an Inverse-Gamma prior distribution, then the resulting posterior BNN converges to a Student-t process in the infinite-width limit. Our proof leverages the Wasserstein metric to establish control over the convergence rate of the Student-t process approximation.

arxiv情報

著者 Francesco Caporali,Stefano Favaro,Dario Trevisan
発行日 2025-02-06 17:37:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.PR, stat.ML | Student-t processes as infinite-width limits of posterior Bayesian neural networks はコメントを受け付けていません

Adapting to Evolving Adversaries with Regularized Continual Robust Training

要約

堅牢なトレーニング方法は、通常、固定予算のあるLP攻撃など、特定の攻撃タイプから防御し、防御者が時間の経過とともに新しい攻撃に遭遇する可能性があるという事実をめったに説明しません。
自然な解決策は、防御されたモデルを新しい敵が微調整を介して発生するため、継続的な堅牢なトレーニング(CRT)と呼ぶ方法に適応することです。
ただし、素朴に実装された場合、新しい攻撃で微調整すると、以前の攻撃で堅牢性が低下します。
これは疑問を提起します:モデルの最初のトレーニングと微調整をどのように改善して、以前の攻撃と新しい攻撃に対して堅牢性を達成することができますか?
モデルの異なる攻撃に対する堅牢性のギャップが、各攻撃がモデルのロジット空間でサンプルを摂動する程度であることに境界を挙げていることを示す理論的結果を提示し、このロジット空間距離に関する正規化が以前の攻撃に対する堅牢性を維持するのに役立つことを示唆しています。
3つのデータセット(CIFAR-10、CIFAR-100、およびImagenette)での広範な実験と100を超える攻撃の組み合わせにより、提案された正則化がトレーニング時間のオーバーヘッドがほとんどなく、堅牢な精度が向上することが示されています。
私たちの調査結果とオープンソースコードは、進化する攻撃に対して堅牢なモデルの展開の基礎を築きます。

要約(オリジナル)

Robust training methods typically defend against specific attack types, such as Lp attacks with fixed budgets, and rarely account for the fact that defenders may encounter new attacks over time. A natural solution is to adapt the defended model to new adversaries as they arise via fine-tuning, a method which we call continual robust training (CRT). However, when implemented naively, fine-tuning on new attacks degrades robustness on previous attacks. This raises the question: how can we improve the initial training and fine-tuning of the model to simultaneously achieve robustness against previous and new attacks? We present theoretical results which show that the gap in a model’s robustness against different attacks is bounded by how far each attack perturbs a sample in the model’s logit space, suggesting that regularizing with respect to this logit space distance can help maintain robustness against previous attacks. Extensive experiments on 3 datasets (CIFAR-10, CIFAR-100, and ImageNette) and over 100 attack combinations demonstrate that the proposed regularization improves robust accuracy with little overhead in training time. Our findings and open-source code lay the groundwork for the deployment of models robust to evolving attacks.

arxiv情報

著者 Sihui Dai,Christian Cianfarani,Arjun Bhagoji,Vikash Sehwag,Prateek Mittal
発行日 2025-02-06 17:38:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Adapting to Evolving Adversaries with Regularized Continual Robust Training はコメントを受け付けていません

Model-agnostic meta-learners for estimating heterogeneous treatment effects over time

要約

個別化医療などの多くの分野では、時間の経過とともに不均一な治療効果(HTE)を推定することが重要です。
たとえば、電子健康記録は一般にいくつかの期間にわたって収集され、その後、治療の決定をパーソナライズするために使用されます。
このタスクの既存の作業は、主にモデルベースの学習者(つまり、特定の機械学習モデルを適応させる学習者)に焦点を当てています。
対照的に、モデルに依存しない学習者(いわゆるメタ学習者)は、ほとんど未開拓です。
私たちの論文では、モデルに依存しているため、任意の機械学習モデル(トランスなど)と組み合わせてHTEを推定するために使用できるいくつかのメタ学習者を提案します。
ここで、私たちの焦点は、加重擬似結果回帰を介して得られる学習者にあります。これにより、治療効果を直接標的とすることで効率的な推定が可能になります。
次に、さまざまな学習者を特徴付ける包括的な理論分析を提供し、特定の学習者が望ましいときについての洞察を提供できるようにします。
最後に、数値実験を通じて理論的洞察を確認します。
要するに、メタ学習者はすでに静的設定の最先端ですが、時間変化の設定でHTEを推定するための包括的なメタ学習者のセットを提案した最初の人です。

要約(オリジナル)

Estimating heterogeneous treatment effects (HTEs) over time is crucial in many disciplines such as personalized medicine. For example, electronic health records are commonly collected over several time periods and then used to personalize treatment decisions. Existing works for this task have mostly focused on model-based learners (i.e., learners that adapt specific machine-learning models). In contrast, model-agnostic learners — so-called meta-learners — are largely unexplored. In our paper, we propose several meta-learners that are model-agnostic and thus can be used in combination with arbitrary machine learning models (e.g., transformers) to estimate HTEs over time. Here, our focus is on learners that can be obtained via weighted pseudo-outcome regressions, which allows for efficient estimation by targeting the treatment effect directly. We then provide a comprehensive theoretical analysis that characterizes the different learners and that allows us to offer insights into when specific learners are preferable. Finally, we confirm our theoretical insights through numerical experiments. In sum, while meta-learners are already state-of-the-art for the static setting, we are the first to propose a comprehensive set of meta-learners for estimating HTEs in the time-varying setting.

arxiv情報

著者 Dennis Frauen,Konstantin Hess,Stefan Feuerriegel
発行日 2025-02-06 17:39:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | Model-agnostic meta-learners for estimating heterogeneous treatment effects over time はコメントを受け付けていません

Combining Language and App UI Analysis for the Automated Assessment of Bug Reproduction Steps

要約

バグレポートは、開発者がソフトウェアの問題を確認し、その原因を調査し、修正を検証するために不可欠です。
残念ながら、レポートは多くの場合、重要な情報を見逃したり、不明確に書かれたりします。
問題のあるレポートの最も一般的なコンポーネントの1つは、修正に関するプログラムの障害と理由を再現するために不可欠なバグ(S2R)を再現する手順です。
報告されたS2Rの欠陥の傾向を考えると、以前の研究は、記者がS2Rの品質を書面または評価するのを支援する技術を提案しました。
ただし、S2Rの自動化された理解は困難であり、微妙な自然言語フレーズを特定の意味的に関連するプログラム情報とリンクする必要があります。
以前の手法は、言語の変動の問題とプログラム分析から収集された情報の制限のために、そのような言語をプログラムするためにそのような言語を形成するのに苦労します。
S2R品質の注釈の問題にもっと効果的に取り組むために、Astrobrと呼ばれる新しい手法を提案します。これは、LLMSの言語理解機能を活用して、バグレポートからS2Rを識別および抽出し、動的介して導出されたプログラム状態モデルでGUI相互作用にマッピングします。
分析。
Astrobrを関連する最先端のアプローチと比較しましたが、Astrobrはベースラインよりも(F1スコアに関して)S2RS 25.2%がより良い(F1スコアの点で)注釈を付けることがわかりました。
さらに、Astrobrは、ベースラインよりも正確な欠落S2Rを示唆しています(F1スコアの点で71.4%)。

要約(オリジナル)

Bug reports are essential for developers to confirm software problems, investigate their causes, and validate fixes. Unfortunately, reports often miss important information or are written unclearly, which can cause delays, increased issue resolution effort, or even the inability to solve issues. One of the most common components of reports that are problematic is the steps to reproduce the bug(s) (S2Rs), which are essential to replicate the described program failures and reason about fixes. Given the proclivity for deficiencies in reported S2Rs, prior work has proposed techniques that assist reporters in writing or assessing the quality of S2Rs. However, automated understanding of S2Rs is challenging, and requires linking nuanced natural language phrases with specific, semantically related program information. Prior techniques often struggle to form such language to program connections – due to issues in language variability and limitations of information gleaned from program analyses. To more effectively tackle the problem of S2R quality annotation, we propose a new technique called AstroBR, which leverages the language understanding capabilities of LLMs to identify and extract the S2Rs from bug reports and map them to GUI interactions in a program state model derived via dynamic analysis. We compared AstroBR to a related state-of-the-art approach and we found that AstroBR annotates S2Rs 25.2% better (in terms of F1 score) than the baseline. Additionally, AstroBR suggests more accurate missing S2Rs than the baseline (by 71.4% in terms of F1 score).

arxiv情報

著者 Junayed Mahmud,Antu Saha,Oscar Chaparro,Kevin Moran,Andrian Marcus
発行日 2025-02-06 17:40:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SE | Combining Language and App UI Analysis for the Automated Assessment of Bug Reproduction Steps はコメントを受け付けていません

Realistic Image-to-Image Machine Unlearning via Decoupling and Knowledge Retention

要約

Machine Inlarningを使用すると、参加者はプライバシーとセキュリティを維持するために、訓練された機械学習モデルからデータを削除できます。
ただし、生成モデルのための文献を解除するマシンはかなり限られています。
画像から画像への生成モデル(I2Iモデル)の文献では、ガウスノイズと、マシンの学習としての忘却サンプルのI2Iモデルの出力との間の距離を最小化することを考慮します。
ただし、機械学習モデルは目に見えないデータでかなりうまく機能すると主張します。つまり、再訓練されたモデルはデータの一般的なパターンをキャッチできるため、ガウスノイズに相当する出力を生成しません。
このホワイトペーパーでは、解き放たれた後のモデルは、忘れサンプルを分散除外(OOD)データとして扱うべきであると考えています。つまり、未学習モデルは、忘れたサンプルで見つかった特定のパターンを認識またはエンコードするべきではないと考えています。
これを達成するために、モデルパラメーターを勾配上昇で切り離すフレームワークを提案し、忘れたサンプルが理論的保証を使用して未学習モデルのOODであることを確認します。
また、$(\ epsilon、\ delta)$を提供します – グラデーション上昇を伴うモデル更新の保証を解除します。
未学習モデルは、パフォーマンスを維持するために、残りのサンプルでさらに微調整されています。
また、未学習モデルが忘却サンプルの影響を効果的に削除したことを確認するために、攻撃モデルを提案します。
2つの大規模なデータセットであるImagenet-1KとPlaces365での広範な経験的評価は、アプローチの優位性を強調しています。
再訓練モデルで同等のパフォーマンスを示すために、CIFAR-10データセットのさまざまなベースライン上の単純な自動エンコーダーの比較も示します。

要約(オリジナル)

Machine Unlearning allows participants to remove their data from a trained machine learning model in order to preserve their privacy, and security. However, the machine unlearning literature for generative models is rather limited. The literature for image-to-image generative model (I2I model) considers minimizing the distance between Gaussian noise and the output of I2I model for forget samples as machine unlearning. However, we argue that the machine learning model performs fairly well on unseen data i.e., a retrained model will be able to catch generic patterns in the data and hence will not generate an output which is equivalent to Gaussian noise. In this paper, we consider that the model after unlearning should treat forget samples as out-of-distribution (OOD) data, i.e., the unlearned model should no longer recognize or encode the specific patterns found in the forget samples. To achieve this, we propose a framework which decouples the model parameters with gradient ascent, ensuring that forget samples are OOD for unlearned model with theoretical guarantee. We also provide $(\epsilon, \delta)$-unlearning guarantee for model updates with gradient ascent. The unlearned model is further fine-tuned on the remaining samples to maintain its performance. We also propose an attack model to ensure that the unlearned model has effectively removed the influence of forget samples. Extensive empirical evaluation on two large-scale datasets, ImageNet-1K and Places365 highlights the superiority of our approach. To show comparable performance with retrained model, we also show the comparison of a simple AutoEncoder on various baselines on CIFAR-10 dataset.

arxiv情報

著者 Ayush K. Varshney,Vicenç Torra
発行日 2025-02-06 17:46:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Realistic Image-to-Image Machine Unlearning via Decoupling and Knowledge Retention はコメントを受け付けていません

Efficient Randomized Experiments Using Foundation Models

要約

ランダム化された実験は、介入の効果を評価するための好ましいアプローチですが、費用がかかり、多くの場合、かなりの不確実性のある推定値が得られます。
一方、ファンデーションモデルを活用するシリコ実験では、より高い統計精度を達成できる可能性のある費用対効果の高い代替手段を提供します。
ただし、インシリコ実験の利点には重大なリスクがあります。モデルが介入に対する実験的反応を正確に予測できない場合、統計的推論は有効ではありません。
この論文では、有効な統計的推論を保存しながら、複数の基礎モデルからの予測を実験データと統合する新しいアプローチを提案します。
私たちの推定量は一貫性があり、漸近的に正常であり、漸近分散は実験データのみに基づいて標準推定器よりも大きくありません。
重要なことに、これらの統計的特性は、モデルの予測が任意に偏っている場合でも保持されます。
いくつかのランダム化実験にわたる経験的結果は、実験データのみに基づいて標準推定器と同じ精度を一致させるために必要なサンプルサイズの最大20%の減少に相当する、推定量がかなりの精度の向上を提供することを示しています。

要約(オリジナル)

Randomized experiments are the preferred approach for evaluating the effects of interventions, but they are costly and often yield estimates with substantial uncertainty. On the other hand, in silico experiments leveraging foundation models offer a cost-effective alternative that can potentially attain higher statistical precision. However, the benefits of in silico experiments come with a significant risk: statistical inferences are not valid if the models fail to accurately predict experimental responses to interventions. In this paper, we propose a novel approach that integrates the predictions from multiple foundation models with experimental data while preserving valid statistical inference. Our estimator is consistent and asymptotically normal, with asymptotic variance no larger than the standard estimator based on experimental data alone. Importantly, these statistical properties hold even when model predictions are arbitrarily biased. Empirical results across several randomized experiments show that our estimator offers substantial precision gains, equivalent to a reduction of up to 20% in the sample size needed to match the same precision as the standard estimator based on experimental data alone.

arxiv情報

著者 Piersilvio De Bartolomeis,Javier Abad,Guanbo Wang,Konstantin Donhauser,Raymond M. Duch,Fanny Yang,Issa J. Dahabreh
発行日 2025-02-06 17:54:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML | Efficient Randomized Experiments Using Foundation Models はコメントを受け付けていません

Robust Reward Alignment via Hypothesis Space Batch Cutting

要約

強化学習と最適な制御エージェントの報酬設計は困難です。
選好ベースのアライメントは、エージェントが人間が提供するランク付けされた軌道ペアから報酬を学ぶことができるようにすることにより、これに対処します。
ただし、既存の方法は、堅牢性の低さから未知の誤った人間の好みに苦しんでいることがよくあります。
この作業では、斬新で幾何学的に解釈可能な視点に基づいて、堅牢で効率的な報酬アライメント方法を提案します:仮説スペースバッチ切断。
私たちの方法は、人間の好みのバッチに基づいて「カット」を介して報酬仮説空間を繰り返し洗練します。
各バッチ内で、意見の相違に基づいて照会された人間の好みは、投票機能を使用してグループ化され、適切なカットを決定し、境界のある人間のクエリの複雑さを確保します。
不明な誤った好みを処理するために、各バッチ内に保守的な切断方法を導入し、誤った人間の好みが仮説空間を過度に攻撃的に削減するのを防ぎます。
これにより、誤った好みに対する証明可能な堅牢性が保証されます。
DMコントロール、手の操縦、および移動など、さまざまなタスク全体のモデル予測制御設定での方法を評価します。
結果は、私たちのフレームワークが、エラーのない設定で最先端の方法と同等または優れたパフォーマンスを達成し、誤った人間の好みの高い割合を処理する際に既存の方法を大幅に上回ることを示しています。

要約(オリジナル)

Reward design for reinforcement learning and optimal control agents is challenging. Preference-based alignment addresses this by enabling agents to learn rewards from ranked trajectory pairs provided by humans. However, existing methods often struggle from poor robustness to unknown false human preferences. In this work, we propose a robust and efficient reward alignment method based on a novel and geometrically interpretable perspective: hypothesis space batched cutting. Our method iteratively refines the reward hypothesis space through ‘cuts’ based on batches of human preferences. Within each batch, human preferences, queried based on disagreement, are grouped using a voting function to determine the appropriate cut, ensuring a bounded human query complexity. To handle unknown erroneous preferences, we introduce a conservative cutting method within each batch, preventing erroneous human preferences from making overly aggressive cuts to the hypothesis space. This guarantees provable robustness against false preferences. We evaluate our method in a model predictive control setting across diverse tasks, including DM-Control, dexterous in-hand manipulation, and locomotion. The results demonstrate that our framework achieves comparable or superior performance to state-of-the-art methods in error-free settings while significantly outperforming existing method when handling high percentage of erroneous human preferences.

arxiv情報

著者 Zhixian Xie,Haode Zhang,Yizhe Feng,Wanxin Jin
発行日 2025-02-06 18:08:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Robust Reward Alignment via Hypothesis Space Batch Cutting はコメントを受け付けていません

PILAF: Optimal Human Preference Sampling for Reward Modeling

要約

大規模な言語モデルが現実世界のアプリケーションをますます駆動するにつれて、それらを人間の価値に合わせて最重要です。
人間のフィードバック(RLHF)からの強化学習は、Oracleの人間の価値がアクセスできないままである場合、優先データを報酬モデルに変換する重要な手法として浮上しています。
実際には、RLHFは主におおよその報酬モデルに依存しています。これは、基礎となる人間の価値を最大化するためのポリシーを一貫して導くことはできません。
根底にあるOracle Regideを最大化すると優先学習を明示的に調整する優先ラベル付けのための新しい応答サンプリング戦略であるAligned Feedback(PILAF)のポリシー相当学習を提案します。
Pilafは理論的に根拠があり、最適化と統計的観点の両方から最適性を示しています。
この方法は、フィードバックキュレーションが重要な反復的およびオンラインRLHF設定で強力なパフォーマンスを実装し、実証するのが簡単です。

要約(オリジナル)

As large language models increasingly drive real-world applications, aligning them with human values becomes paramount. Reinforcement Learning from Human Feedback (RLHF) has emerged as a key technique, translating preference data into reward models when oracle human values remain inaccessible. In practice, RLHF mostly relies on approximate reward models, which may not consistently guide the policy toward maximizing the underlying human values. We propose Policy-Interpolated Learning for Aligned Feedback (PILAF), a novel response sampling strategy for preference labeling that explicitly aligns preference learning with maximizing the underlying oracle reward. PILAF is theoretically grounded, demonstrating optimality from both an optimization and a statistical perspective. The method is straightforward to implement and demonstrates strong performance in iterative and online RLHF settings where feedback curation is critical.

arxiv情報

著者 Yunzhen Feng,Ariel Kwiatkowski,Kunhao Zheng,Julia Kempe,Yaqi Duan
発行日 2025-02-06 18:09:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML | PILAF: Optimal Human Preference Sampling for Reward Modeling はコメントを受け付けていません

Variational decision diagrams for quantum-inspired machine learning applications

要約

意思決定図(DDS)は、量子状態と量子動作のデータ冗長性を活用する能力により、量子回路をシミュレートするための効率的なツールとして浮上し、確率振幅の効率的な計算を可能にします。
ただし、量子機械学習(QML)へのアプリケーションは未開拓のままです。
このペーパーでは、DDSの構造的利点と量子状態を効率的に表すための変分法の適応性を組み合わせた新しいグラフ構造である変分決定図(VDD)を紹介します。
VDDの訓練性は、横方向フィールドISINGおよびHeisenberg Hamiltoniansの基底状態の推定問題にそれらを適用することにより、それらを調査します。
勾配分散の分析は、勾配を消滅させる兆候(不毛のプラトーとしても知られている)が観察されないため、勾配分散の分析が可能であることを示唆しています。
この作業は、QMLでの決定図の使用に関する新しい洞察を提供します。

要約(オリジナル)

Decision diagrams (DDs) have emerged as an efficient tool for simulating quantum circuits due to their capacity to exploit data redundancies in quantum states and quantum operations, enabling the efficient computation of probability amplitudes. However, their application in quantum machine learning (QML) has remained unexplored. This paper introduces variational decision diagrams (VDDs), a novel graph structure that combines the structural benefits of DDs with the adaptability of variational methods for efficiently representing quantum states. We investigate the trainability of VDDs by applying them to the ground state estimation problem for transverse-field Ising and Heisenberg Hamiltonians. Analysis of gradient variance suggests that training VDDs is possible, as no signs of vanishing gradients–also known as barren plateaus–are observed. This work provides new insights into the use of decision diagrams in QML as an alternative to design and train variational ans\’atze.

arxiv情報

著者 Santiago Acevedo-Mancera,Vladimir Vargas-Calderón,Herbert Vinck-Posada
発行日 2025-02-06 18:09:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, quant-ph | Variational decision diagrams for quantum-inspired machine learning applications はコメントを受け付けていません

Low-skilled Occupations Face the Highest Upskilling Pressure

要約

実質的な奨学金は、ジョブの自動化に対する感受性を推定していますが、タスクに代わる新しいテクノロジーとしての情報時代にジョブコンテンツがどのように進化するかを検討していません。
ここでは、職業スキルの変化のパターンを探り、最大の再スキル要件の対象となる職業と労働者を特徴づけます。
最近の研究では、スキル要件の変化が2010年代のSTEM職業にとって最大であることがわかりました。
それにもかかわらず、727の職業をカバーする1億6,700万のオンラインジョブ投稿を分析すると、スキル間の距離を考慮すると、スキルの変化が低スキルの職業で最も優れていることがわかります。
さらに、雇用主と市場規模のスキル変化の違い、および社会人口統計グループを調査します。
小規模な雇用主や市場からの仕事は、大規模な雇用主と市場のスキル要求に追いつくために、より大きなスキルアップグレードを経験していることがわかります。
女性と少数派の労働者は、低スキルの仕事で不釣り合いに雇用されており、最も重要なスキル調整に直面しています。
これらのさまざまなスキルの変化は、労働者間で不均一な再スキルの圧力を生み出す可能性がありますが、彼らはまた、仕事の質と見通しのギャップの狭まりにつながる可能性があります。
締めくくり、スキルの埋め込みスペースを使用して、ジョブの進化の方向をチャート化するモデルの可能性を紹介することで結論を出します。

要約(オリジナル)

Substantial scholarship has estimated the susceptibility of jobs to automation, but little has examined how job contents evolve in the information age as new technologies substitute for tasks, shifting required skills rather than eliminating entire jobs. Here we explore patterns of occupational skill change and characterize occupations and workers subject to the greatest reskilling requirements. Recent work found that changing skill requirements are greatest for STEM occupations in the 2010s. Nevertheless, analyzing 167 million online job posts covering 727 occupations, we find that skill change is greatest for low-skilled occupations when accounting for distance between skills. We further investigate the differences in skill change across employer and market size, as well as social demographic groups. We find that jobs from small employers and markets experienced larger skill upgrades to catch up with the skill demands of their large employers and markets. Female and minority workers are disproportionately employed in low-skilled jobs and face the most significant skill adjustments. While these varied skill changes could create uneven reskilling pressures across workers, they may also lead to a narrowing of gaps in job quality and prospects. We conclude by showcasing our model’s potential to chart job evolution directions using skill embedding spaces.

arxiv情報

著者 Di Tong,Lingfei Wu,James Allen Evans
発行日 2025-02-06 18:12:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG | Low-skilled Occupations Face the Highest Upskilling Pressure はコメントを受け付けていません