Mining Invariance from Nonlinear Multi-Environment Data: Binary Classification

要約

複数のトレーニング環境からのデータを考慮して、目に見えない環境で予測を行うのは困難な作業です。
私たちは不変性の観点からこの問題にアプローチし、一般的な非線形データ生成メカニズムを明らかにするためにバイナリ分類に焦点を当てます。
私たちは、環境全体にわたって不変なモデルをトレーニングできるようにする、バイナリ設定のみに存在する独自の形式の不変性を特定しました。
我々はそのような不変性のための十分な条件を提供し、環境条件が大きく変化する場合でもそれが堅牢であることを示します。
私たちの定式化は因果関係の解釈を認めているため、さまざまなフレームワークと比較することができます。
最後に、ヒューリスティックな予測手法を提案し、実際のデータセットと合成データセットを使用して実験を行います。

要約(オリジナル)

Making predictions in an unseen environment given data from multiple training environments is a challenging task. We approach this problem from an invariance perspective, focusing on binary classification to shed light on general nonlinear data generation mechanisms. We identify a unique form of invariance that exists solely in a binary setting that allows us to train models invariant over environments. We provide sufficient conditions for such invariance and show it is robust even when environmental conditions vary greatly. Our formulation admits a causal interpretation, allowing us to compare it with various frameworks. Finally, we propose a heuristic prediction method and conduct experiments using real and synthetic datasets.

arxiv情報

著者 Austin Goddard,Kang Du,Yu Xiang
発行日 2024-04-23 17:26:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME パーマリンク