DFF: Decision-Focused Fine-tuning for Smarter Predict-then-Optimize with Limited Data


意思決定に焦点を当てた学習(DFL)は、意思決定損失(DL)に直接予測モデルを学習することで、予測-最適化(PO)フレームワークに対するエンド・ツー・エンドのアプローチを提供し、POコンテキストにおける意思決定パフォーマンスを向上させる。しかし、DFLの実装には明確な課題がある。主に、DLは限られたデータの下で、予測の物理的有意性から乖離する可能性がある。さらに、予測モデルの中には微分不可能なものやブラックボックス的なものがあり、勾配ベースの手法では調整できない。上記の課題に取り組むため、我々は、新しいバイアス補正モジュールを介してDFLモジュールをPOパイプラインに組み込む、新しいフレームワーク、DFF(Decision-Focused Fine-tuning)を提案する。DFFは制約付き最適化問題として定式化され、定義された信頼領域内で、DL拡張モデルと元の予測モデルとの近接性を維持する。DFFは、限られたデータセットであっても、予測バイアスを所定の上限値内に厳密に閉じ込めることを理論的に証明し、これにより、限られたデータの下でDLによって引き起こされる予測シフトを大幅に低減する。さらに、バイアス補正モジュールは多様な予測モデルに統合可能であり、幅広いPOタスクへの適応性を高める。異なる予測モデルを用いたネットワークフロー、ポートフォリオ最適化、リソース割り当て問題を含む、合成データセットと実世界データセットに対する広範な評価により、DFFは決定性能を向上させるだけでなく、微調整制約を遵守し、様々なシナリオにおいて頑健な適応性を示すことが実証された。


Decision-focused learning (DFL) offers an end-to-end approach to the predict-then-optimize (PO) framework by training predictive models directly on decision loss (DL), enhancing decision-making performance within PO contexts. However, the implementation of DFL poses distinct challenges. Primarily, DL can result in deviation from the physical significance of the predictions under limited data. Additionally, some predictive models are non-differentiable or black-box, which cannot be adjusted using gradient-based methods. To tackle the above challenges, we propose a novel framework, Decision-Focused Fine-tuning (DFF), which embeds the DFL module into the PO pipeline via a novel bias correction module. DFF is formulated as a constrained optimization problem that maintains the proximity of the DL-enhanced model to the original predictive model within a defined trust region. We theoretically prove that DFF strictly confines prediction bias within a predetermined upper bound, even with limited datasets, thereby substantially reducing prediction shifts caused by DL under limited data. Furthermore, the bias correction module can be integrated into diverse predictive models, enhancing adaptability to a broad range of PO tasks. Extensive evaluations on synthetic and real-world datasets, including network flow, portfolio optimization, and resource allocation problems with different predictive models, demonstrate that DFF not only improves decision performance but also adheres to fine-tuning constraints, showcasing robust adaptability across various scenarios.


著者 Jiaqi Yang,Enming Liang,Zicheng Su,Zhichao Zou,Peng Zhen,Jiecheng Guo,Wanjing Ma,Kun An
発行日 2025-01-03 15:46:25+00:00
