An Empirical Study on Bugs Inside PyTorch: A Replication Study

要約

ソフトウェア システムは、複雑なデータ パターンを識別し、インテリジェントな動作を強化するという優れた能力により、ディープ ラーニング コンポーネントへの依存度を高めています。
ソフトウェア開発におけるこの変化を実現する中心的な要因は、使いやすい深層学習ライブラリの利用可能性です。
PyTorch や TensorFlow などのライブラリは、さまざまなインテリジェント システムを強化し、システムの多数のドメインに適用できる多数のアルゴリズムと構成オプションを提供します。
ただし、これらの一般的な深層学習ライブラリのバグは、それが実現するシステムの品質に悲惨な結果をもたらす可能性もあります。
したがって、これらのライブラリでバグがどのように特定され、修正されるかを理解することが重要です。
TensorFlow でのバグの特定と修正プロセスを調査した Jia らの研究に触発され、非常に人気のある深層学習フレームワークである PyTorch ライブラリのバグを特徴付けます。
PyTorch の開発中に特定されたバグの原因と症状を調査し、プロジェクト内での局所性を評価し、バグ修正のパターンを抽出します。
私たちの結果は、PyTorch のバグが深層学習の特性に関連しているというよりも、従来のソフトウェア プロジェクトのバグに近いことを強調しています。
最後に、結果を TensorFlow に関する研究と比較し、バグの特定と修正のプロセス全体にわたる類似点と相違点を強調します。

要約(オリジナル)

Software systems are increasingly relying on deep learning components, due to their remarkable capability of identifying complex data patterns and powering intelligent behaviour. A core enabler of this change in software development is the availability of easy-to-use deep learning libraries. Libraries like PyTorch and TensorFlow empower a large variety of intelligent systems, offering a multitude of algorithms and configuration options, applicable to numerous domains of systems. However, bugs in those popular deep learning libraries also may have dire consequences for the quality of systems they enable; thus, it is important to understand how bugs are identified and fixed in those libraries. Inspired by a study of Jia et al., which investigates the bug identification and fixing process at TensorFlow, we characterize bugs in the PyTorch library, a very popular deep learning framework. We investigate the causes and symptoms of bugs identified during PyTorch’s development, and assess their locality within the project, and extract patterns of bug fixes. Our results highlight that PyTorch bugs are more like traditional software projects bugs, than related to deep learning characteristics. Finally, we also compare our results with the study on TensorFlow, highlighting similarities and differences across the bug identification and fixing process.

arxiv情報

著者 Sharon Chee Yin Ho,Vahid Majdinasab,Mohayeminul Islam,Diego Elias Costa,Emad Shihab,Foutse Khomh,Sarah Nadi,Muhammad Raza
発行日 2023-08-01 16:52:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SE パーマリンク