要約
現実の状況にニューラル ネットワークを展開する場合、サイズと計算量が制限要因になることがよくあります。
これは、予算が厳しいことが多い組み込み医療機器など、大型で高価なハードウェアを購入できない環境では特に当てはまります。
最先端技術では、そのようなユースケースに対して、主に入力と出力の解像度を考慮せずにベースモデルのアーキテクチャを変更することによって、複数の異なる軽量ソリューションが提案されています。
このペーパーでは、ハードウェアが制限された環境では、より高いスループットを保証するために利用可能な最高の入力解像度の使用を控えることが多いという事実を利用するアーキテクチャを提案します。
低解像度の入力を使用すると、コンピューティング要件とメモリ要件が大幅に削減されますが、予測品質も低下する可能性があります。
私たちのアーキテクチャは、トレーニングで高解像度のグラウンドトゥルースを引き続き利用できるという事実を利用することで、この問題に対処します。
提案されたモデルは、低解像度の画像と高解像度のグラウンド トゥルースを入力するため、モデルに追加するパラメーターは 200 未満でありながら、予測品質を 5.5% 向上させることができます。
% 1 秒あたりのフレーム数を 25 から 20 に減らすだけです。私たちは広範な分析を実施して、MRI 画像におけるがんの軽量セマンティック セグメンテーションのアーキテクチャが既存の最先端のフレームワークを強化していることを示しています。
また、最先端の軽量ネットワークの展開速度と、リソースに制約のある組み込みシナリオでの展開をエミュレートするために、Nvidia の Jetson Nano でのアーキテクチャをテストしました。
要約(オリジナル)
When deploying neural networks in real-life situations, the size and computational effort are often the limiting factors. This is especially true in environments where big, expensive hardware is not affordable, like in embedded medical devices, where budgets are often tight. State-of-the-art proposed multiple different lightweight solutions for such use cases, mostly by changing the base model architecture, not taking the input and output resolution into consideration. In this paper, we propose our architecture that takes advantage of the fact that in hardware-limited environments, we often refrain from using the highest available input resolutions to guarantee a higher throughput. Although using lower-resolution input leads to a significant reduction in computing and memory requirements, it may also incur reduced prediction quality. Our architecture addresses this problem by exploiting the fact that we can still utilize high-resolution ground-truths in training. The proposed model inputs lower-resolution images and high-resolution ground truths, which can improve the prediction quality by 5.5% while adding less than 200 parameters to the model. %reducing the frames per second only from 25 to 20. We conduct an extensive analysis to illustrate that our architecture enhances existing state-of-the-art frameworks for lightweight semantic segmentation of cancer in MRI images. We also tested the deployment speed of state-of-the-art lightweight networks and our architecture on Nvidia’s Jetson Nano to emulate deployment in resource-constrained embedded scenarios.
arxiv情報
著者 | Erik Ostrowski,Muhammad Shafique |
発行日 | 2024-03-08 14:17:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google