要約
高密度予測は、コンピューター ビジョンにおける重要なタスクです。
ただし、以前の方法では多くの場合、大規模な計算リソースが必要となるため、現実世界への応用が妨げられます。
この論文では、効率的かつ正確な密予測タスクのために設計された一般化バイナリ ニューラル ネットワーク (BNN) である BiDense を提案します。
BiDense には、分布適応型バイナライザ (DAB) とチャネル適応型全精度バイパス (CFB) という 2 つの主要な技術が組み込まれています。
DAB は、二値化のしきい値とスケーリング係数を適応的に計算し、BNN 内により多くの情報を効果的に保持します。
一方、CFB は、さまざまなチャネル サイズ変換を受けるバイナリ畳み込み層の完全精度バイパスを容易にし、実数値信号の伝播を強化し、情報損失を最小限に抑えます。
これらの技術を活用することで、BiDense はより多くの実数値の情報を保存し、BNN でのより正確で詳細な密予測を可能にします。
広範な実験により、私たちのフレームワークがメモリ使用量と計算コストを大幅に削減しながら、完全精度モデルに匹敵するパフォーマンス レベルを達成できることが実証されました。
要約(オリジナル)
Dense prediction is a critical task in computer vision. However, previous methods often require extensive computational resources, which hinders their real-world application. In this paper, we propose BiDense, a generalized binary neural network (BNN) designed for efficient and accurate dense prediction tasks. BiDense incorporates two key techniques: the Distribution-adaptive Binarizer (DAB) and the Channel-adaptive Full-precision Bypass (CFB). The DAB adaptively calculates thresholds and scaling factors for binarization, effectively retaining more information within BNNs. Meanwhile, the CFB facilitates full-precision bypassing for binary convolutional layers undergoing various channel size transformations, which enhances the propagation of real-valued signals and minimizes information loss. By leveraging these techniques, BiDense preserves more real-valued information, enabling more accurate and detailed dense predictions in BNNs. Extensive experiments demonstrate that our framework achieves performance levels comparable to full-precision models while significantly reducing memory usage and computational costs.
arxiv情報
著者 | Rui Yin,Haotong Qin,Yulun Zhang,Wenbo Li,Yong Guo,Jianjun Zhu,Cheng Wang,Biao Jia |
発行日 | 2024-11-15 16:46:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google