要約
3D ガウス スプラッティング (3DGS) は、その優れたビジュアル品質とレンダリング速度により、学術界と産業界の両方でますます注目を集めています。
ただし、3DGS モデルのトレーニングは依然として時間のかかるタスクであり、特にピクセルとガウス球間のワークロードの多様性によってレンダリング CUDA カーネルのパフォーマンスが低下する負荷不均衡シナリオでは、特に時間がかかります。
バランスのとれた 3DGS を導入します。これは、3DGS トレーニング プロセスでのきめの細かいタイリング アプローチを使用したガウス単位の並列処理レンダリングであり、負荷の不均衡の問題を完全に解決します。
まず、単一の GPU 内のストリーミング マルチプロセッサ (SM) リソースにワークロードを動的にマッピングするブロック間動的ワークロード分散手法を革新的に導入し、ロード バランシングの基礎を構成します。
第 2 に、負荷の不均衡に対処する上で重要なコンポーネントとして機能する、ワープ内のワークロードの発散を大幅に削減するためのガウス的な並列レンダリング手法を初めて提案しました。
上記の 2 つの方法に基づいて、すべての SM にワークロードを均一に分散するためのきめの細かい複合負荷分散手法をさらに創造的に提案し、これによりフォワード renderCUDA カーネルのパフォーマンスが最大 7.52 倍向上します。
さらに、さまざまな負荷バランス状況に基づいて 3DGS トレーニング プロセス中に自己適応型レンダー カーネル選択戦略を提示し、トレーニング効率を効果的に向上させます。
要約(オリジナル)
3D Gaussian Splatting (3DGS) is increasingly attracting attention in both academia and industry owing to its superior visual quality and rendering speed. However, training a 3DGS model remains a time-intensive task, especially in load imbalance scenarios where workload diversity among pixels and Gaussian spheres causes poor renderCUDA kernel performance. We introduce Balanced 3DGS, a Gaussian-wise parallelism rendering with fine-grained tiling approach in 3DGS training process, perfectly solving load-imbalance issues. First, we innovatively introduce the inter-block dynamic workload distribution technique to map workloads to Streaming Multiprocessor(SM) resources within a single GPU dynamically, which constitutes the foundation of load balancing. Second, we are the first to propose the Gaussian-wise parallel rendering technique to significantly reduce workload divergence inside a warp, which serves as a critical component in addressing load imbalance. Based on the above two methods, we further creatively put forward the fine-grained combined load balancing technique to uniformly distribute workload across all SMs, which boosts the forward renderCUDA kernel performance by up to 7.52x. Besides, we present a self-adaptive render kernel selection strategy during the 3DGS training process based on different load-balance situations, which effectively improves training efficiency.
arxiv情報
著者 | Hao Gui,Lin Hu,Rui Chen,Mingxiao Huang,Yuxin Yin,Jin Yang,Yong Wu,Chen Liu,Zhongxu Sun,Xueyang Zhang,Kun Zhan |
発行日 | 2025-01-08 13:31:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google