Improving Physics-Augmented Continuum Neural Radiance Field-Based Geometry-Agnostic System Identification with Lagrangian Particle Optimization

要約

幾何学的形状に依存しないシステム識別は、幾何学的仮定を一切行わずにビデオ シーケンスからオブジェクトの幾何学的形状と物理的特性を識別する技術です。
最近、物理拡張連続体神経放射輝度場 (PAC-NeRF) は、ハイブリッド オイラー – ラグランジアン表現を利用することにより、この技術の有望な結果を実証しました。この表現では、幾何学形状は NeRF のオイラー グリッド表現で表現され、物理学は、
物質点法 (MPM) を使用しており、ラグランジュ粒子を介して接続されています。
ただし、PAC-NeRF の注目すべき制限は、2 段階の最適化により、そのパフォーマンスが最初のフレームからのジオメトリの学習に影響されやすいことです。
まず、ビデオ シーケンスの最初のフレームでグリッド表現が最適化され、次に、固定された最初のフレームのグリッド表現を利用してビデオ シーケンスを通じて物理的特性が最適化されます。
この制限は、たとえばショット数が少ない (まばらなビュー) 設定など、幾何学的構造の学習が難しい場合に重要になる可能性があります。
この制限を克服するために、ラグランジュ空間内のビデオ シーケンスを通じて粒子の位置と特徴を最適化するラグランジュ粒子最適化 (LPO) を提案します。
この方法により、MPM によって課される物理的制約内でビデオ シーケンス全体にわたる幾何学的構造の最適化が可能になります。
実験結果は、LPO がスパースビュー設定での幾何学的補正と物理的識別に役立つことを示しています。

要約(オリジナル)

Geometry-agnostic system identification is a technique for identifying the geometry and physical properties of an object from video sequences without any geometric assumptions. Recently, physics-augmented continuum neural radiance fields (PAC-NeRF) has demonstrated promising results for this technique by utilizing a hybrid Eulerian-Lagrangian representation, in which the geometry is represented by the Eulerian grid representations of NeRF, the physics is described by a material point method (MPM), and they are connected via Lagrangian particles. However, a notable limitation of PAC-NeRF is that its performance is sensitive to the learning of the geometry from the first frames owing to its two-step optimization. First, the grid representations are optimized with the first frames of video sequences, and then the physical properties are optimized through video sequences utilizing the fixed first-frame grid representations. This limitation can be critical when learning of the geometric structure is difficult, for example, in a few-shot (sparse view) setting. To overcome this limitation, we propose Lagrangian particle optimization (LPO), in which the positions and features of particles are optimized through video sequences in Lagrangian space. This method allows for the optimization of the geometric structure across the entire video sequence within the physical constraints imposed by the MPM. The experimental results demonstrate that the LPO is useful for geometric correction and physical identification in sparse-view settings.

arxiv情報

著者 Takuhiro Kaneko
発行日 2024-06-06 15:17:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO パーマリンク