Comparing a composite model versus chained models to locate a nearest visual object

要約

地理的な画像やテキストから情報を抽出することは、自律走行車が将来の経路に沿って接続するのに最適なセルステーションを事前に決定するために極めて重要です。しかし、このようなユースケースに適したモデルを選択するための明確なガイダンスは存在しません。そこで、このような課題を解決するために、2つのアーキテクチャを実験しました。1つ目は、連鎖するモデルで、連鎖する各モデルが課題のサブタスクに対応するアーキテクチャ、もう1つは、単一のモデルで課題全体に対応するアーキテクチャです。その結果、この2つのアーキテクチャは、二乗平均平方根誤差(RMSE)が0.055と0.056と同程度の性能を達成した。さらに、タスクをサブタスクに分解できる場合、チェーンアーキテクチャは複合モデルに比べて学習速度が12倍向上することが明らかにされた。しかし、複合モデルはデータラベリングの負担を大幅に軽減することができた。

要約(オリジナル)

Extracting information from geographic images and text is crucial for autonomous vehicles to determine in advance the best cell stations to connect to along their future path. Multiple artificial neural network models can address this challenge; however, there is no definitive guidance on the selection of an appropriate model for such use cases. Therefore, we experimented two architectures to solve such a task: a first architecture with chained models where each model in the chain addresses a sub-task of the task; and a second architecture with a single model that addresses the whole task. Our results showed that these two architectures achieved the same level performance with a root mean square error (RMSE) of 0.055 and 0.056; The findings further revealed that when the task can be decomposed into sub-tasks, the chain architecture exhibits a twelve-fold increase in training speed compared to the composite model. Nevertheless, the composite model significantly alleviates the burden of data labeling.

arxiv情報

著者 Antoine Le Borgne,Xavier Marjou,Fanny Parzysz,Tayeb Lemlouma
発行日 2023-06-02 13:58:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク