多くの深度センシング (または RGB-D) カメラが市場で入手可能ですが、アプリケーションに最適なものを選択するのは困難な場合があります。
この研究では、わずかに異なる視点からの 2 つの画像を使用して距離を感知する 4 台のステレオスコピック RGB-D カメラをテストしました。
私たちは 4 台のカメラ (Intel RealSense D435、Intel RealSense D455、StereoLabs ZED 2、Luxonis OAK-D Pro) を次の 3 つのシナリオで実験的に比較しました: (i) 平面認識、(ii) プラスチック人形認識、(iii) 家庭用オブジェクト認識 (
YCB データセット)。
各カメラについて 3,000 を超える RGB-D フレームを記録して評価しました。
対象物までの距離が最大 1 メートルのテーブルトップ ロボットのシナリオでは、D435 カメラが最高のパフォーマンスを提供します。
長距離では、他の 3 つのモデルのパフォーマンスが向上し、一部のモバイル ロボット アプリケーションにより適しています。
OAK-D Pro はさらに、統合 AI モジュール (物体および人間のキーポイント検出など) を提供します。
ZED 2 はスタンドアロン デバイスではないため、深度データの取得には GPU を備えたコンピューターが必要です。
すべてのデータ (12,000 を超える RGB-D フレーム) は https://osf.io/f2seb で公開されています。
Depth sensing is an essential technology in robotics and many other fields. Many depth sensing (or RGB-D) cameras are available on the market and selecting the best one for your application can be challenging. In this work, we tested four stereoscopic RGB-D cameras that sense the distance by using two images from slightly different views. We empirically compared four cameras (Intel RealSense D435, Intel RealSense D455, StereoLabs ZED 2, and Luxonis OAK-D Pro) in three scenarios: (i) planar surface perception, (ii) plastic doll perception, (iii) household object perception (YCB dataset). We recorded and evaluated more than 3,000 RGB-D frames for each camera. For table-top robotics scenarios with distance to objects up to one meter, the best performance is provided by the D435 camera. For longer distances, the other three models perform better, making them more suitable for some mobile robotics applications. OAK-D Pro additionally offers integrated AI modules (e.g., object and human keypoint detection). ZED 2 is not a standalone device and requires a computer with a GPU for depth data acquisition. All data (more than 12,000 RGB-D frames) are publicly available at https://osf.io/f2seb.
著者 | Lukas Rustler,Vojtech Volprecht,Matej Hoffmann |
発行日 | 2025-01-13 15:41:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google