Solving Vision Tasks with Simple Photoreceptors Instead of Cameras

要約

コンピュータ ビジョンの問題を解決する際の事実上の標準は、一般的な高解像度カメラを使用し、人間の直観に基づいてエージェント上のカメラの配置 (つまり、位置と向き) を選択することです。
その一方で、自然界に存在する非常にシンプルでうまく設計された視覚センサーのおかげで、多くの生物は多様で複雑な行動を行うことができます。
この研究では、これらの例に動機付けられて、次の質問を提起します: 1. 視覚タスクの解決において、単純な視覚センサーはどの程度効果的ですか?
2. デザインはその有効性においてどのような役割を果たしていますか?
私たちは、単一の光受容体を表す 1 行 1 ピクセルの解像度を持つ単純なセンサーを探索します。まず、視覚的なナビゲーションや継続的制御などの多くのタスクを、わずか数個の光受容体で十分に十分なパフォーマンスで解決できることを実証します。
高解像度カメラに匹敵します。
次に、これらの単純な視覚センサーの設計が、有用な情報を提供し、これらのタスクを首尾よく解決する能力において重要な役割を果たすことを示します。
優れたパフォーマンスの設計を見つけるために、計算設計最適化アルゴリズムを提示し、さまざまなタスクやドメインにわたってその有効性を評価し、有望な結果を示します。
最後に、人による調査を実施して、人間が手動で考案した直観的なデザインの有効性を評価します。これにより、計算によって見つかったデザインが、ほとんどの場合、最良のデザインの 1 つであることがわかります。

要約(オリジナル)

A de facto standard in solving computer vision problems is to use a common high-resolution camera and choose its placement on an agent (i.e., position and orientation) based on human intuition. On the other hand, extremely simple and well-designed visual sensors found throughout nature allow many organisms to perform diverse, complex behaviors. In this work, motivated by these examples, we raise the following questions: 1. How effective simple visual sensors are in solving vision tasks? 2. What role does their design play in their effectiveness? We explore simple sensors with resolutions as low as one-by-one pixel, representing a single photoreceptor First, we demonstrate that just a few photoreceptors can be enough to solve many tasks, such as visual navigation and continuous control, reasonably well, with performance comparable to that of a high-resolution camera. Second, we show that the design of these simple visual sensors plays a crucial role in their ability to provide useful information and successfully solve these tasks. To find a well-performing design, we present a computational design optimization algorithm and evaluate its effectiveness across different tasks and domains, showing promising results. Finally, we perform a human survey to evaluate the effectiveness of intuitive designs devised manually by humans, showing that the computationally found design is among the best designs in most cases.

arxiv情報

著者 Andrei Atanov,Jiawei Fu,Rishubh Singh,Isabella Yu,Andrew Spielberg,Amir Zamir
発行日 2024-06-17 17:31:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク