コンピュータ ビジョンの問題を解決する際の事実上の標準は、一般的な高解像度カメラを使用し、人間の直観に基づいてエージェント上のカメラの配置 (つまり、位置と向き) を選択することです。
この研究では、これらの例に動機付けられて、次の質問を提起します: 1. 視覚タスクの解決において、単純な視覚センサーはどの程度効果的ですか?
2. デザインはその有効性においてどのような役割を果たしていますか?
私たちは、単一の光受容体を表す 1 行 1 ピクセルの解像度を持つ単純なセンサーを探索します。まず、視覚的なナビゲーションや継続的制御などの多くのタスクを、わずか数個の光受容体で十分に十分なパフォーマンスで解決できることを実証します。
最後に、人による調査を実施して、人間が手動で考案した直観的なデザインの有効性を評価します。これにより、計算によって見つかったデザインが、ほとんどの場合、最良のデザインの 1 つであることがわかります。
A de facto standard in solving computer vision problems is to use a common high-resolution camera and choose its placement on an agent (i.e., position and orientation) based on human intuition. On the other hand, extremely simple and well-designed visual sensors found throughout nature allow many organisms to perform diverse, complex behaviors. In this work, motivated by these examples, we raise the following questions: 1. How effective simple visual sensors are in solving vision tasks? 2. What role does their design play in their effectiveness? We explore simple sensors with resolutions as low as one-by-one pixel, representing a single photoreceptor First, we demonstrate that just a few photoreceptors can be enough to solve many tasks, such as visual navigation and continuous control, reasonably well, with performance comparable to that of a high-resolution camera. Second, we show that the design of these simple visual sensors plays a crucial role in their ability to provide useful information and successfully solve these tasks. To find a well-performing design, we present a computational design optimization algorithm and evaluate its effectiveness across different tasks and domains, showing promising results. Finally, we perform a human survey to evaluate the effectiveness of intuitive designs devised manually by humans, showing that the computationally found design is among the best designs in most cases.
著者 | Andrei Atanov,Jiawei Fu,Rishubh Singh,Isabella Yu,Andrew Spielberg,Amir Zamir |
発行日 | 2024-06-17 17:31:24+00:00 |
arxivサイト | arxiv_id(pdf) |
