High-bandwidth Close-Range Information Transport through Light Pipes

要約

マルチモードファイバーを介した伝搬後の画像検索は、コンパクトなシステムで光を閉じ込めて長距離にわたって効率的に伝送できるため、注目を集めています。
ここでは、最大エントロピー(データ)画像を送信し、サブメートルの距離で情報送信を最大化するための一般的に適用可能な情報理論フレームワークを提案します。これは、光ストレージアプリケーションがストレージメディアのさまざまな部分をスケーリングおよびアドレス指定できるようにする重要な機能です。
この目的のために、ミリサイズの正方形の光導波路を使用して、メガピクセルの 8 ビット空間光変調器をイメージングします。
したがって、データは 8 ビット値 (シンボル) の 2D 配列として表されます。
数十万のシンボルを送信するには、送信行列のアプローチを超えた革新が必要です。
ディープ ニューラル ネットワークは最近、画像を取得するために利用されていますが、小さい (数千のシンボル) および自然に見える (低エントロピー) 画像に限定されていました。
帯域幅が最適化されたホモダイン検出器と、実験セットアップのデジタル ツインと U-Net で構成される微分可能なハイブリッド ニューラル ネットワークを組み合わせることで、情報伝達を最大化します。
デジタルツインについては、微分可能なモードベースのツインと微分可能なレイベースのツインを実装して比較します。
重要なことに、後者はトレーニング中に製造関連のセットアップの不完全さに適応することができ、これが重要であることが示されています。
私たちのパイプラインは、微分可能な相互情報推定量に基づいて達成可能な情報ページサイズを最大化しながら、デジタル入力画像を回復するようにエンドツーエンドでトレーニングされています。
0.3 ~ 3.4 ビットの範囲で、シンボルあたり平均 1.7 ビットで最大 66 kB の検索を示します。

要約(オリジナル)

Image retrieval after propagation through multi-mode fibers is gaining attention due to their capacity to confine light and efficiently transport it over distances in a compact system. Here, we propose a generally applicable information-theoretic framework to transmit maximal-entropy (data) images and maximize the information transmission over sub-meter distances, a crucial capability that allows optical storage applications to scale and address different parts of storage media. To this end, we use millimeter-sized square optical waveguides to image a megapixel 8-bit spatial-light modulator. Data is thus represented as a 2D array of 8-bit values (symbols). Transmitting 100000s of symbols requires innovation beyond transmission matrix approaches. Deep neural networks have been recently utilized to retrieve images, but have been limited to small (thousands of symbols) and natural looking (low entropy) images. We maximize information transmission by combining a bandwidth-optimized homodyne detector with a differentiable hybrid neural-network consisting of a digital twin of the experiment setup and a U-Net. For the digital twin, we implement and compare a differentiable mode-based twin with a differentiable ray-based twin. Importantly, the latter can adapt to manufacturing-related setup imperfections during training which we show to be crucial. Our pipeline is trained end-to-end to recover digital input images while maximizing the achievable information page size based on a differentiable mutual-information estimator. We demonstrate retrieval of 66 kB at maximum with 1.7 bit per symbol on average with a range of 0.3 – 3.4 bit.

arxiv情報

著者 Joowon Lim,Jannes Gladrow,Douglas Kelly,Greg O’Shea,Govert Verkes,Ioan Stefanovici,Sebastian Nowozin,Benn Thomsen
発行日 2023-01-19 15:44:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, physics.optics パーマリンク