要約
マルチモードファイバーはコンパクトなシステム内に光を効率的に閉じ込めて伝送する能力があるため、マルチモードファイバーを介して伝送された画像を取得することへの関心が高まっています。
ここでは、光ストレージ アプリケーションのページ容量を最大化する、大規模なデジタル画像 (ページ) の機械学習ベースのデコードを実証します。
ミリメートルサイズの正方形断面導波路を使用して、8 ビット空間光変調器をイメージ化し、データをシンボルの行列として表示します。
通常、デコーダでは、空間的にスクランブルされたデータ内の n 個のシンボルをデコードするために、法外な O(n^2) の計算スケーリングが発生します。
ただし、セットアップのデジタル ツインを U-Net と組み合わせることで、効率的な畳み込み演算のみを使用して最大 66 KB を取得できます。
私たちは、トレーニング可能なレイトレーシング ベースのツインと固有モード ベースのツインを比較し、前者が光学的欠陥を調整することでシミュレーションと実験のギャップを克服する能力のおかげで優れていることを示します。
一般に位相コーディング チャネルに適用できるフォン ミゼス分布に基づく微分可能な相互情報量推定器を使用して、パイプラインをエンドツーエンドでトレーニングします。
要約(オリジナル)
Retrieving images transmitted through multi-mode fibers is of growing interest, thanks to their ability to confine and transport light efficiently in a compact system. Here, we demonstrate machine-learning-based decoding of large-scale digital images (pages), maximizing page capacity for optical storage applications. Using a millimeter-sized square cross-section waveguide, we image an 8-bit spatial light modulator, presenting data as a matrix of symbols. Normally, decoders will incur a prohibitive O(n^2) computational scaling to decode n symbols in spatially scrambled data. However, by combining a digital twin of the setup with a U-Net, we can retrieve up to 66 kB using efficient convolutional operations only. We compare trainable ray-tracing-based with eigenmode-based twins and show the former to be superior thanks to its ability to overcome the simulation-to-experiment gap by adjusting to optical imperfections. We train the pipeline end-to-end using a differentiable mutual-information estimator based on the von-Mises distribution, generally applicable to phase-coding channels.
arxiv情報
著者 | Joowon Lim,Jannes Gladrow,Douglas Kelly,Greg O’Shea,Govert Verkes,Ioan Stefanovici,Sebastian Nowozin,Benn Thomsen |
発行日 | 2023-08-24 16:39:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google