AR/VR、人機交互、教育和培訓等領域切實需要具有連續深度感知的三維場景顯現。計算生成全息是一種可行的手段,它通過數值模擬衍射和幹涉來實現具有高空間-角度分辨率的3D投影。
張量全息:實時逼真級3D全息
技術背景:
AR/VR、人機交互、教育和培訓等領域切實需要具有連續深度感知的三維場景顯現。計算生成全息是一種可行的手段,它通過數值模擬衍射和幹涉來實現具有高空間-角度分辨率的3D投影。
全息將動態光場編碼為(wei) 相位和振幅變化的幹涉圖案,即全息圖。通過選擇照明光束,全息圖將入射光衍射成原始光場的準確再現。重建的3D場景呈現準確的單目和雙目深度線索(depth cues),這是傳(chuan) 統的顯示手段難以同時實現的。然而,高效、實時地創建逼真的計算機生成全息圖(CGH)仍然是計算物理學中尚未解決(jue) 的挑戰。其主要挑戰是對連續3D空間中的每個(ge) 目標點執行菲涅耳衍射模擬所需的巨大算力要求。
有效的菲涅耳衍射模擬極具挑戰性,目前通過用物理精度換取計算速度來解決(jue) 。基於(yu) 預先計算的元素條紋、多層深度離散化、全息立體(ti) 圖、波前記錄平麵(或者中間光線采樣平麵)和僅(jin) 水平/垂直視差建模的查找表等,采取手動設計數值近似,代價(jia) 是圖像質量受損。利用GPU計算的快速發展,非近似的基於(yu) 點的方法 (point-based method, PBM)最近以每幀幾秒的速度生成了具有每像素焦點控製的彩色和紋理場景。然而,PBM為(wei) 每個(ge) 場景點獨立模擬菲涅耳衍射,因此不會(hui) 對遮擋(occlusion)進行建模。這阻止了複雜3D場景的準確再現,其中前景將因未遮擋的背景而被振鈴偽(wei) 影(2)嚴(yan) 重汙染。光場渲染可以部分解決(jue) 這種沒有遮擋的問題。然而,這種方法會(hui) 導致大量的渲染和數據存儲(chu) 開銷,並且遮擋僅(jin) 在整個(ge) 全息圖的一小部分內(nei) 是準確的。在菲涅耳衍射模擬期間添加每條射線可見性測試理想地解決(jue) 了該問題,但遮擋測試的額外成本、對相鄰點的訪問和條件分支會(hui) 減慢計算速度。這種質量與(yu) 速度的權衡是所有現有基於(yu) 物理的方法共有的特征,從(cong) 根本上限製了動態全息顯示器的實際部署。
(1)大規模的菲涅爾全息圖數據集。使用MIT-CGH-4K數據集,包含4000對RGB-D圖和相應的3D全息圖。這個(ge) 數據集有三個(ge) 重要的特征,使得CNN網絡能夠學到逼真級的3D全息圖。第一點,用於(yu) 渲染RGB-D圖像的3D場景的構建具有高複雜度和大的顏色、幾何、陰影、紋理和遮擋變化,從(cong) 而幫助CNN適用於(yu) 計算機渲染和現實世界采集的RGB-D測試輸入;第二點,生成的RGB-D圖像的像素深度分布在整個(ge) 視錐體(ti) 上是統計均勻的;第三點,根據RGB-D圖像計算的全息圖可以將每個(ge) 像素精確地聚焦到深度圖像確定的位置並正確處理遮擋(由基於(yu) 遮擋感知點的方法實現,縮寫(xie) 為(wei) OA-PBM)。
(2)全卷積殘差網絡。接收4通道的RGB-D圖像,預測的彩色全息圖是6通道圖像(RGB振幅和RGB相位)。所用網絡避免了菲涅耳衍射和遮擋的顯式近似。因為(wei) 將波場傳(chuan) 播到不同的距離相當於(yu) 將同一波場與(yu) 不同頻率的菲涅耳波帶片進行卷積。由於(yu) 波帶片是徑向對稱的,並且從(cong) 使用不同傳(chuan) 播距離的單個(ge) 基函數導出,所用網絡通過連續国产成人在线观看免费网站一組學到的3 × 3卷積核來準確地近似它們(men) 。這將衍射模擬從(cong) 空間變化的大內(nei) 核卷積減少到一組可分離且空間不變的卷積,從(cong) 而在GPU和專(zhuan) 用集成電路(ASIC)上運行速度快了幾個(ge) 數量級,以加速CNN推理。所用網絡進一步利用CNN中的非線性激活(即ReLU或整流線性單元)來處理遮擋。非線性激活選擇性地分配通過前向傳(chuan) 播產(chan) 生的中間結果,從(cong) 而阻止被遮擋波前的傳(chuan) 播。
(3)張量全息顯示原型。波長為(wei) 450nm、520nm、638nm的激光經線偏振片(所用SLM對入射偏振態有要求)後入射在反射式相位型空間光調製器(1920*1080,8um)上,用anti-aliasing double phase method(AA-DPM)將CNN預測的複全息圖編碼成相位型全息圖,可以產(chan) 生在高頻物體(ti) 和遮擋邊緣無偽(wei) 影的3D圖像。孔徑光闌放置在雙膠合透鏡的傅裏葉平麵,阻攔高階衍射,其開口半徑設置為(wei) 與(yu) 藍色光束的一階衍射範圍相匹配。全息圖的接收用目鏡和相機組合來承擔。
(1)所采用卷積神經網絡具有極高的內(nei) 存效率(低於(yu) 620 KB),並且在單個(ge) 消費級圖形處理單元上以 60 赫茲(zi) 的速度運行,分辨率為(wei) 1,920 × 1,080像素。
(2)利用低功耗的設備端人工智能加速芯片,訓練得到的CNN還可以在移動(1.1Hz 的 iphoness 11 Pro和2.2Hz 的Google Edge TPU)設備上交互運行。
(3)所提方法也對超表麵設計、基於(yu) 光鑷和聲鑷的顯微操作、全息顯微鏡和單次曝光體(ti) 積3D打印等也有幫助。
參考文獻:Shi, L., Li, B., Kim, C. et al. Towards real-time photorealistic 3D holography with deep neural networks. Nature 591, 234–239 (2021).
關(guan) 於(yu) 昊量光電:
上海昊量光電設備有限国产黄色在线观看是國內(nei) 知名光電国产欧美在线專(zhuan) 業(ye) 代理商,代理品牌均處於(yu) 相關(guan) 領域的發展前沿;国产欧美在线包括各類激光器、光電調製器、光學測量設備、精密光學元件等,涉及国产成人在线观看免费网站領域涵蓋了材料加工、光通訊、生物醫療、科學研究、國防及更細分的前沿市場如量子光學、生物顯微、物聯傳(chuan) 感、精密加工、先進激光製造等;可為(wei) 客戶提供完整的設備安裝,培訓,硬件開發,軟件開發,係統集成等優(you) 質服務。
您可以通過昊量光電的官方網站www.weilancj.com了解更多的国产欧美在线信息,或直接來電谘詢4006-888-532。
本文章經光學前沿授權轉載,商業(ye) 轉載請聯係獲得授權。