由電子驅動的計算處理器在過去十年中有了巨大的發展,從(cong) 通用中央處理器 (CPU) 到專(zhuan) 用計算平台,例如圖形處理器 (GPU)、現場可編程門陣列(FPGA)和專(zhuan) 用集成電路(ASIC),以滿足日益增長的計算資源需求。這些矽計算硬件平台的進步通過允許訓練更大規模和更複雜的模型,為(wei) 人工智能 (AI) 的複興(xing) 做出了巨大貢獻。各種神經計算架構在廣泛領域得到了廣泛国产成人在线观看免费网站,例如卷積神經網絡 (convolutional neural networks,CNN)、循環神經網絡 (recurrent neural networks,RNN)、尖峰神經網絡(spiking neural networks)和儲(chu) 備池計算(reservoir computing)等。然而,隨著摩爾定律接近其物理極限,電子硬件實現的性能增長已經達到了不可持續的水平,其速度和能量從(cong) 根本上受到寄生電容、隧道效應和串擾的限製。因此,盡管目前電子處理器占主導地位,但下一代計算模式的發展更值得期待。
博覽:2021 NaturePhotonics 具有可重構衍射處理單元的大規模神經形態光電計算
技術背景:
由電子驅動的計算處理器在過去十年中有了巨大的發展,從(cong) 通用中央處理器 (CPU) 到專(zhuan) 用計算平台,例如圖形處理器 (GPU)、現場可編程門陣列(FPGA)和專(zhuan) 用集成電路(ASIC),以滿足日益增長的計算資源需求。這些矽計算硬件平台的進步通過允許訓練更大規模和更複雜的模型,為(wei) 人工智能 (AI) 的複興(xing) 做出了巨大貢獻。各種神經計算架構在廣泛領域得到了廣泛国产成人在线观看免费网站,例如卷積神經網絡 (convolutional neural networks,CNN)、循環神經網絡 (recurrent neural networks,RNN)、尖峰神經網絡(spiking neural networks)和儲(chu) 備池計算(reservoir computing)等。然而,隨著摩爾定律接近其物理極限,電子硬件實現的性能增長已經達到了不可持續的水平,其速度和能量從(cong) 根本上受到寄生電容、隧道效應和串擾的限製。因此,盡管目前電子處理器占主導地位,但下一代計算模式的發展更值得期待。
光計算使用光子代替電子進行計算,這一過程可以克服電子學的固有局限性,將能源效率、處理速度和計算吞吐量提高幾個(ge) 數量級。這種非凡的特性已被用於(yu) 構建專(zhuan) 用光學處理器,用於(yu) 解決(jue) 基本的數學和信號處理問題,其性能遠遠超出現有電子處理器的性能。特別是,人工神經網絡 (ANN) 是非常有前途的光學計算模型之一,其中神經元功能及其密集的互連性可以通過光電設備和光傳(chuan) 播的性質有效地實現。zui近在光學加速神經信息處理方麵取得了重大進展,能夠完成一些高ji AI任務。
當前不足:
(1)現有的光學AI加速器隻能支持為(wei) 特定神經網絡架構或任務定製的單一功能,無法適應不同任務的不同AI算法。
(2)當前光神經網絡的模型複雜度和實驗性能相當低,導致網絡性能(例如分類精度)與(yu) 電子人工神經網絡相比存在很大差距。造成這種情況的原因主要是由於(yu) 光學中網絡設計空間的靈活性有限(例如,理想的非線性運算難以整合、難以靈活控製複雜的數據流、光學係統的不完善等導致模型的偏差和實際計算誤差的積累)。
文章創新點:
基於(yu) 此,清華大學戴瓊海組的Tiankuang Zhou(第1作者)等人提出了一種用於(yu) 大規模神經形態光電計算的可重構衍射處理單元 (diffractive processing unit,DPU),可以對其進行編程以改變其功能並構建不同類型的ANN架構。其幾乎所有的計算操作都是通過光學衍射實現,可編程性是通過電子方式控製。作者展示了具有可支持數百萬(wan) 個(ge) 神經元的DPU的複雜衍射神經網絡 (DNN) 的靈活設計。並開發了一種自適應訓練方法來解決(jue) 由不同誤差源(如對準誤差和非理想器件特性)引起的模型偏差,並獲得證明高性能的實驗結果。
原理解析(數學模型見附錄):
(1)網絡架構。衍射處理單元(diffractive processing unit, DPU)是一個(ge) 類似於(yu) 感知機的光電計算模塊,可以被編程用於(yu) 構建不同的衍射神經網絡(diffractive neural networks,DNNs)。其功能示意見圖1a,其物理原型見圖2。DPU的輸入數據被量化並電光轉換為(wei) 複數值光場,用信息編碼模塊在幅度(DMD實現)或相位分量(SLM實現)上進行編碼。不同的輸入節點通過光衍射連接物理連接到單個(ge) 輸出神經元(sMOS上的像素),其中控製連接強度的突觸權重由波前的衍射(瑞利-索末菲衍射理論)調製決(jue) 定。每個(ge) 衍射光電神經元對其加權輸入進行光場求和,並通過複激活函數(scmos的光電轉換過程)對複數入射光場生成單元輸出。如圖1c-e,通過DPU的不同組合(時間上或空間上),可以產(chan) 生衍射深度神經網絡(diffractive deep neural network,D2NN)、網絡中的衍射網絡(diffractive network in network,D-NIN-1)、衍射循環神經網絡(diffractive recurrent neural network,D-RNN)。DMD和SLM作為(wei) 光學調製器,擔當輸入節點,scmos作為(wei) 光電探測器,擔當光電神經元。
(2)網絡物理實現。如圖2,DMD對入射相幹光進行振幅調製,L2和L3組成4f係統,SLM上的光場與(yu) DMD上的光場共軛,兩(liang) 個(ge) 偏振片用於(yu) 調節光強。SLM對入射光場進行相位調製。sCMOS用於(yu) 接收衍射傳(chuan) 播的光場,並利用自身的光電效應類比複數激活函數,將複數光場轉化為(wei) 強度值。
(3)模型訓練。首先在計算機上利用基於(yu) 物理信息的前向模型,使用誤差反向傳(chuan) 播方法,損失函數使用zui後一層的輸出和ground truth之間的測量(均方根誤差或softmax交叉熵)來預訓練出一個(ge) 模型,即獲得SLM在每一層(指的是每一個(ge) DPU層)其相位調製的參數、DMD在每一層的顯示圖案以及sCMOS相機在光軸上的位置等。由於(yu) 光學係統存在的實際誤差,會(hui) 導致預訓練的模型預測能力不高,因此需要後續再采取自適應訓練法糾正模型的參數,具體(ti) 為(wei) 先使用預訓練的第1層參數獲得第1層實際輸出,然後用第1層的實際輸出作為(wei) 第二層的輸入,重新訓練出後續網絡的物理參數,依次類推,得到符合真實物理場景的模型參數。優(you) 化使用常見的Adam優(you) 化器。
參考文獻:Zhou, T., Lin, X., Wu, J. et al. Large-scale neuromorphic optoelectronic computing with a reconfigurable diffractive processing unit. Nat. Photonics 15, 367–373 (2021).
DOI:https://doi.org/10.1038/s41566-021-00796-w
視頻1:D2NN在 MNIST 數據庫上的實驗結果。
視頻2:D-RNN在Weizmann數據庫上的實驗結果
附錄:
DPU輸出與(yu) DPU輸入的前向模型為(wei)
損失函數
關(guan) 於(yu) 昊量光電:
上海昊量光電設備有限国产黄色在线观看是光電国产欧美在线專(zhuan) 業(ye) 代理商,国产欧美在线包括各類激光器、光電調製器、光學測量設備、光學元件等,涉及国产成人在线观看免费网站涵蓋了材料加工、光通訊、生物醫療、科學研究、國防、量子光學、生物顯微、物聯傳(chuan) 感、激光製造等;可為(wei) 客戶提供完整的設備安裝,培訓,硬件開發,軟件開發,係統集成等服務。
您可以通過我們(men) 昊量光電的官方網站www.weilancj.com了解更多的国产欧美在线信息,或直接來電谘詢4006-888-532。
本文章經光學前沿授權轉載,商業(ye) 轉載請聯係獲得授權。
展示全部