首頁  技術文章  博覽:2021 Optica 宇稱時間對稱光學神經網絡

博覽:2021 Optica 宇稱時間對稱光學神經網絡

發布時間:2022-04-08 11:49:56 瀏覽量:4315 作者:LY.Young 光學前沿

摘要

采用馮(feng) -諾依曼架構的現代電子国产欧美在线的計算能力在本質上受到處理和存儲(chu) 單元之間數據傳(chuan) 輸速率的限製。如神經形態方法這樣的新興(xing) 計算架構,通過將邏輯與(yu) 內(nei) 存交織在一起,是更有效的計算策略。近年來,光學手段再次被看作為(wei) 完全或部分取代基於(yu) 電子的計算機器的有希望的選擇。其中,光計算尤其令人感興(xing) 趣,因為(wei) 它每比特所需的能量以及延時都更少。2017 年,麻省理工學院的一組研究人員通過級聯多個(ge) Mach-Zehnder幹涉儀(yi) (MZI)在矽芯片上展示了一個(ge) 突破性的、完全集成的光學神經網絡(optical neural network,ONN)。通過計算每個(ge) MZI的相應相位,可以將任意矩陣有效地映射到該ONN硬件上。對於(yu) 此類網絡,所需的非線性可以通過利用強度調製器、相機的飽和效應、光電二極管的二次非線性、半導體(ti) 放大器的飽和、可飽和吸收器等多種方法來實現。從(cong) 那時起,人們(men) 提出了許多方案來進一步優(you) 化這些陣列的實現及其片上訓練過程。

正文


博覽:2021 Optica 宇稱時間對稱光學神經網絡


技術背

采用馮(feng) -諾依曼架構的現代電子国产欧美在线的計算能力在本質上受到處理和存儲(chu) 單元之間數據傳(chuan) 輸速率的限製。如神經形態方法這樣的新興(xing) 計算架構,通過將邏輯與(yu) 內(nei) 存交織在一起,是更有效的計算策略。近年來,光學手段再次被看作為(wei) 完全或部分取代基於(yu) 電子的計算機器的有希望的選擇。其中,光計算尤其令人感興(xing) 趣,因為(wei) 它每比特所需的能量以及延時都更少。2017 年,麻省理工學院的一組研究人員通過級聯多個(ge) Mach-Zehnder幹涉儀(yi) (MZI)在矽芯片上展示了一個(ge) 突破性的、完全集成的光學神經網絡(optical neural network,ONN)。通過計算每個(ge) MZI的相應相位,可以將任意矩陣有效地映射到該ONN硬件上。對於(yu) 此類網絡,所需的非線性可以通過利用強度調製器、相機的飽和效應、光電二極管的二次非線性、半導體(ti) 放大器的飽和、可飽和吸收器等多種方法來實現。從(cong) 那時起,人們(men) 提出了許多方案來進一步優(you) 化這些陣列的實現及其片上訓練過程。

雖然 ONN 在學術和工業(ye) 界中都受到了相當大的關(guan) 注,但現在研究人員越來越意識到,改變芯片上的相位是不可取的,而且會(hui) 顯著掩蓋光子加速器的潛在優(you) 勢。在這些結構中,相位變化通常由熱光移相器(thermo-optical phase shifter)實現(利用熱光效應,通過施加偏置電流以改變光波導折射率)。然而,由於(yu) 大多數光電材料的熱光係數相對較小,產(chan) 生相位變化通常需要數十至數百微米數量級的路徑長度。處理位的數據,需要個(ge) 移相器,隨著數據量的增加,這種方案可能會(hui) 導致係統結構過大。此外,相位變化生效所需的時間相對較長,大約為(wei) 數十微秒,這會(hui) 限製片上(on chip)訓練過程的速度(因為(wei) 需要頻繁地改變相位來計算梯度)。最近的一些工作旨在利用光學快速傅立葉變換 (OFFT)、環形諧振器、光調製和3D打印的替代架構來解決(jue) 這些問題。其它基於(yu) 相變材料、電吸收和電光效應的方法也可以解決(jue) 其中的一些問題,但這些技術仍未成熟。


當前不足:
傳統的光學神經網絡(optical neural networks,ONNs)使用可調諧的移相器調節每一個MZI的輸出來模擬任意的矩陣-向量乘法。這些移相器是ONNs的可編程性的核心所在,但是它們占用空間大,且速度慢。

文章創新點:
基於此,美國南加州大學的Haoqin Deng(第一作者)和Mercedeh Khajavikhan(通訊作者)提出了一種利用宇稱時間對稱(parity-time symmetric,PT)耦合器作為構建模塊的光學神經網絡。並證明了宇稱時間對稱光學神經網絡(PT-ONNs)足以執行利用MNIST數據集的數字識別任務。相比傳統的ONNs,PT-ONN有更高的準確率(67% VS 71%),且規避了伴隨相位變化而產生的問題。


原理解析:

在光學結構中,如果折射率的實部是關於坐標原點的偶函數,而虛部(代表增益和損耗)是關於坐標原點的奇函數,則這個結構是PT對稱的。PT對稱結構本質上是增益和損耗介質的交替排列。增益和損耗介質需要外部的泵浦能量供給才能發揮作用,在某些條件下, PT對稱結構會將外部供給的泵浦能量轉換為入射光的電磁能量,從而產生大於1的透射率(張亦弛 2019)。
(1)PT-ONN架構。宇稱時間對稱耦合器由一對波導組成,一個具有增益功能,另一個具有相似的損耗。傳播常數是特征值,而電磁模式代表係統的特征向量。在輸入和輸出端口上添加的常數相位(ф11,ф12,ф21,ф22)使得傳輸矩陣是實矩陣。見圖1。



其輸入與(yu) 輸出的關(guan) 係為(wei) :

Z為(wei) 常數,θ為(wei) 與(yu) 增益和損耗相關(guan) 的需要訓練得到的參數。這可以通過泵浦/載流子注入在標準III-V半導體(ti) 係統中輕鬆實現。由於(yu) 在空間、功耗和速度方麵,改變增益-損耗係數比改變相位更有效,因此PT-ONN架構可潛在地需要更小的占用空間並以更低的功率加速片上訓練。

(2)兩(liang) 層宇稱時間對稱ONN。如圖2所示,在第一層,激光編碼N1個(ge) 像素,光信號首先被發送到由(N1(N1-1)/2)個(ge) 宇稱時間對稱耦合器組成的三角形陣列。然後,光經過N2個(ge) 放大器/衰減器,隨後為(wei) 由(N2(N2-1)/2)個(ge) 宇稱時間對稱耦合器組成的第二個(ge) 三角形陣列,然後是N2個(ge) 非線性元件。第二層用星號表示,包含了相似的元件,但是有N2和N3值。該層終止於(yu) N3個(ge) 光電探測器。值N1、N2、N3分別表示輸入層、隱藏層和輸出層的維度。光電探測器的輸出發送到電子電路以計算PT耦合器增益損失參數,以在訓練周期中實施梯度下降算法。



附錄:

(1) Parity-Time對稱理論(張亦弛 2019)

Parity-Time對稱,簡稱PT對稱,是源於(yu) 量子力學中的概念,指的是係統的時間變換和宇稱變換時對稱的。在量子力學中,力學量通常用算符表示,而哈密頓算符(Hamiltonian)表示一個(ge) 係統中的總能量。一般認為(wei) ,一個(ge) 可以觀測到的物理量的算符必須滿足厄密(Hermitian)對稱條件,即某物理量矩陣滿足共軛對稱是保證其具有實數的特征值的充要條件。直到上世紀90年代末,C.M.Bender等人指出厄密對稱隻是物理量矩陣具有實數本征值的充分條件,並給出了一組新的對稱條件。滿足這組新的對稱條件,單不滿足厄密對稱的哈密頓算符也可以具有實數本征值,這組新的對稱條件即PT對稱條件。

具體(ti) 而言,當某個(ge) 係統的哈密頓算符滿足式(1.1)所示的條件時,就可以認為(wei) 該係統滿足PT對稱條件。

的表達式通常含有空間變量和動量變量。表示宇稱變換,效果是將空間變量和動量變量同時反轉,即

表示時間變換,它同時反轉動量和虛數單位,即

某個(ge) 是否滿足PT對稱條件,很大程度上由這個(ge) 係統的勢函數分布所決(jue) 定。舉(ju) 個(ge) 例子,設

為(wei) 一非厄密對稱的哈密頓算符,其中為(wei) 空間坐標,勢函數為(wei) 複函數。根據上述對的定義(yi) ,很容易得到

結合式(1.1)就可以將哈密頓算符的PT對稱條件轉換為(wei) 勢函數的對稱條件

即係統的勢函數在空間分布上必須是共軛複對稱的。


參考文獻:Haoqin Deng and Mercedeh Khajavikhan, "Parity–time symmetric optical neural networks," Optica 8, 1328-1333 (2021)

DOI:https://doi.org/10.1364/OPTICA.435525


關(guan) 於(yu) 昊量光電

上海昊量光電設備有限国产黄色在线观看是國內(nei) 知名光電国产欧美在线專(zhuan) 業(ye) 代理商,代理品牌均處於(yu) 相關(guan) 領域的發展前沿;国产欧美在线包括各類激光器、光電調製器、光學測量設備、精密光學元件等,涉及国产成人在线观看免费网站領域涵蓋了材料加工、光通訊、生物醫療、科學研究、國防及更細分的前沿市場如量子光學、生物顯微、物聯傳(chuan) 感、精密加工、先進激光製造等;可為(wei) 客戶提供完整的設備安裝,培訓,硬件開發,軟件開發,係統集成等優(you) 質服務。


您可以通過昊量光電的官方網站www.weilancj.com了解更多的国产欧美在线信息,或直接來電谘詢4006-888-532。


本文章經光學前沿授權轉載,商業(ye) 轉載請聯係獲得授權。