首頁  技術文章  拉曼多組分分析中的偏最小二乘算法

拉曼多組分分析中的偏最小二乘算法

發布時間:2022-05-10 11:44:02 瀏覽量:2772 作者:Leon

摘要

拉曼光譜是分析生物樣品中生物分子含量的有力工具。通過檢測光子的波長變化和發生這種變化的光子的大小,就可能確定化學鍵和當前化學物質的濃度。拉曼光譜在多組分分析中的国产成人在线观看免费网站一直是一個(ge) 活躍的研究領域,例如僅(jin) 使用少量液體(ti) 就可瞬間測量人體(ti) 血液和尿液樣本中的一係列分析物。該方法不需要額外的化學品,樣品不受測量過程的影響。

正文


拉曼多組分分析中的偏最小二乘算法

在過去的二十年中,人們(men) 對拉曼光譜在測量多組分混合物中不同組分濃度方麵的国产成人在线观看免费网站有相當大的興(xing) 趣。首先是建立一個(ge) 純形式的單個(ge) 組分的拉曼光譜數據庫來實現的。然後国产成人在线观看免费网站最小二乘算法找到一個(ge) 最佳擬合說明混合光譜。偏最小二乘算法返回的權值表示每個(ge) 分量的相對濃度。該方法可国产成人在线观看免费网站來估計血液和尿液樣品中各種分析物的濃度,包括葡萄糖。多分量分析的核心的算法為(wei) 偏最小二乘(PLS)。下麵將討論如何利用PLS對生物樣品中的化學濃度進行建模和預測,並驗證所建立模型的預測精度。


PLS是用拉曼光譜進行多組分分析的核心數學方法。PLS結合多元回歸和主成分分析(PCA)的原理,以檢驗因變量和自變量的方差,同時考慮它們(men) 之間的相關(guan) 性。偏最小二乘回歸(PLSR)是基於(yu) 自變量(例如波長變化)和因變量(例如分析物的濃度)之間的線性關(guan) 係的假設。它類似於(yu) 主成分回歸(PCR),因為(wei) 它試圖構建一個(ge) 稀疏潛變量的矩陣,然而,不同的是,在PLS中,自變量被構建為(wei) 與(yu) 因變量具有高協方差。因此,PLS優(you) 化了方差解釋和與(yu) 因變量的相關(guan) 性,而PCR在構建自在變量時沒有使用響應。


在預測數據時,需要評估或驗證模型的準確性及其預測精度。相關(guan) 係數r是變量之間線性關(guan) 係強度的度量。在回歸分析中,r2被稱為(wei) 決(jue) 定係數,它是衡量自變量用來預測因變量的準確性的一個(ge) 指標。r更明確地定義(yi) 為(wei) :



其中n表示數據對的個(ge) 數。r2是r的平方。r的取值範圍是+1到-1,+1表示線性正相關(guan) ,即x增加,y增加。-1表示負相關(guan) ,即x增加,y減少。r2在0和1之間,1表示完全相關(guan) ,0表示不相關(guan) 。


均方根誤差(RMSE)是衡量包括PCR和PLSR在內(nei) 的回歸模型擬合優(you) 度的常用指標。它是預測濃度(殘差)與(yu) 觀測濃度(殘差)之差的樣本標準差。交叉驗證涉及到將數據分割成子集,用於(yu) 訓練和測試模型。交叉驗證的留一法涉及分離單個(ge) 樣品及其光譜。其餘(yu) 的樣本用於(yu) 訓練目的,然後該模型用於(yu) 預測分離樣本。這個(ge) 過程會(hui) 反複進行,直到每個(ge) 樣本都被用作針對剩餘(yu) 池的數據測試集。驗證測試結果等措施的根均方誤差預測(RMSEP),當處理一組測試數據和一組訓練數據,和交叉驗證的根均方誤差(RMSECV),當處理多個(ge) 測試和訓練數據的組合。更明確:



其中n為(wei) 集合中元素的總數,L為(wei) 訓練數據,k為(wei) 所選訓練數據的子集。


您可以通過我們(men) 昊量光電的官方網站www.weilancj.com了解更多的国产欧美在线信息,或直接來電谘詢4006-888-532,我們(men) 將竭誠為(wei) 您服務。