用python進(jìn)行近紅外光譜儀解析
近紅外光譜儀(NIR)是干什么的?
簡單來說就是儀器,拿樣本拍照后會有一個特殊的光譜圖。近紅外光譜儀不僅能反映樣本的分子結(jié)構(gòu),還能反映一些分子之間的相互作用。所以可以用一些其他的玩法,比如拍照后可以無損檢測橘子的甜度等等。然后此外NIR優(yōu)點(diǎn)是不需要準(zhǔn)備就拿樣本照,結(jié)果也很快,總之很方便。
在自動化實驗室中(Self-driving?laboratory)我覺得NIR它應(yīng)該是不可或缺的一部分。通過建立QSAR/QSPR模型和in?silico?design在設(shè)計了新的候補(bǔ)物質(zhì)后,可以將更好的候補(bǔ)物質(zhì)扔給機(jī)器人合成。合成后,在批量生產(chǎn)的準(zhǔn)備階段得到一個NIR合成產(chǎn)品的質(zhì)量可以控制,也有利于進(jìn)一步分析和改進(jìn)工藝。
近紅外光譜儀數(shù)據(jù)
讓我們來看看數(shù)據(jù)集是什么樣子的。
這里有67個樣本。根據(jù)波長范圍的不同,分為373個部分。
這里的API指相關(guān)藥物的有效成分量。由于近紅外光譜儀與有效成分信息密切相關(guān),我們可以通過構(gòu)建模型來分析有效成分的濃度。
接下來,數(shù)據(jù)集的有效成分分布可能是這樣的。有點(diǎn)不平衡。
接下來看看光譜圖是什么樣子的。
可以看出,每個樣本的基本趨勢是相似的,但有些高有些低,這反映了不同的濃度。此外,由于光譜圖等數(shù)據(jù)與時間序列數(shù)據(jù)有許多相似之處,因此處理時間序列的一些方法也應(yīng)該在這里展示其技能(目前尚未嘗試)
接下來,用光譜數(shù)據(jù)構(gòu)建API預(yù)測模型。必須執(zhí)行光譜數(shù)據(jù)scaling預(yù)處理,測試一些精度會比不處理好。
對嶺回歸和隨機(jī)森林進(jìn)行了測試,評估結(jié)果如下
線性模型嶺的回歸似乎比非線性隨機(jī)森林要好得多。

這里有一個問題,并不是所有的范圍和光譜圖API高度相關(guān)。因此,有必要對光譜的波長頻段進(jìn)行相應(yīng)的篩選,以重新構(gòu)建模型。事實上,這與特征值處理非常相似。首先,我們在這里輸入的波長是一個極高維度的數(shù)據(jù),因此我們需要使用類似的特征值來篩選相應(yīng)有效的波長頻道。

博精科技是一家集R&D、設(shè)計、制造、銷售、服務(wù)于一體的綜合性創(chuàng)新企業(yè)。公司以市場為導(dǎo)向,以人為本,以科技為動力,致力于各種通用分析儀器、R&D、生產(chǎn)和銷售常規(guī)實驗儀器、物理光學(xué)儀器等產(chǎn)品。主要產(chǎn)品有傅立葉紅外光譜儀儀、紅外測油儀,紅外分光光度計、粉塵中游離二氧化硅含量測定儀、紅外壓片機(jī)、手動粉末壓片機(jī)、電動粉末壓片機(jī)、自動壓片機(jī)、壓片模具、溴化鉀窗片實驗裝置等。?我們將與客戶分享先進(jìn)的分析技術(shù)方案和概念,共同享受科技進(jìn)步帶來的便利和價值,也希望與國內(nèi)外更多的制造商達(dá)成廣泛的合作關(guān)系!
標(biāo)簽tag:
