X射線衍散射技術朝著高通量多維度進階,使其成為同步輻射領域數據挑戰最大的方法學之一。研究人員聚焦其傳統物理解析方法復雜性高、時效性差的科學問題,利用全連接神經網絡,高效準確地提取了二維衍射圖像中隱藏的三維纖維取向分布信息(圖1)。該方法以衍散射數據解析為切入點,建立了同步輻射機器學習在線數據解析的統一流程框架,并實現解析效率的萬倍提速,為未來海量數據的在線處理奠定底層基礎。該工作日前在國際晶體學TOP期刊《IUCrJ》在線發表(趙麗娜研究員、張一副研究員為通訊作者,博士生孫明輝、博士后董政為共同第一作者),中科院高能所是本工作的唯一通訊單位。
在高通量多維度海量數據的快速解析研究中,充分意識到高效數據采集、樣品輻射損傷降噪的方法學研究重要性。因此,基于卷積神經網絡,研究人員構建了一套專用于衍射與散射圖像降噪的深度學習網絡SEDCNN (Small Encoder-Decoder Convolutional Neural Networks),實現了低曝光時間衍射與散射圖像的降噪(圖2)?;谘芯咳藛T提出的方位角積分計算的降噪指標,該模型成功做到了訓練速度與降噪結果穩定性遠超現有SOTA模型。該工作日前在《npj Computational Materials》在線發表(董宇輝研究員為通訊作者,博士生周中正、博士后李純為共同第一作者),中科院高能所是本文唯一通訊單位。
上述研究工作是在我所先后部署的“基于虛擬束線的自動化與智能化同步輻射實驗數據采集軟件研究(E25455U210,負責人:張一)”與“物理嵌入機器學習驅動高能同步輻射物質解析新發現(E35457U210,負責人:趙麗娜)”科技創新項目支持下開展完成,已初步形成人工智能在HEPS實驗過程控制與數據采集、海量數據分析與信息挖掘應用研究的新模式。未來,在董宇輝研究員發表于Nature Reviews Physics期刊的“大型科學軟件框架 + AI for Science”先進科研理念[3]指導下,HEPS光束線軟件系統還將聯合計算與網絡通訊系統,進一步加強與線站科學家、人工智能領域專家的科研合作,共同解決HEPS的科學大數據挑戰,推動科學大發現。
圖1: 機器學習用于海量衍射圖像高效分析
圖2: SEDCNN網絡架構與降噪效果