一段時間以來,計算機已經能夠快速處理 2D 圖像。您的手機可以拍攝數碼照片并以多種方式處理它們。然而,在三個維度上處理圖像并及時處理要困難得多。數學更復雜,即使在超級計算機上處??理這些數字也需要時間。
這是美國能源部 (DOE) 阿貢國家實驗室的一組科學家正在努力克服的挑戰。人工智能已成為解決大數據處理問題的通用解決方案。對于使用高級光子源 (APS)(位于阿貢的美國能源部科學用戶設施辦公室)處理 3D 圖像的科學家來說,這可能是將 X 射線數據以更快的速度轉化為可見、可理解形狀的關鍵。該領域的突破可能會對天文學、電子顯微鏡和其他依賴大量 3D 數據的科學領域產生影響。
“為了充分利用升級后的 APS 的能力,我們必須重新發明數據分析。我們目前的方法不足以跟上。機器學習可以充分利用并超越目前的可能性,”說阿貢國家實驗室的 Mathew Cherukara
該研究團隊包括來自 Argonne 三個部門的科學家,他們開發了一種名為 3D-CDI-NN 的新計算框架,并表明它可以從 APS 收集的數據中創建 3D 可視化,其速度比傳統方法快數百倍。該團隊的研究發表在美國物理研究所的出版物《應用物理評論》上。
CDI 代表相干衍射成像,這是一種 X 射線技術,涉及從樣品反射超亮 X 射線束。然后這些光束將被探測器收集為數據,并且需要一些計算工作才能將這些數據轉換為圖像。阿貢 X 射線科學部 (XSD) 計算 X 射線科學小組的負責人 Mathew Cherukara 解釋說,部分挑戰在于探測器只能從光束中捕獲一些信息。
但是缺失的數據中包含重要信息,科學家們依靠計算機來填充這些信息。正如 Cherukara 所指出的,雖然這在 2D 中需要一些時間,但在 3D 圖像中需要更長的時間。因此,解決方案是訓練人工智能直接從原始數據中識別物體及其發生的微觀變化,而無需填寫缺失的信息。
為此,該團隊從模擬 X 射線數據開始訓練神經網絡。框架標題中的 NN,神經網絡是一系列算法,可以教會計算機根據接收到的數據預測結果。該論文的第一作者、美國能源部阿貢科學用戶設施辦公室納米材料中心 (CNM) 的博士后研究員 Henry Chan 領導了這部分工作。
“我們使用計算機模擬來創建不同形狀和大小的晶體,并將它們轉換成圖像和衍射圖案供神經網絡學習,”陳說。“快速生成許多用于訓練的逼真晶體的容易性是模擬的好處。”
這項工作是使用阿貢系統評估聯合實驗室的圖形處理單元資源完成的,該實驗室部署了領先的測試平臺,以支持對新興高性能計算平臺和功能的研究。
Argonne 材料科學部的物理學家兼小組負責人 Stephan Hruszkewycz 說,一旦網絡經過訓練,它就可以很快地接近正確答案。但是,仍有改進的余地,因此 3D-CDI-NN 框架包含一個過程,使網絡完成其余部分。Hruszkewycz 與西北大學研究生 Saugat Kandel 一起致力于該項目的這一方面,從而減少了耗時的迭代步驟的需要。
Hruszkewycz 說:“材料科學部關心相干衍射,因為你可以看到幾納米長度尺度的材料——大約比人類頭發的寬度小 100,000 倍——X 射線可以穿透環境。” “這篇論文展示了這些先進的方法,它極大地促進了成像過程。我們想知道一種材料是什么,以及它是如何隨時間變化的,這將有助于我們在進行測量時制作更好的圖片。 ”
作為最后一步,3D-CDI-NN 填充缺失信息和提出 3D 可視化的能力在 APS 的光束線 34-ID-C 收集的金微小顆粒的真實 X 射線數據上進行了測試。結果是一種計算方法在模擬數據上快了數百倍,在真實 APS 數據上幾乎快了幾百倍。測試還表明,網絡可以用比通常需要的更少的數據來重建圖像,以補償檢測器未捕獲的信息。
Chan 表示,這項研究的下一步是將網絡集成到 APS 的工作流程中,以便它在獲取數據時從數據中學習。他說,如果網絡從光束線上的數據中學習,它將不斷改進。
對于這個團隊,這項研究也有時間因素。正如 Cherukara 所指出的,APS 的大規模升級正在進行中,一旦項目完成,現在生成的數據量將呈指數級增長。升級后的 APS 將產生亮度高達 500 倍的 X 射線束,并且光束的相干性——光的特性,允許它以編碼更多樣本信息的方式衍射——將大大增加。
這意味著雖然現在從樣本中收集相干衍射成像數據并獲得圖像需要兩到三分鐘的時間,但該過程的數據收集部分將很快提高 500 倍。將該數據轉換為可用圖像的過程也需要比現在快數百倍才能跟上。
“為了充分利用升級后的 APS 的功能,我們必須重新發明數據分析,”Cherukara 說。“我們目前的方法不足以跟上。機器學習可以充分利用并超越目前的可能性。”
除了 Chan、Cherukara 和 Hruszkewycz,該論文的作者還包括來自 Argonne 的 Subramanian Sankaranarayanan 和 Ross Harder;SLAC 國家加速器實驗室的 Youssef Nashed;和西北大學的 Saugat Kandel。