無論是語音識別、圖像分類,還是自動駕駛、醫藥研發,給定任務和大量數據,機器學習就能夠通過訓練自己學會對未來場景做出快速準確的預測。
但是,如果這份工作是全新的,沒有可用于培訓的數據,該怎么辦?
科學家們想到如果給機器學習一定的領域內的先驗知識,是否就不需要大量訓練數據了,這一想法在物理學領域得到了很好的驗證。
(來源:phys.org)
最近,SLAC 實驗室的研究人員已經證明,無需數據,就可以用機器學習來優化粒子加速器的性能,實現的方法是向算法教授加速器操作背后的基本物理原理。該研究是在加速器物理社區中使用基于物理的機器學習的首批示例之一。
研究結果于 7 月 8 日以「Physics model-informed Gaussian process for online optimization of particle accelerators」為題發表在期刊《Physical Review Accelerators and Beams》上。
加速器可以為電子束或其他粒子束提供強大的能量,有著廣泛的應用,包括基礎物理實驗、分子成像和癌癥放射治療。但大型粒子加速器的調控非常具有挑戰,因為需要調整的組件太多了,并且這些組件不是完全獨立的,情況復雜。
SLAC 團隊證明了一種將物理模型直接結合到高斯過程貝葉斯優化器中的方法,表明機器學習可以通過加快優化過程找到以前沒人想到的有用的加速器設置,極大地支持人類操作員。
另外,與其他技術相比,機器學習還可以在不干擾粒子束的條件下幫助診斷粒子束的質量。這種方法還可適用于其他可以用高斯近似進行粗略模擬的物理系統。
教人工智能物理知識
美國能源部前 SLAC 國家加速器實驗室的助理研究員 Adi Hanuka 表示:「在材料科學、環境科學、電池研究、粒子物理學等許多研究領域,將物理學注入機器學習是一個非常熱門的話題。」
為了使機器學習起作用,研究人員必須首先使用先前加速器操作的數據、對加速器性能做出計算機模擬,或兩者都機器學習算法訓練。然而,實驗發現,將物理模型中的信息與可用的實驗數據相結合,可以大大減少所需的新數據量。
用于光束損失率的在線優化的SPEAR3 存儲環的布局。(來源:論文)
如果對加速器工作原理的物理知識足夠了解,則實際上不需要先前的數據。
該團隊使用這種方法來調整 SLAC 的 SPEAR3 加速器。通過使用直接從基于物理的模型中獲得的信息,他們得到的結果與通過使用實際歷史數據訓練算法所獲得的結果一樣好,甚至更好。
「我們的結果是 SLAC 逐步推動開發用于調整加速器的機器學習工具的最新亮點,」SLAC 的工作人員 Joe Duris 說。
預測未知
這并不是說預先存在的數據沒有幫助,當性能下降時,它們仍然可以派上用場。在 SPEAR3 案例中,研究人員能夠通過將其與來自加速器的實際數據配對來進一步改進基于物理的機器學習模型。
這一方法還適用于歷史數據不可用或不足以解決內核的超參數的其他復雜機器的自動調控。該團隊就應用該方法來改進 SLAC 的直線加速器相干光源 (LCLS) X 射線激光器的調諧,這是地球上最強大的 X 射線源之一。
這次 LCLS 的升級擁有全新的加速器,其最佳設置需要從頭開始確定。操作員可能會發現,讓已經學習了一些加速器物理基礎知識的 AI 陪在他們身邊會很方便。
論文鏈接:http://dx.doi.org/10.1103/PhysRevAccelBeams.24.072802
參考內容:https://phys.org/news/2021-07-ai-physics-optimize-particle.html