近期,DESY(德國電子同步加速器研究中心)和漢堡大學的科學家團隊就針對操作加速器提出了這樣的問題,并驚訝地發現ChatGPT等“大型語言模型”(LLM)能夠幫助他們運行這些復雜的科學機器。這一研究成果已于近日在《科學進展》雜志上發表。
Ein humanoider NA 人形 Nao 機器人參觀 ARES 粒子加速器的隧道(象征性照片)。照片:DESY,Jan Kaiserao-機器人在 ARES-Teilchenbeschleunigers 隧道中。符號照片)。照片:DESY,Jan Kaiser
在物理學領域,機器學習已被廣泛應用于自動執行某些例行程序和任務。特別是在加速器物理學中,實時調整粒子加速器以確保其始終保持最佳性能是一個極具吸引力的應用領域。由DESY科學家Jan Kaiser領導的研究小組展示了如何使用一種特殊的機器學習技術——即LLM,來實現這一目標。
LLM是ChatGPT等流行聊天機器人背后的技術,它們經過大量數據的訓練,能夠識別、解釋和生成人類語言。該團隊試驗了14種不同的LLM,并用它們來控制DESY的實驗電子加速器ARES。他們的目標是調整五塊磁鐵,使ARES的電子束能夠以最佳方式聚焦和引導。
與以往不同的是,科學家們并沒有通過編程來定義LLM的具體需求,而是使用自然語言提示向LLM描述了問題。隨后,LLM建議了如何以最高精度設置五個調整參數,并解釋了每個參數值將實現的效果。
Jan Kaiser表示:“我們對一些LLM能夠如此出色地解決問題感到非常驚訝。但更令人著迷的是,它們甚至不需要知道它們正在操作粒子加速器。因此,從理論上講,LLM可以解決任何類型的優化問題,這意味著我們的方法遠遠超出了加速器物理領域。”
然而,在概念驗證調查中,研究人員也遇到了一些挑戰。Annika Eichler(DESY和漢堡工業大學)指出:“就像人類操作員一樣,你必須向正確的LLM提出正確的問題才能得到好的解決方案。”此外,解決此類問題的計算能力以及對環境的影響目前仍是巨大的挑戰,這些系統仍然落后于其他專門方法。
就目前而言,LLM可能更適合在加速器控制室擔任“副駕駛”,為操作員提供咨詢建議。然而,Eichler認為:“我們的工作是邁向未來的重要第一步。在未來,人們只需使用自然語言詢問所需的結果,就可以操作復雜且高度相關的科學設施。”