作為極光早期科學(xué)計劃的一部分,阿貢國家實驗室的沃爾特霍普金斯正在領(lǐng)導(dǎo)一個項目,該項目將使用百億億級計算能力來幫助尋找新的物理發(fā)現(xiàn)。
當 Aurora 于2022 年到達時,美國能源部 ( DOE ) 的阿貢國家實驗室將成為美國首批百億億級超級計算機之一。為了準備系統(tǒng)架構(gòu)和規(guī)模的代碼, 15 個研究團隊正在通過美國能源部科學(xué)用戶設(shè)施辦公室阿貢領(lǐng)導(dǎo)計算設(shè)施 ( ALCF )參與 Aurora 早期科學(xué)計劃。有了超級計算機上的預(yù)生產(chǎn)時間,這些研究人員將成為世界上第一批使用百億億級計算機進行科學(xué)研究的人。
早在公元前5 世紀左右,早期的哲學(xué)家就首次提出了原子的概念。就在我們以為我們了解了它的基本結(jié)構(gòu)——質(zhì)子、中子和電子時——理論和技術(shù)的出現(xiàn)證明了我們是錯誤的。事實證明,還有更多基本粒子,如夸克,由恰當命名的膠子結(jié)合在一起。
物理學(xué)家在我們稱為對撞機的巨大機器野獸中發(fā)現(xiàn)了許多這些和其他粒子,有助于發(fā)展我們今天所知的物理學(xué)標準模型。但仍有一些問題繼續(xù)嘮叨:還有更基本的東西嗎?標準模型是全部嗎?
決心找出答案,高能物理學(xué)界正在努力將更大的對撞機和更復(fù)雜的探測器與百億億級計算系統(tǒng)集成在一起。其中之一是沃爾特·霍普金斯大學(xué)的助理物理學(xué)家阿貢國家實驗室,并與合作者 ATLAS實驗 在 大型強子對撞機(LHC) 在歐洲核子研究中心,瑞士日內(nèi)瓦附近。
霍普金斯與來自阿貢和勞倫斯伯克利國家實驗室的研究人員合作,通過ALCF領(lǐng)導(dǎo)了一個 Aurora 早期科學(xué)計劃項目, 為百億億級計算架構(gòu) 準備用于LHC模擬的軟件,包括阿貢即將推出的百億億級機器 Aurora。Aurora 每秒進行 10 億次計算,處于超級計算的前沿,相當于粒子物理學(xué)的下一個挑戰(zhàn),這是一個巨大的挑戰(zhàn)。
該項目是由物理學(xué)家和阿貢杰出研究員 James Proudfoot 于幾年前啟動的,他了解百億億次在提高這種復(fù)雜科學(xué)的影響方面的獨特優(yōu)勢。
使代碼與新架構(gòu)保持一致
LHC 中產(chǎn)生的碰撞發(fā)生在幾個探測器之一。團隊關(guān)注的那個ATLAS見證了每秒數(shù)十億次的粒子相互作用以及這些碰撞在其尾跡中產(chǎn)生的新粒子的特征。
該團隊關(guān)注的一種代碼稱為事件生成器,它模擬在17英里圓周對撞機環(huán)內(nèi)的交互點處發(fā)生的底層物理過程。讓軟件生成的物理與標準模型的物理保持一致有助于研究人員準確模擬碰撞并預(yù)測殘余粒子的類型、路徑和能量。
以這種方式檢測物理會產(chǎn)生大量數(shù)據(jù),并且需要同樣大量的計算機時間。現(xiàn)在,歐洲核子研究中心正在加大賭注,準備升級LHC的光度,允許更多的粒子相互作用和20倍的數(shù)據(jù)輸出增加。
雖然團隊希望 Aurora 來處理他們模擬需求的增加,但機器本身也面臨一些挑戰(zhàn)。
直到最近,事件生成器都在計算機 CPU(中央處理單元)上運行。雖然它們工作得很快,但一個CPU通常一次只能執(zhí)行幾個操作。
Aurora 將配備 CPU 和 GPU(圖形處理單元),這是各地游戲玩家的選擇。GPU 可以通過將它們分解成分散在許多內(nèi)核上的數(shù)千個較小的任務(wù)來處理許多操作,這些任務(wù)是驅(qū)動這兩種類型單元的引擎。
但霍普金斯指出,以有效的方式將基于 CPU 的模擬轉(zhuǎn)移到 GPU 上需要付出很多努力。因此,為應(yīng)對 Aurora 和來自LHC的新數(shù)據(jù)的沖擊而采取這一舉措會帶來一些挑戰(zhàn),這些挑戰(zhàn)已成為該團隊的核心重點。
“我們希望能夠用極光來幫助我們應(yīng)對這些挑戰(zhàn),”霍普金斯說, “但它需要我們研究計算架構(gòu)是新的我們和我們的代碼庫。例如,我們專注于ATLAS 中使用的生成器,稱為 MadGraph,它在 GPU 上運行,GPU 更并行且具有不同的內(nèi)存管理要求。”
粒子相互作用模擬代碼 MadGraph 由國際高能物理理論家團隊編寫,支持LHC的模擬需求。
仿真和人工智能支持實驗工作
在LHC起到了使預(yù)測現(xiàn)實顯著的作用。最著名的是,標準模型預(yù)測了希格斯玻色子的存在,它將質(zhì)量傳遞給所有基本粒子;ATLAS及其對應(yīng)的探測器CMS在2012 年證實了希格斯粒子的存在。
但是,正如科學(xué)中經(jīng)常發(fā)生的情況一樣,重大發(fā)現(xiàn)可能會導(dǎo)致更多實質(zhì)性問題,其中許多問題是標準模型無法預(yù)測的。為什么希格斯粒子是它的質(zhì)量?什么是暗物質(zhì)?
“對大型強子對撞機進行如此大規(guī)模升級的原因是我們希望在大海撈針中找到那根針,我們會在數(shù)據(jù)集中找到一些異常,它提供了超出標準模型的物理暗示,”霍普金斯說.
計算能力、模擬、實驗和人工智能 ( AI ) 的結(jié)合將通過提供預(yù)測和識別的準確性來極大地幫助搜索。
例如,當ATLAS探測器目睹這些粒子碰撞時,它會將它們記錄為電子信號。這些被重建為可能對應(yīng)于通過的電子的能量爆發(fā)的像素。
“但就像在人工智能中,典型的例子是識別圖像中的貓和狗,我們有算法來識別這些電子信號并將其重建為電子、質(zhì)子和其他東西,” ALCF計算機科學(xué)家 Taylor Childers 說,他是該團隊的成員.
然后將來自真實碰撞事件的重建數(shù)據(jù)與模擬數(shù)據(jù)進行比較,以尋找模式差異。這就是物理模型的準確性發(fā)揮作用的地方。如果它們工作正常并且真實數(shù)據(jù)和模擬數(shù)據(jù)不匹配,您將繼續(xù)測量并排除異常,直到您很可能找到那根不符合標準模型的針。
該團隊還使用人工智能來量化不確定性,以確定他們正確識別粒子的可能性。
人類能夠在有限的范圍內(nèi)識別粒子——動量和位置等幾個參數(shù)可能會告訴我們某個粒子是電子。但是,根據(jù)10 個密切相關(guān)的參數(shù)進行表征,則完全是另一回事。
“這就是人工智能真正發(fā)揮作用的地方,特別是如果這些輸入?yún)?shù)是相關(guān)的,比如電子周圍粒子的動量和電子本身的動量,”霍普金斯說。“這些相關(guān)性是很難對付的分析,但因為我們有這么多的模擬數(shù)據(jù),我們可以教人工智能,它可以告訴我們,這是與該可能性的電子因為我有所有這些輸入信息。”
百億億級計算和前進的道路
在 Aurora 之前,該團隊繼續(xù)研究新架構(gòu)的編程語言以及在將在 Aurora 上使用的英特爾硬件以及其他供應(yīng)商的硬件上運行的代碼。
“將R的部分& d,我們與我們的合作伙伴,英特爾,是確保硬件是做什么我們希望它做的和有效的做這件事,說:”奇爾德斯。“擁有一個像極光機器會給我們巨大的計算能力和大量的節(jié)點,有效地減少時間的解決方案,尤其是當我們移動到升級后的LHC。”
解決方案是對一個基本問題的回答——標準模型之外還有更多嗎?——霍普金斯指出,一百年后可能會產(chǎn)生難以想象的影響。
“基礎(chǔ)研究可以為我們提供可能導(dǎo)致社會變革的知識,但如果我們不進行研究,就不會產(chǎn)生任何結(jié)果,”他說。
該ALCF是美國能源部科學(xué)辦公室的用戶工具。
該項目的資金由美國能源部科學(xué)辦公室提供:高能物理和先進科學(xué)計算研究辦公室。ATLAS是一項受益于DOE支持的國際合作項目。
===========
阿貢領(lǐng)導(dǎo)力計算設(shè)施為科學(xué)和工程界提供超級計算能力,以促進廣泛學(xué)科的基礎(chǔ)發(fā)現(xiàn)和理解。在美國能源部 ( DOE ) 科學(xué)辦公室、高級科學(xué)計算研究 ( ASCR ) 計劃的支持下,ALCF是美國致力于開放科學(xué)的兩個DOE領(lǐng)導(dǎo)計算設(shè)施之一。
阿貢國家實驗室尋求解決緊迫的國家科學(xué)技術(shù)問題。作為美國第一個國家實驗室,阿貢幾乎在所有科學(xué)學(xué)科中開展前沿的基礎(chǔ)和應(yīng)用科學(xué)研究。阿貢的研究人員與來自數(shù)百家公司、大學(xué)以及聯(lián)邦、州和市政機構(gòu)的研究人員密切合作,幫助他們解決具體問題,提升美國的科學(xué)領(lǐng)導(dǎo)地位,并為國家更美好的未來做好準備。從以上員工60個國家,阿貢由管理UChicago阿貢,LLC在美國能源部的科學(xué)辦公室。
美國能源部科學(xué)辦公室是美國物理科學(xué)基礎(chǔ)研究的最大支持者,致力于解決我們這個時代一些最緊迫的挑戰(zhàn)。如需更多信息,請訪問https:// ener gy .gov/ s c ience。