據(jù)悉,LHC 實驗的最新升級,即將于 2023 年投入使用。
考慮到傳統(tǒng)中央處理器(CPU)難以應(yīng)付新的計算挑戰(zhàn),目前正有四個大型項目在嘗試采用 GPU 并行計算方案。
圖上圖所示,某 Run 3 候選 HLT 節(jié)點裝配了雙路 AMD Milan 64 核 CPU + 兩張英偉達 Tesla T4 GPU 。
GPU 在圖像處理等應(yīng)用場景下具有極高的效率,最初只是為了加速計算機 3D 圖形渲染而打造。
但在過去的幾年里,LHC 實驗、全球 LHC 計算網(wǎng)格(WLCG)和 CERN openlab 就已展開過這方面的研究嘗試。
而在高能物理應(yīng)用中加大 GPU 的計算投入,不僅能夠提升 CERN 計算基礎(chǔ)設(shè)施的質(zhì)量和規(guī)模,還有助于提升系統(tǒng)的整體能效。
CERN IT 部門負(fù)責(zé)人 Enrica Porcari 表示:
LHC 雄心勃勃的升級計劃,帶來了一系列令人興奮的計算挑戰(zhàn)。好消息是,GPU 能夠在機器學(xué)習(xí)(DL)方面提供有力的支撐,幫助研究人員解決許多問題。
自 2020 年以來,CERN IT 部門提供了對數(shù)據(jù)中心 GPU 平臺的訪問權(quán)限,其已被證明在一系列應(yīng)用中很受歡迎。
更重要的是,CERN openlab 正通過與工業(yè)界的合作研發(fā)項目,對將 GPU 用于機器學(xué)習(xí)一事展開鄭重深入的調(diào)查。
與此同時,CERN 的科學(xué)計算協(xié)作小組,目前正努力幫助移植和優(yōu)化實驗中的關(guān)鍵代碼。
多年前,ALICE 項目就率先在其“高級觸發(fā)在線計算機農(nóng)場”(HLT)中使用了 GPU,但也是迄今唯一大規(guī)模運用 GPU 的實驗。
而新升級的 ALICE 探測器擁有超過 120 億個連續(xù)讀取的電子傳感器元件,每秒可生成超過 3.5 TB 的數(shù)據(jù)流。即使經(jīng)過一級數(shù)據(jù)處理,數(shù)據(jù)流量仍高達 600 GB/s 。
這些數(shù)據(jù)會被放到具有 250 個節(jié)點的 HPC 農(nóng)場展開在線分析,每個節(jié)點包含 8 路 GPU + 32 核 CPU 。
大多數(shù)情況下,可將單個粒子檢測器信號組裝成粒子軌跡的軟件(事件重建)工作,現(xiàn)均已適應(yīng)了在 GPU 上并行工作。
從 2022 年開始,LHCb 實驗將處理 4 TB/s 的數(shù)據(jù)流,并對每秒篩選出的最有趣的 10 GB/s LHC 碰撞數(shù)據(jù)展開物理分析。
其獨特方法是不卸載工作,而是分析 GPU 上每秒 3000 萬個粒子束交叉點。自 2018 年以來,隨著 CPU 處理的改進,LHCb 的探測器重建能效也提升了將近 20 倍。
目前研究人員正期待著使用 2022 年的首批新系統(tǒng)調(diào)試數(shù)據(jù),并在此基礎(chǔ)上讓升級后的 LHCb 探測器得以發(fā)揮其完整的物理潛力。