在高能對撞機實驗中,重建重粒子(如頂夸克、希格斯粒子、W/Z玻色子等)的關鍵在于測量它們的衰變產物,如夸克會衰變或強子化形成一簇粒子,從而在探測器中形成噴注,而噴注的起源往往難以判斷。傳統的算法需要考慮末態粒子所有可能的排列組合及其系統誤差,隨著對撞機的能量、亮度的提升,噴注數量增加,可能的排列組合數量會呈指數級增長,這使得將信號來源正確分配給各個粒子成為一項重要的挑戰。
為了解決這一問題,研究人員開發了一種被稱為“保持對稱性的注意力機制”(Symmetry Preserving Attention NETwork,簡稱SPA-NET)的機器學習算法。注意力機制是Transformer架構的基礎,以用于Chat-GPT而聞名。與常規注意力機制不同,這種算法除具備置換不變性外還能夠有效保持如兩體或三體衰變過程的對稱性。此外,這種算法的新功能還能處理各種類型的物理對象(如輕子、噴注、丟失的橫向動量),得益于Transformer架構其能同時進行回歸分析和事件分類,提高了處理效率和準確性。
利用該算法,研究人員在LHC的三個旗艦分析(尋找ttH(bb),頂夸克質量測量,尋找假想重粒子Z’)中用簡化探測器模擬(Delphes)數據進行了測試。在LHC Run 2(3)數據統計中,SPA-NET的ttH和Z’信號靈敏度預計能達到3(5)σ,這是傳統方法無法比擬的。此外,在LHC Run 2數據統計中,使用該算法測量得到的頂夸克質量的精度與傳統方法相比提高了15%。這些數據表明,相較于傳統方法和其它機器學習方法,SPA-NET顯著提高了測量精度和對新物理的靈敏度,是目前最高效、表現最好的多對象事件選擇方法。
這種新的機器學習算法有望在更多的物理分析中應用,為LHC和未來的對撞機物理研究提供創新方法。
圖1:保持對稱性的擴展注意力機制(SPA-NET)的架構示意圖
圖2:區分ttH信號和本底事例的特征曲線(ROC curve)。