(圖片:歐洲核研究組織)
在探索發(fā)現(xiàn)自然的基本粒子和力量的過程中,高能量實(shí)驗(yàn)所面臨的關(guān)鍵挑戰(zhàn)之一是 大型強(qiáng)子對撞機(jī) 正在確保所收集的大量數(shù)據(jù)的質(zhì)量。為此,為實(shí)驗(yàn)的各種子探測器建立了數(shù)據(jù)質(zhì)量監(jiān)測系統(tǒng),并在檢查數(shù)據(jù)的準(zhǔn)確性方面發(fā)揮了重要作用。
其中一個子探測器是 通信管理系統(tǒng) 電磁量熱計(jì)(ECAL),它是碳纖維中的一個重要組成部分 探測器 .ECAL測量在LHC碰撞中產(chǎn)生的粒子的能量,主要是電子和光子,這使物理學(xué)家能夠重建粒子的衰變。確保ECAR記錄數(shù)據(jù)的準(zhǔn)確性和可靠性對于實(shí)驗(yàn)的成功運(yùn)行至關(guān)重要。
在目前正在進(jìn)行的大型強(qiáng)子對撞機(jī)第三次運(yùn)行期間,管理系統(tǒng)研究人員開發(fā)并部署了一種創(chuàng)新的機(jī)器電子學(xué)習(xí)技術(shù),以加強(qiáng)目前的ECAL數(shù)據(jù)質(zhì)量監(jiān)測系統(tǒng)。在最近的一份出版物中詳細(xì)說明,這種新方法有望使數(shù)據(jù)異常檢測更加準(zhǔn)確和有效。這種實(shí)時(shí)能力對于快速檢測和糾正探測器問題至關(guān)重要,這反過來又提高了數(shù)據(jù)的總體質(zhì)量。新系統(tǒng)是 部署的 在2022年埃卡爾河的桶里,在2023年的終端蓋里。
傳統(tǒng)的管理系統(tǒng)數(shù)據(jù)質(zhì)量監(jiān)測系統(tǒng)由傳統(tǒng)軟件組成,該軟件依靠預(yù)先確定的規(guī)則、閾值和人工檢查相結(jié)合,以提醒控制室中的團(tuán)隊(duì)注意潛在的探測器問題。這種方法涉及為什么構(gòu)成正常數(shù)據(jù)行為和標(biāo)記偏差設(shè)定具體標(biāo)準(zhǔn)。這些方法雖然有效,但可能會忽略不符合預(yù)先定義模式的微妙或意外異常。
相比之下,基于機(jī)器學(xué)習(xí)的新系統(tǒng)能夠發(fā)現(xiàn)這些異常現(xiàn)象,補(bǔ)充了傳統(tǒng)的數(shù)據(jù)質(zhì)量監(jiān)測系統(tǒng)。它接受培訓(xùn),從現(xiàn)有的良好數(shù)據(jù)中識別正常的探測器行為,并檢測任何偏差。該方法的基石是基于自編碼異常檢測系統(tǒng)。自動編碼器是一種專門的神經(jīng)網(wǎng)絡(luò),是為無監(jiān)督學(xué)習(xí)任務(wù)而設(shè)計(jì)的。
這張來自ECAL數(shù)據(jù)異常區(qū)域(左)的圖片,當(dāng)通過機(jī)器電子學(xué)習(xí)系統(tǒng)時(shí),會在右側(cè)生成容易識別的顏色圖,顯示紅色的異常區(qū)域和綠色的好區(qū)域。(圖像:中央氣象系統(tǒng)實(shí)驗(yàn))
該系統(tǒng)以二維圖像的形式提供ECAL數(shù)據(jù),它還擅長于通過新的校正策略發(fā)現(xiàn)隨著時(shí)間的推移而演變的異常現(xiàn)象。這一方面對于識別可能不會立即顯現(xiàn)但會逐漸發(fā)展的模式至關(guān)重要。
這種新型的自動編碼系統(tǒng)不僅提高了cms探測器的性能,而且還充當(dāng)了跨領(lǐng)域?qū)崟r(shí)異常檢測的模型,突顯了人工智能的變革潛力。例如,管理大規(guī)模高速數(shù)據(jù)流的行業(yè),如金融、網(wǎng)絡(luò)安全和保健行業(yè),可以從類似的異常檢測機(jī)器學(xué)習(xí)系統(tǒng)中獲益,從而提高其操作效率和可靠性。