近日,位于M.G.Meshcheryakova信息技術實驗室的聯合核研究所(JINR)順利完成多功能信息和計算綜合體(MICC)現代化改造的又一階段工作。此次改造聚焦于更新提供電力和冷卻的工程設備,包括氣候控制系統、配電模塊等,相關工作由LIT(實驗室信息技術部門)員工在實驗室總工程師Andrey Dolbilov(安德烈·多爾比洛夫)和莫斯科計算系統研究所總工程師Alexey Vorontsov(阿列克謝·沃龍佐夫)的監督下完成。
模塊作為氣流隔離系統,通過天花板和滑動門系統連接兩排獨立設備機架,形成隔離冷通道,加熱后的空氣則排放至MIVK(多信息和計算綜合體)大廳公共空間。
在JINR LIT二樓機房內,除單獨放置的超級計算機“Govorun”以及機器人磁帶庫IBM TS3500和TS4500外,還設有四個獨立模塊:Tier-1模塊;Tier-2模塊(1號和2號);模塊4,負責保障Tier-2、異構HybriLIT平臺、云基礎設施、信息和計算資源綜合體以及EOS數據存儲系統的運行。其中,4號模塊于2020年建成,配備現代化工程設備,升級前其工程方案與1號和2號模塊差異顯著。此外,機房內還有一個用于容納標準業務計算類型關鍵服務器(如管理系統、數據庫等)的模塊,以及一個容納MICS、本地和全球網絡主要網絡服務的網絡設備模塊。未來,計劃創建5號模塊,將網絡基礎設施與額外計算資源和數據存儲系統相結合。
自2024年底起,為改善MIVK工程基礎設施,大量工作有序開展,對為計算中心提供電力和冷卻的設備進行了必要升級。此次現代化改造在不停止所有現役設備運行的情況下推進,且迅速完成,最大限度降低了時間和效率損失。期間,設計和創建自有配電單元(PDM)成為關鍵任務,這一復雜而廣泛的工作由LIT高級工程師Andrey Evlanov成功完成。2024年底,MIVK第1、2個模塊的PDM組裝、安裝和連接工作順利結束,由Galaxy 7000不間斷電源保證供電的機柜安裝并投入運行,每個模塊安裝8個PDM,隨后開始準備將三相電源連接到PDM。2025年3月至4月,1號和2號模塊全面轉換為三相電源。
作為JINR MICS現代化改造的一部分,2號模塊大幅擴展,結構中集成10個用于放置設備的新機柜,并安裝10臺行間空調,以確保更新后的配置高效冷卻。下一階段,計劃在模塊1中實施類似改進。
現代化工作還涉及物理遷移五個服務器機柜,這些機柜提供Tier-2 dCache、Tier-2 WN、Main EOS和cvmfs服務。為此,LIT JINR提前宣布全球網格基礎設施WLCG(全球LHC計算網格)計劃在3月27日至31日期間停機,以防止用戶任務丟失并確保數據完整性。
安德烈·多爾比洛夫表示:“通過將電力供應和冷卻能力提高約30%,我們提升了整體效率。機架數量的增加為安裝新設備、提高Tier-2計算能力以及整體開發MICS提供了更多機會。”
莫斯科計算機科學研究所此次工程基礎設施的現代化改造,依據JINR 2024 - 2030年發展七年規劃推進。改造將為WLCG項目每年提升10 - 20%的數據存儲容量和計算能力,有助于解決與JINR參與CERN實驗相關的問題,維持所需的數據處理速度。此次改造為安裝新設備和積極更新系統創造了條件,將確保整個MIVK綜合設施可靠運行。
阿列克謝·沃龍佐夫特別提及MIVK人員為斷開和移除過時設備所做的大量工作,強調年輕工程師和值班人員的高度奉獻精神與承諾,他們確保綜合設施全天候平穩運行,為綜合設施發展做出重大貢獻。阿列克謝·沃龍佐夫稱,正是這些專家的努力,使JINR計算中心在國際科學界發揮重要作用。
2025年1月,Govorun超級計算機的多級數據存儲和處理系統新增兩臺基于Ruler技術的服務器,總容量達2PB,目前已投入運行,并積極用于執行NICA大科學項目的計算任務。此次升級后,分層數據存儲系統超快速部分的總容量達到10.6PB,將顯著減少SC Govorun任務的執行時間。
JINR LIT主任Sergey Shmatov(謝爾蓋·什馬托夫)指出,MICS的計算能力正逐步提高。他評論道:“就眾多已實施的解決方案而言,JINR計算中心不僅在類似支持基礎研究的綜合體中處于領先地位,還具備獨特特點,例如在單一計算環境中集成了分布式計算、高性能計算和分布式數據湖的技術解決方案。”