密歇根大學(xué)核工程與放射科學(xué)系(NERS)與愛達荷國家實驗室的研究人員合作開展了一項關(guān)于核微反應(yīng)堆和機器學(xué)習(xí)(ML)的研究,相關(guān)摘要已發(fā)表,全文題為《基于深度強化學(xué)習(xí)的核微反應(yīng)堆瞬態(tài)和負荷跟蹤控制》,刊登在《能源轉(zhuǎn)換與管理:X》雜志7月刊上。
HolosGen 開發(fā)的緊湊型可運輸 Holos-Quad 微反應(yīng)器,可容納在一個標(biāo)準(zhǔn)的 40 英尺 ISO 集裝箱內(nèi)。(圖片:HolosGen)
該研究基于HolosGen的Holos-Quad微反應(yīng)堆設(shè)計,考察了一種新的機器學(xué)習(xí)方法——多智能體強化學(xué)習(xí)(RL),用于對核微反應(yīng)堆功率輸出的調(diào)整進行建模,以滿足電網(wǎng)需求。研究人員稱,此方法比以往方法訓(xùn)練更高效、時間更短,能助力更快建模反應(yīng)堆。
Holos-Quad是一款高溫氣冷微反應(yīng)堆,專為可擴展、自給式發(fā)電設(shè)計。其結(jié)構(gòu)靈感源于閉環(huán)渦輪噴氣發(fā)動機,以密封核燃料盒取代傳統(tǒng)燃燒室,將燃料、慢化劑、熱交換和能量轉(zhuǎn)換集成在單個壓力容器內(nèi),緊湊設(shè)計可裝入40英尺的國際標(biāo)準(zhǔn)化組織(ISO)集裝箱。
研究團隊專注于模擬負荷跟蹤,即依據(jù)電網(wǎng)需求增減電力輸出。Holos-Quad系統(tǒng)通過調(diào)節(jié)圍繞反應(yīng)堆核心的八個控制鼓位置來控制功率,控制鼓一側(cè)襯有中子吸收材料,向內(nèi)旋轉(zhuǎn)吸收中子可降低功率,向外旋轉(zhuǎn)則提高功率。在多智能體RL方法中,八個控制鼓被建模為八個獨立智能體,特定鼓獨立控制且能獲取整個核心信息。
通過將多智能體RL模型方法與單智能體方法(單個智能體控制所有八個鼓)和行業(yè)標(biāo)準(zhǔn)比例積分微分(PID)方法(具有基于反饋的控制回路)進行比較測試,結(jié)果顯示RL模型具有優(yōu)勢。
研究人員指出,其機器學(xué)習(xí)模型需在更復(fù)雜、現(xiàn)實的條件下廣泛驗證,才能在核電行業(yè)商業(yè)應(yīng)用。不過,研究結(jié)果“為自主核微反應(yīng)堆的強化學(xué)習(xí)開辟了一條更有效的途徑”。