AI將LDCT進一步用于肺癌預測
深度學習算法可以在初期篩查時區分惡性結節和良性結節。
將深度學習算法與低劑量胸部CT結合使用,可以幫助放射科醫生準確地評估患者的風險,確定肺結節是否為惡性。
低劑量CT(LDCT)可有效篩查長期吸煙者等肺癌高危人群,接受這些掃描的人數正在增加。但是,正確區分癌性結節和良性結節仍然是一項重大挑戰,準確的評估至關重要,因為它們會決定治療方案。
在5月18日發表于《放射學》上的一篇文章中,來自荷蘭的研究人員分享了有關其人工智能(AI)工具的詳細信息以及其在盡早發現受影響患者方面可能發揮的作用,該工具優于受過專業訓練的放射科醫師。
第一作者Kiran Vaidhya Venkadesh領導的團隊表示:“我們成功開發了一種深度學習算法,用于評估在低劑量篩查CT時檢測到的肺結節的惡性風險,該算法可在篩查人群和方案之間推廣。”他是內梅亨大學醫學中心診斷圖像分析小組的博士候選人。“這種深度學習算法可以幫助放射科醫生優化對接受肺癌篩查的參與者的隨訪建議,并可以減少不必要的診斷干預。”
它還有可能減少放射科醫生的工作量并降低肺癌篩查的成本。
為了判斷算法的性能,該團隊將其結果與已建立并有效的泛加拿大(PanCan)肺癌早期檢測模型以及11名臨床醫生(4名胸科放射科醫生、5名放射科住院醫生和2名肺科醫生)的結果進行了比較。
在他們的回顧性研究中,他們使用深度學習開發了他們的算法,并用16077個結節的CT圖像進行訓練,其中包括1249個惡性腫瘤。這些圖像是在2002年至2004年間從國家肺部篩查試驗中收集的。他們使用來自丹麥肺癌篩查試驗的三組成像數據驗證了該算法:全部883個結節(65個惡性)的完整隊列,以及兩個大小匹配的癌變富集的隊列(175個結節,59個惡性)和大小不匹配的腫瘤(177個結節,59個惡性)。
當Venkadesh的團隊將算法的性能與現有的評估模型和臨床醫生的性能進行比較時,他們發現他們的算法遠遠優于兩者。與PanCan模型相比,該算法實現的曲線下面積(AUC)為0.93,而前者為0.90。
該研究小組解釋說:“算法只在大小匹配的癌癥富集子集中明顯優于PanCan模型。這表明,盡管結節大小仍然是惡性腫瘤的強大預測指標,但與PanCan模型相比,該算法的辨別力更依賴于成像特征。”
在具有隨機良性結節(AUC 0.96對0.90)和大小匹配的良性結節(AUC 0.86對0.82)的癌癥富集隊列中,它的表現也優于胸腔放射科醫生。
研究小組說,基于這些結果,該算法可以為臨床環境帶來諸多好處。放射科醫生可以將可疑結節升級為Lung-RADS 4X類別,但是該算法不需要手動解釋結節成像特征。 Radboud醫學影像學助理教授,資深作者Colin Jacobs博士說,這有可能導致CT解釋中觀察者間的大量變異。
最終,該團隊表示,他們認為這種算法將被用作放射科醫生工作的支持工具。
該團隊表示:“我們預計,在可靠的人工智能系統的幫助下,我們將需要訓練有素的人類觀察員,當肺癌篩查項目在全球推廣時,這些人將成為胸部CT的第一讀者。這種深度學習算法可以幫助放射科醫生為正在接受肺癌篩查的參與者優化隨訪建議,并可以減少不必要的診斷干預措施。”
PanCan開發人員Martin C.Tammemägi,DVM,MSc博士在隨附的社論中重申,需要一種能夠區分惡性結節和良性結節的算法,以減輕提供者的工作量。他指出,Venkadesh的團隊確實在過去的AI預測模型上進行了改進,展示了可喜的結果。但是,他警告不要過于強調AUC的成就。
“我提醒讀者不要過度解讀AUC。AUC通常被直接解釋為預測準確性的衡量標準。”他解釋說。“AUC不是一個百分比,AUC不衡量絕對分類精度,而是評估模型是否可以將大小寫配對按照正確順序的排序。”
他說,這使得算法校準變得至關重要。而且,考慮到該算法確實存在將惡性結節誤認為良性,或將良性結節誤認為惡性的情況,因此可能存在校準問題。
他說:“如果臨床醫生的判斷受到(深度學習)算法的極端和錯誤評分的影響,可以想象,這會造成傷害。”
他說,盡管如此,該算法獲得的相對較高的AUC確實表明它正在從非規模因素中獲取有價值的預測信息。
但是,根據Venkadesh團隊的說法,他們的工作尚未完成。
他們目前正在研究另一種算法,該算法在輸入時使用多次CT檢查,從而可能將其使用范圍從最初或基線篩查擴展到隨后的篩查,這將有助于將結節的生長和外觀與先前的掃描進行比較。
淀粉樣蛋白PET腦顯像的操作技術
【科普】醫療照射的正當性判斷,拒絕過度的醫療放射
山西醫科大學第一醫院PET/CT科研成果發表于Scientific Reports雜志