人工智慧顯示出乳腺癌篩查的希望

今日科學 發佈 2020-01-05T10:53:58+00:00

篩查用於在沒有明顯疾病跡象的女性中早期發現乳腺癌。這種圖像分析任務具有挑戰性,因為通過重疊「密集」的乳腺組織,乳腺癌通常會在乳房X光照片中被隱藏或掩蓋。該問題刺激了開發基於計算機的人工智慧(AI)系統以提高診斷性能的努力。McKinney 等人在《自然》雜誌上撰文。

篩查用於在沒有明顯疾病跡象的女性中早期發現乳腺癌。這種圖像分析任務具有挑戰性,因為通過重疊「密集」的乳腺組織,乳腺癌通常會在乳房X光照片中被隱藏或掩蓋。該問題刺激了開發基於計算機的人工智慧(AI)系統以提高診斷性能的努力。McKinney 等人在《自然》雜誌上撰文。1報告了在準確解釋篩查程序中的乳房X線照片方面勝過放射線專家的AI系統的發展。這項工作是一波研究浪潮的一部分,該浪潮研究了在醫學影像環境2中使用AI的情況。

儘管有一些限制,但麥金尼及其同事的研究令人印象深刻。它的優勢包括用於訓練和隨後驗證AI算法的大規模數據集。英國的25,856名婦女和美國的3,097名婦女的乳房X線照片被用來訓練AI系統。然後,該系統至少在365天後被用於在經過乳房活檢證實的乳腺癌或正常隨訪成像結果的女性乳房X線照片中識別乳腺癌的存在。這些結果是公認的金標準,用於確認接受該疾病篩查的人的乳腺癌狀況。作者報告說,人工智慧系統的表現優於最初評估乳房X線照片的放射科醫生做出的歷史決定,

McKinney及其同事的研究結果表明,人工智慧有一天可能會有助於乳腺癌的早期發現,但作者正確地指出,將需要進行臨床試驗以進一步評估該工具在醫學實踐中的效用。與本研究報告的受控研究環境相比,現實世界更加複雜,並且可能更加多樣化。例如,該研究並未包括當前使用的所有不同的乳腺X射線攝影技術,並且大多數圖像是使用乳X射線攝影系統從一家製造商處獲得的。該研究包括兩種類型的乳房X線照片示例:斷層合成(也稱為3D乳房X線照片)和常規數字(2D)乳房X線照片。了解系統對於每種技術的單獨表現將很有用。

除了年齡以外,作者研究的人口統計資料還不明確。AI算法的性能可能高度依賴於訓練集中使用的總體。因此,重要的是在該技術的開發中使用具有代表性的一般人群樣本,以確保結果可廣泛應用。

對此和類似的AI研究感到興奮的另一個原因是從乳腺癌的計算機輔助檢測(CAD)中獲得的教訓。CAD是一種較早的計算機系統,旨在改善臨床中的乳腺X線照片解釋能力,在實驗測試中顯示出了巨大的希望,但在實際環境中3不足。CAD在乳房X線照片上做標記,以將口譯員的注意力吸引到可能出現異常的地方。但是,對來自美國乳腺癌監視協會註冊處的大量臨床乳腺X線攝影解釋的分析表明,使用CAD 3並沒有改善診斷準確性。此外,該研究表明,添加CAD會降低敏感性(放射線醫師確定存在癌症的能力),因此增加了假陰性測試的可能性。CAD並沒有導致特異性的顯著變化(放射學家確定癌症不存在的表現)和假陽性試驗的可能性3。

據推測,CAD在臨床上沒有實驗數據所表明的那樣有用,這可能是因為放射線醫生忽略或誤用了其輸入,原因是圖像上出現的痕跡頻率很高,而這些痕跡並未提示癌症。該結果部分歸因於可用於CAD的有限處理能力,這意味著無法與同一人的先前影像學研究進行比較4。因此,CAD可能會標記出不會隨時間變化的區域,而這些區域很容易被專家讀者忽略。限制CAD的另一個因素是它是使用基於人類的診斷性能開發的。使用乳房X光照片對它進行了訓練,在乳房X光檢查中,人類發現了癌症的跡象,而其他人則為假陰性-儘管確實存在該疾病,但人類卻看不到癌症的跡象4。基於AI的決策輔助工具也可能遇到類似的陷阱。

深度學習可在診所發現即將發生的器官損傷

人工智慧發現人類遺漏的異常的系統將需要放射科醫生適應這些工具的使用。想像一下一個系統,其中有一個算法在乳房X光檢查照片上標記了一個密集的乳房區域,而放射線醫生看不到任何看起來可能是惡性的東西。藉助CAD,放射線醫生會仔細檢查標記的區域,如果他們確定標記可能不是癌症,則將乳房X線照片定為惡性陰性。但是,如果AI算法在檢測當前遺漏的癌症方面比CAD產生更大的影響,則AI系統檢測到但放射線醫師未察覺到的異常可能需要進一步檢查。這可能導致接收回調進行進一步評估的人數增加。

此外,至關重要的是要開發一種機制來監視AI系統的性能,就像它在機器學習算法中從遇到的情況中學習的那樣。這樣的性能指標將需要使用這些工具的人員使用,以防性能隨時間而下降。

考慮開發和測試用於臨床任務的AI算法所需的龐大數據量令人震驚。乳腺癌篩查可能是AI在醫學成像中的理想應用,因為適用於算法訓練和測試的大型精選數據集已經可用,並且易於獲得用於驗證直接臨床終點的信息。乳腺癌篩查程序會定期評估其診斷性能-是否正確檢測出癌症(真陽性)或漏診(假陰性)。乳房X線照片上發現的某些區域可能被識??別為異常,但經進一步測試證明沒有癌變(假陽性)。對於大多數女性而言,篩查沒有發現異常,如果一年後仍沒有癌症的證據,則被歸類為真正的陰性。

然而,大多數其他醫學任務的臨床結局更為複雜,其中臨床醫師的決定不是二元決定(在癌症存在與否之間),因此還必須考慮其他體徵和症狀。另外,大多數疾病缺乏容易獲得的,經過驗證的數據集,其中相對容易地定義了「真相」。要獲得針對更複雜的臨床問題的經過驗證的數據集,將需要讀者做出更大的努力,並且需要開發能夠查詢電子健康記錄以識別和注釋代表特定診斷的病例的工具。

為實現McKinney及其同事的研究所隱含的AI在醫療保健中的承諾,健康記錄中的匿名數據可能因此必須被視為對人類健康有潛在益處的寶貴資源,就像公共事業(如目前正在處理飲用水。但是,顯然,如果要廣泛開發和使用此類AI系統,則必須注意患者的隱私權,以及如何存儲和使用數據,由誰來進行以及以何種類型的監督。

自然 577,35-36(2020)

doi:10.1038 / d41586-019-03822-8

版權聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。
關鍵字: