吳恩達帶斯坦福ML組發了篇新論文:深度學習識別14類心律不齊準確率超人類專家

2017-07-04

15046827615271.png


    吳恩達帶領的斯坦福機器學習組(Stanford ML Group)最近開發了一種深度學習新算法,能診斷14類心律不齊,準確率可以媲美人類醫生。
   
    他們的論文周四公布在了Arxiv上,題為Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks,用卷積神經網絡進行心髒病專家級的心律不齊檢測,作者包括Pranav Rajpurkar、Awni Hannun、Masoumeh Haghpanahi、Codie Bourn和吳恩達。

心律不齊的診斷難題
    如果患者疑似有心律不齊症狀,通常會去醫院做個心電圖。但是,在醫院做的幾分鍾或者十幾分鍾心電圖,往往發現不了問題,這時候醫生就可能會給患者一個可穿戴的心電圖監測器,要戴兩周。
    兩周,就要產生幾百小時的心電圖數據,醫生要一秒一秒地檢查,從中找出患者是否出現了有問題的心律不齊。
    更難的是,還得把有問題的心律不齊和安全無害的心律不齊區分開,它們在心電圖上看起來非常像。
    論文的主要作者之一、斯坦福大學研究生Pranav Rajpurkar說:“心律信號之間的差異可能非常細微,比如說,有兩種心律不齊都叫二度房室傳導阻滯,它們在心電圖上的表現也非常相似,但一種需要立刻治療,一種不需要。”
    吳恩達帶領的斯坦福機器學習小組把這看作一個數據科學問題。
深度學習方法
    斯坦福機器學習組的同學們,要用深度神經網絡,從心電圖中識別14類心律不齊。

1504682789609906152618.jpg


△ iRhythm的可穿戴心電圖監測器Zio

    他們和可穿戴心電圖監測設備廠商iRhythm合作,收集並標注了來自29163名患者的64121份心電圖數據,以200 Hz的頻率采樣,構建了大規模的訓練集和校驗集,用來訓練神經網絡。

    隨後,他們又從328名患者處收集了336份心電圖數據,構成了測試集。

    數據集中的心電圖樣本每段30秒,都經過專業醫生標注。測試集的數據標注則經過3名心髒病專家組成的委員會“會診”得出。

    為識別心電圖,他們構建了34層神經網絡,包括33個卷積層、一個全連接層和softmax,以原始心電圖時間序列為輸入,每秒輸出一次預測標簽。

下圖展示了這個深度神經網絡的結構:

1504682875946906152618.jpg


結果

    最後,他們找了6名心髒病專家,分別從測試集的心電圖中識別心律不齊,又以3名專家會診的結果作為標準,將人類識別的結果、算法識別的結果與之進行比較。

    他們發現,算法的準確率與受過專業訓練的人類心髒病專家相當,在很多情況下甚至比人類更好。

150468288483106152738.png


    上圖藍色表示算法的識別成績,黃色是人類專家的識別成績;Sequence F1表示算法/人類預測與標準結果之間多個標簽平均重合度,Set F1表示唯一分類標簽的重合度。

    識別準確率差不多的情況下,這個算法與人類相比有著巨大優勢:它看幾百小時的心電圖也不會累,可以持續、即時地診斷心律不齊。

    長期來看,斯坦福ML組希望能借助專家級的心律不齊識別算法,讓更多無法及時就醫的人能獲得診斷,也希望能讓可穿戴設備在危險的心律不齊發生時,能及時進行提醒。

    吳恩達說,這正是深度學習提高患者診斷質量、幫醫生節約時間的機會之一。