AI醫(yī)療來(lái)襲,患者、機(jī)構(gòu)、數(shù)據(jù)科學(xué)家分別有哪些新機(jī)會(huì)?
貫穿整個(gè)人類史,醫(yī)學(xué)一直是門自帶藝術(shù)氣質(zhì)的學(xué)科。相較于建立一套標(biāo)準(zhǔn)的診斷治療流程,醫(yī)學(xué)的重點(diǎn)一直在每個(gè)醫(yī)生的技巧和經(jīng)驗(yàn)上。
雖然近年來(lái),實(shí)證醫(yī)學(xué)(EBM)和精準(zhǔn)醫(yī)學(xué)的先驅(qū)已經(jīng)向醫(yī)療領(lǐng)域注入數(shù)據(jù)驅(qū)動(dòng)的嚴(yán)謹(jǐn)實(shí)踐,上面的情景已經(jīng)改變。但是,大多數(shù)醫(yī)療觀念還是公元前希波克拉底學(xué)說(shuō)的延伸。
△ 古希臘公元前醫(yī)師希波克拉底雕像,他建立了健康和疾病的平衡學(xué)說(shuō)
那目前的醫(yī)療現(xiàn)狀如何呢?事實(shí)上,世界人口稠密地區(qū)的實(shí)際醫(yī)生數(shù)量不足需求十分之一,需要百年時(shí)間才能填補(bǔ)。不僅醫(yī)務(wù)人員缺口大,并且醫(yī)療水平有限。誤診、延診和過(guò)度診斷造成數(shù)百萬(wàn)病患死亡和數(shù)百億資金的流失。
好在我們有科技。技術(shù)給醫(yī)護(hù)人員和病患提供所需的準(zhǔn)確信息,偏遠(yuǎn)地區(qū)的醫(yī)務(wù)工作者看到世界各地的醫(yī)療研究,讓發(fā)達(dá)地區(qū)的醫(yī)生診斷更高效準(zhǔn)確,在醫(yī)療診斷中更方便地了解病人及親屬。
這股醫(yī)療科技的中堅(jiān)力量就是人工智能。尤其是深度學(xué)習(xí),已經(jīng)成為一種強(qiáng)有力的檢測(cè)工具,在醫(yī)學(xué)影像領(lǐng)域表現(xiàn)驚人。比如谷歌的視網(wǎng)膜病變?cè)\斷系統(tǒng)、斯坦福的AI診斷皮膚病算法、Enlitic將深度學(xué)習(xí)運(yùn)用到癌癥等結(jié)節(jié)檢測(cè)里。
放眼整個(gè)AI醫(yī)療布局,患者、醫(yī)務(wù)工作者和數(shù)據(jù)科學(xué)家都面臨著怎樣的機(jī)遇和挑戰(zhàn)?未來(lái)的醫(yī)療形勢(shì)怎樣?那就接著往下看——
一、挑戰(zhàn)
1. 標(biāo)記過(guò)的歷史數(shù)據(jù)
有種廣為流傳的普遍說(shuō)法是,深度學(xué)習(xí)算法需要大量數(shù)據(jù)才有效,這種說(shuō)法不一定是對(duì)的。舉例來(lái)說(shuō),Enlitic的肺癌算法只掃描了1000多名癌癥患者的數(shù)據(jù),盡管數(shù)據(jù)集很小,但它具有有效建模的關(guān)鍵特征:
首先,數(shù)據(jù)集中包含了每個(gè)病人至少三年的年度掃描數(shù)據(jù),在構(gòu)建診斷算法時(shí),病情隨時(shí)間的變化情況至關(guān)重要。
其次,數(shù)據(jù)中包含了放射科醫(yī)生提供的診斷意見,里面包含肺部結(jié)節(jié)的位置,算法可以從中快速找到重要信息。
最后,數(shù)據(jù)集中包含確診肺癌三年后每個(gè)病人的康復(fù)情況,能夠說(shuō)明患者存活率等信息,幫助構(gòu)建診斷系統(tǒng)。
這個(gè)項(xiàng)目無(wú)法顯示的信息也可能很實(shí)用,比如醫(yī)生的治療建議。因?yàn)閿?shù)據(jù)集中不包含對(duì)病人的治療干預(yù)及病患反應(yīng)等縱向數(shù)據(jù),因此構(gòu)建的算法只對(duì)診斷有效,不牽扯治療計(jì)劃。
目前,傳統(tǒng)檢測(cè)方法仍無(wú)法發(fā)現(xiàn)肺部40毫米大小的結(jié)節(jié),因此肺癌患者死亡率高達(dá)90%。驚喜的是,Enlitic開發(fā)的系統(tǒng)能發(fā)現(xiàn)小于5毫米的結(jié)節(jié),使患者的生存率能增加10倍。
△ 圖中箭頭所指為肺結(jié)節(jié)(Lung Nodule)
目前,這些醫(yī)療數(shù)據(jù)信息還零散地分布在多個(gè)機(jī)構(gòu)中的不同部門中。不知我們還要多久才能實(shí)現(xiàn)跨地區(qū)醫(yī)療記錄整合,可以將多年內(nèi)所有的檢測(cè)、診斷及治療措施全部包含在里面。
2. 法律保守主義
不管數(shù)據(jù)是集中獲取還是多來(lái)源拼湊起來(lái)的,一般來(lái)說(shuō),數(shù)據(jù)持有機(jī)構(gòu)對(duì)將數(shù)據(jù)共享給數(shù)據(jù)科學(xué)家還非常謹(jǐn)慎。據(jù)司法人員透露,泄露病患隱私可能會(huì)終結(jié)數(shù)據(jù)科學(xué)家的職業(yè)生涯,還會(huì)連帶機(jī)構(gòu)損失數(shù)百萬(wàn)美元。
那么,病人是如何看待分享私人數(shù)據(jù)的呢?在被問及如果將來(lái)可能幫到他人,是否愿意分享自己的數(shù)據(jù)時(shí),大多數(shù)病人欣然同意——特別是聽說(shuō)可能會(huì)為自己將來(lái)的治療帶來(lái)更好選擇時(shí)。
二、患者的新機(jī)遇
1. 病人可控的數(shù)據(jù)
患者有個(gè)很清晰的機(jī)遇可以選擇:即從不同渠道收集自己的醫(yī)療數(shù)據(jù),包括可穿戴設(shè)備、自我報(bào)告等。數(shù)據(jù)科學(xué)家和機(jī)構(gòu)可以讓病人自己選擇將數(shù)據(jù)分享給哪些數(shù)據(jù)科學(xué)家或項(xiàng)目,給他們一個(gè)安全的數(shù)據(jù)環(huán)境。
作為回報(bào),他們可以為患者提供:提前享受到醫(yī)學(xué)最新突破的治療、財(cái)物補(bǔ)貼、數(shù)據(jù)怎樣被利用幫助其他患者的信息。
這是患有罕見或無(wú)法治療疾病的患者家屬的新機(jī)會(huì):聯(lián)合其他情況相似的病人提供各種數(shù)據(jù)。越多病人加入數(shù)據(jù)共享,越可能盡快發(fā)現(xiàn)疾病的關(guān)鍵信息。
2. 區(qū)塊鏈
不同數(shù)據(jù)的重要性不能一概而論。
罕見疾病患者的數(shù)據(jù)對(duì)治療至關(guān)重要,多年長(zhǎng)期觀測(cè)的數(shù)據(jù)比短時(shí)間內(nèi)的數(shù)據(jù)更具價(jià)值。這就會(huì)帶來(lái)一些潛在問題,比如有人想通過(guò)偽造數(shù)據(jù)獲得報(bào)酬。
區(qū)塊鏈技術(shù)能讓醫(yī)療數(shù)據(jù)記錄變得清晰可查找。根據(jù)這一記錄,數(shù)據(jù)提供者可根據(jù)數(shù)據(jù)實(shí)用程度獲得獎(jiǎng)勵(lì)。因此,病人提供的數(shù)據(jù)越完整、準(zhǔn)確、相關(guān),報(bào)酬就越高。
這也為機(jī)構(gòu)提供了一些有趣的機(jī)會(huì)。獲得病人許可的機(jī)構(gòu)可為研究人員提供完整的數(shù)據(jù)集,從中獲得財(cái)物或技術(shù)回報(bào)。從長(zhǎng)期看,病人可以授權(quán)機(jī)構(gòu)通過(guò)區(qū)塊鏈將數(shù)據(jù)傳遞給數(shù)據(jù)科學(xué)家。
三、數(shù)據(jù)科學(xué)家的機(jī)會(huì)
數(shù)據(jù)科學(xué)家都希望拿數(shù)據(jù)做些有意義的事,但只有少數(shù)人有這樣的機(jī)會(huì),大部分對(duì)口工作集中在廣告技術(shù)、對(duì)沖基金交易和產(chǎn)品推薦領(lǐng)域。
數(shù)據(jù)科學(xué)家的挑戰(zhàn)通常包括尋找數(shù)據(jù)獲取途徑、了解待解決問題、提供可實(shí)現(xiàn)的解決方法。
為了讓數(shù)據(jù)更實(shí)用,他們需要進(jìn)行一系列處理,在實(shí)踐中這些步驟通常重復(fù)多次:數(shù)據(jù)清理、探索性數(shù)據(jù)分析(EDA)、創(chuàng)建驗(yàn)證集、構(gòu)建模型、分析并檢驗(yàn)?zāi)P汀?/p>
為了完成上述步驟,數(shù)據(jù)科學(xué)家需要一個(gè)豐富的分析環(huán)境,在里面可以選擇他們的工具、庫(kù)、可視化解決方案。目前,大多數(shù)人用的是R語(yǔ)言或Python。
通過(guò)提供預(yù)裝數(shù)據(jù)和環(huán)境,數(shù)據(jù)科學(xué)家能快速找到有意義的數(shù)據(jù)。也可能是多人獨(dú)立處理一個(gè)問題,根據(jù)工作效果分得獎(jiǎng)勵(lì)。
四、AI醫(yī)療來(lái)襲,我們應(yīng)該怎么做
1. 數(shù)據(jù)收集
我們需要賦予每個(gè)病人收集和維護(hù)個(gè)人醫(yī)療數(shù)據(jù)的能力,包括:實(shí)驗(yàn)室的檢測(cè)和影像學(xué)研究、診斷、用藥處方、非處方藥和補(bǔ)充劑、其他醫(yī)療干預(yù)措施、飲食和鍛煉記錄、家族病史(理想情況下,自動(dòng)通過(guò)鏈接家庭成員自動(dòng)維護(hù)這些數(shù)據(jù))、自我報(bào)告進(jìn)展,比如精力水平、幸福感等,還有基因組學(xué)和其他測(cè)試。
這意味著患者數(shù)據(jù)也可以從醫(yī)療服務(wù)提供者那下載。不論是來(lái)自用戶還是服務(wù)提供者的數(shù)據(jù),都需要在計(jì)劃開始時(shí)下載一次,之后可以用API定期追蹤患者情況,或者用各種可穿戴設(shè)備的APP獲取他們的數(shù)據(jù)了。
2. 數(shù)據(jù)分享
每個(gè)病患都需要處理他們收到的數(shù)據(jù)請(qǐng)求,請(qǐng)求一旦增多,病人處理每個(gè)單獨(dú)請(qǐng)求也會(huì)很麻煩。在這種情況下,我們可以為病人設(shè)置接收規(guī)則,自動(dòng)判斷接受、拒絕還是需要人工干預(yù)。
每份數(shù)據(jù)都需用能溯源的方式打上來(lái)源標(biāo)簽。當(dāng)然,一些醫(yī)療數(shù)據(jù)存儲(chǔ)量很大,它不一定被存儲(chǔ)在病人的設(shè)備上。
一旦患者允許項(xiàng)目訪問他們的數(shù)據(jù),這些數(shù)據(jù)就需要對(duì)研究者公開。研究人員需要的分析環(huán)境要足夠豐富。這將向他們展示問題的全面信息,并展示如何訪問項(xiàng)目數(shù)據(jù)。
3. 巨大的機(jī)會(huì)
讓病人控制數(shù)據(jù),讓數(shù)據(jù)科學(xué)家有地方施展拳腳是個(gè)不錯(cuò)的想法。
還有一個(gè)更大的機(jī)會(huì),即當(dāng)模型可被持續(xù)更新時(shí)時(shí),將所有的模型組合在一起。每個(gè)數(shù)據(jù)科學(xué)家的特征工程步驟可被保存,并提供給后續(xù)研究使用(當(dāng)被復(fù)用時(shí),他們將得到獎(jiǎng)勵(lì))。此外,他們預(yù)先訓(xùn)練的模型激活函數(shù)可被自動(dòng)引入新模型預(yù)測(cè)能力是否提升。
讓新數(shù)據(jù)持續(xù)提升現(xiàn)有模型需要所有數(shù)據(jù)源的含義和格式相同。雖然這很復(fù)雜,但有經(jīng)驗(yàn)的數(shù)據(jù)產(chǎn)品經(jīng)理需要有先前經(jīng)驗(yàn)預(yù)先確定數(shù)據(jù)源格式或語(yǔ)義的更改,并且持續(xù)測(cè)試模型。
通過(guò)復(fù)用預(yù)先訓(xùn)練的模型,我們從組合數(shù)據(jù)集中受益,且沒有任何邏輯或隱私問題。
這也意味著我們也可以高效攻破數(shù)據(jù)量稀少的罕見疾病和兒科疾病。在這些情況中,可用預(yù)訓(xùn)練模型分析數(shù)據(jù),只需要很少的參數(shù)就能組合它們。
隨著醫(yī)療行業(yè)的進(jìn)步,這種收集和分析數(shù)據(jù)的方法將帶來(lái)新的見解,并為醫(yī)務(wù)工作者和患者提供所需信息的清晰集合。