喚醒“沉睡”的醫(yī)療大數(shù)據(jù)
人類已經(jīng)全面進(jìn)入大數(shù)據(jù)時(shí)代。而醫(yī)療與大數(shù)據(jù)的“聯(lián)姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數(shù)據(jù)仍處于“沉睡”狀態(tài)。如何真正進(jìn)行實(shí)踐,讓大數(shù)據(jù)為醫(yī)生、為患者服務(wù),賦能醫(yī)療新形態(tài),依然是擺在我們面前的一道難題。
【編者按】共享數(shù)據(jù),才能更好地使用數(shù)據(jù)。如何將這些散落的、非標(biāo)準(zhǔn)化的、復(fù)雜的數(shù)據(jù)集合起來并可使用、可計(jì)算,還需做大量且復(fù)雜的工作……
如何將散落的、非標(biāo)準(zhǔn)化的、復(fù)雜的醫(yī)療大數(shù)據(jù)集合起來并可使用、可計(jì)算,需要做大量且復(fù)雜的工作。當(dāng)然這并非不可能實(shí)現(xiàn),但需要成本及時(shí)間。
人類已經(jīng)全面進(jìn)入大數(shù)據(jù)時(shí)代。而醫(yī)療與大數(shù)據(jù)的“聯(lián)姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數(shù)據(jù)仍處于“沉睡”狀態(tài)。如何真正進(jìn)行實(shí)踐,讓大數(shù)據(jù)為醫(yī)生、為患者服務(wù),賦能醫(yī)療新形態(tài),依然是擺在我們面前的一道難題。
專門數(shù)據(jù)庫與大數(shù)據(jù)平臺相配合
2016年,國務(wù)院發(fā)布《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》,要求加快建設(shè)統(tǒng)一權(quán)威、互聯(lián)互通的人口健康信息平臺,推動健康醫(yī)療大數(shù)據(jù)資源共享開放;同年,《“健康中國2030”規(guī)劃綱要》提出,消除數(shù)據(jù)壁壘,建立和完善全國健康醫(yī)療數(shù)據(jù)資源目錄體系。2017 年,國務(wù)院發(fā)布《“十三五”深化醫(yī)藥衛(wèi)生體制改革規(guī)劃》,提出健全基于互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的分級診療信息系統(tǒng);應(yīng)用藥品流通大數(shù)據(jù),拓展增值服務(wù)深度和廣度。
醫(yī)療大數(shù)據(jù)的應(yīng)用早已突破診療過程,與整個(gè)健康體系密切相關(guān),對藥物研發(fā)、健康管理和公共衛(wèi)生服務(wù)等環(huán)節(jié)都具有重要意義。如何實(shí)現(xiàn)各個(gè)專門數(shù)據(jù)庫與大數(shù)據(jù)平臺之間的聯(lián)通與配合,打通數(shù)據(jù)“孤島”,是擺在醫(yī)療大數(shù)據(jù)實(shí)踐面前的一道鴻溝。
北京大學(xué)腫瘤醫(yī)院院長、教授季加孚以美國和日本的案例對此進(jìn)行了分析。他指出:“目前國際大型腫瘤數(shù)據(jù)庫大致分為兩類:基于人群的數(shù)據(jù)庫和基于醫(yī)院系統(tǒng)的數(shù)據(jù)庫。美國SEER(監(jiān)測、流行病學(xué)和結(jié)果)數(shù)據(jù)庫和日本癌癥登記數(shù)據(jù)庫屬于前者,而美國的NCDB(國家癌癥數(shù)據(jù)庫)和日本的NCD(國家臨床數(shù)據(jù)庫)屬于后者?!?br/>
比較來看,不同類型數(shù)據(jù)庫所能實(shí)現(xiàn)的效果不同。季加孚分析說:“基于醫(yī)院的數(shù)據(jù)庫,更符合臨床需求,可為患者診斷與治療提供更多有針對性的信息。但是這類數(shù)據(jù)庫存在就診偏倚,并不能很好地反映人口學(xué)分層的特點(diǎn),例如NCDB和SEER數(shù)據(jù)庫在某些癌種的種族、年齡分布上存在差異?;谌巳旱臄?shù)據(jù)庫流行病學(xué)意義更加明確,能為國家戰(zhàn)略制定提供更多依據(jù)。通常兩種形式數(shù)據(jù)庫間的相互融合、數(shù)據(jù)共享能起到1+1>2的作用?!?/p>
那么不同數(shù)據(jù)庫之間是如何配合的呢?以日本NCD和癌癥登記數(shù)據(jù)庫為例,NCD主要收集詳盡的圍術(shù)期數(shù)據(jù),而隨訪數(shù)據(jù)的積累一定程度上需依靠癌癥登記數(shù)據(jù)庫完成。由于《癌癥登記法》的強(qiáng)制性和廣泛覆蓋,腫瘤登記處會收集腫瘤患者的預(yù)后信息。這些信息會由登記處返回到提供信息的醫(yī)院,NCD即可通過醫(yī)院獲取腫瘤相關(guān)預(yù)后信息。
乳腺癌、胃癌、食管癌、肝癌等專病數(shù)據(jù)庫也逐步并入NCD。此外,NCD還和DPCD(日本診斷程序組合數(shù)據(jù)庫)等醫(yī)療保險(xiǎn)數(shù)據(jù)庫互通,開展衛(wèi)生經(jīng)濟(jì)學(xué)相關(guān)研究。與之類似,美國SEER數(shù)據(jù)庫與醫(yī)療保險(xiǎn)合作,形成了SEER-Medicare數(shù)據(jù)庫。
跨界合力才能打通數(shù)據(jù)“孤島”
在大數(shù)據(jù)領(lǐng)域從業(yè)近十年的架構(gòu)師沈辰在接受采訪中告訴《中國科學(xué)報(bào)》,大數(shù)據(jù)具有所謂的“4V”屬性,即大規(guī)模(volume)、多樣性(variety)、產(chǎn)生和變化速度快(velocity)和價(jià)值密度低(value)。
“醫(yī)療大數(shù)據(jù)也是一樣,如何將這些散落的、非標(biāo)準(zhǔn)化的、復(fù)雜的數(shù)據(jù)集合起來并可使用、可計(jì)算,需要做大量且復(fù)雜的工作。當(dāng)然這并非不可能實(shí)現(xiàn),但需要成本及時(shí)間?!?br/>
南京醫(yī)科大學(xué)接受第二附屬醫(yī)院腸病中心主任張發(fā)明在采訪中提出,醫(yī)療行為過程中會產(chǎn)生大量的數(shù)據(jù),而將這海量的數(shù)據(jù)進(jìn)行處理,真正為醫(yī)療服務(wù),大部分醫(yī)院目前不具備這樣的能力和經(jīng)驗(yàn),需要大型數(shù)據(jù)服務(wù)商的支持。
上海第九人民醫(yī)院在2013年搭建了基于臨床數(shù)據(jù)倉庫(CDR)大數(shù)據(jù)集成平臺,其合作對象是微軟中國。通過對所有的業(yè)務(wù)數(shù)據(jù)庫的表單進(jìn)行系統(tǒng)整合與深度挖掘,實(shí)現(xiàn)對醫(yī)院的內(nèi)部運(yùn)營管理、醫(yī)療質(zhì)量控制、醫(yī)院感染管理、績效考核與分配等實(shí)時(shí)數(shù)據(jù)分析管理,并且整合了單病種臨床數(shù)據(jù)庫與樣本庫、基因庫關(guān)聯(lián)的臨床科研信息系統(tǒng)在臨床研究方面的應(yīng)用。
杭州健培科技有限公司是一家從事醫(yī)學(xué)影像大數(shù)據(jù)挖掘和醫(yī)療人工智能技術(shù)的企業(yè),開發(fā)了閱片機(jī)器人“啄醫(yī)生”。董事長兼CEO程國華在創(chuàng)業(yè)初期就親身經(jīng)歷過醫(yī)生與科技人員在思維與工作方式方法上的碰撞,他在采訪中告訴《中國科學(xué)報(bào)》:“醫(yī)療大數(shù)據(jù)的應(yīng)用絕不單純是醫(yī)療領(lǐng)域的事情,而是一項(xiàng)跨學(xué)科的問題。”
專業(yè)人才的缺乏同樣也是擺在醫(yī)療大數(shù)據(jù)發(fā)展面前的難題。北京大學(xué)腫瘤醫(yī)院在2013年就開展了腫瘤登記及數(shù)據(jù)庫搭建工作,如今先后完成了基于電子病歷平臺的臨床科研一體化模式、數(shù)據(jù)綜合利用平臺及臨床試驗(yàn)管理系統(tǒng)項(xiàng)目,這樣的成績離不開專業(yè)的醫(yī)療信息化團(tuán)隊(duì)。
北大腫瘤醫(yī)院信息部主任衡反修是醫(yī)院搭建早期HIS系統(tǒng)的核心骨干,他認(rèn)為,專業(yè)的技術(shù)背景和對醫(yī)療工作的深刻理解,才能真正“喚醒”醫(yī)療大數(shù)據(jù)。衡反修指出,對醫(yī)院來說:客觀存在“不敢、不愿、不會”三方面的問題,其中“不會”正是因?yàn)榇髷?shù)據(jù)必須要有技術(shù)支撐,沒有技術(shù)支撐就沒法兒對數(shù)據(jù)進(jìn)行挖掘和利用。
他強(qiáng)調(diào):“在數(shù)據(jù)共享開放過程中,技術(shù)、標(biāo)準(zhǔn)、機(jī)制、體制突破仍存在較大的障礙,造成各部門在推動過程當(dāng)中‘不會’做。核心是數(shù)據(jù)能否做到安全可控,讓醫(yī)院放心?!?/p>
信息安全是共享的前提
共享數(shù)據(jù),才能更好地使用數(shù)據(jù)。程國華指出,盡管我們擁有海量的醫(yī)療大數(shù)據(jù)但是共享的程度很低,“沉睡”的大數(shù)據(jù)無法發(fā)揮作用。
“最直接的結(jié)果就是患者重復(fù)就醫(yī)、醫(yī)生重復(fù)看病、給患者重復(fù)做同樣的檢查等。這既給患者增加了沉重的負(fù)擔(dān),延誤了治病的最好時(shí)機(jī),又浪費(fèi)了有限的醫(yī)療資源。從某種意義上可以說,這也是造成醫(yī)患矛盾的一個(gè)重要原因。更不用說醫(yī)務(wù)人員利用海量的醫(yī)療大數(shù)據(jù)進(jìn)行科研,提高醫(yī)療水平了。”
大數(shù)據(jù)共享不易,重要原因正是出于對信息安全的擔(dān)憂。醫(yī)療數(shù)據(jù)是極為敏感的隱私信息,一旦發(fā)生泄露,后果極其惡劣。2018年新加坡保健集團(tuán)健康數(shù)據(jù)遭黑客攻擊,150萬人的個(gè)人信息被非法獲取。新加坡總理李顯龍的配藥記錄、門診信息也遭到外泄,其他多名部長的個(gè)人資料和門診配藥記錄同樣被黑客獲取。這一時(shí)間直接導(dǎo)致新加坡所有的“智能國家”計(jì)劃暫停,包括強(qiáng)制性的“國家電子健康記錄”(NEHR)項(xiàng)目——該項(xiàng)目允許新加坡的醫(yī)院互相分享患者的治療記錄和醫(yī)療數(shù)據(jù)。
衡反修分析說:“不敢,正是因?yàn)閿?shù)據(jù)共享、數(shù)據(jù)安全這些問題沒有解決,所以不敢去做。沒有規(guī)定,或者不太明確,不敢做?!?/p>
季加孚建議,對于大數(shù)據(jù)安全,可參考國際通用的健康保險(xiǎn)攜帶和責(zé)任(HIPAA)法案對患者數(shù)據(jù)進(jìn)行脫敏,保證患者數(shù)據(jù)隱私;采用加密強(qiáng)度較高的算法,確保數(shù)據(jù)存儲與傳輸?shù)陌踩珕栴};參照國家信息安全等級保護(hù),引進(jìn)吸收國外醫(yī)療行業(yè)先進(jìn)數(shù)據(jù)安全管理理念,實(shí)現(xiàn)傳統(tǒng)網(wǎng)絡(luò)安全與數(shù)據(jù)安全的融合。