百度上線流行病預(yù)測 大數(shù)據(jù)進(jìn)入應(yīng)用模式
2010年《讓子彈飛》中土匪張麻子在伏擊縣長馬邦德時(shí)有一句經(jīng)典臺詞:“別急,讓子彈飛一會?!弊罱K子彈成為勝負(fù)的關(guān)鍵一槍,也是這么一顆子彈串起了劇中所有人的命運(yùn)。
用一個(gè)四年前的老電影故事的主要原因是,子彈在飛與擊中目標(biāo)的過程,以及過程中看客心態(tài),射擊者心態(tài),與我們當(dāng)下的一種環(huán)境十分相像:大數(shù)據(jù)與公共衛(wèi)生建設(shè)。在過去的幾年間,大數(shù)據(jù)技術(shù)之于公共衛(wèi)生就像一顆高速飛出的子彈,一直飛在空中,無法真正為公共衛(wèi)生提供成熟可操作的解決方案。
回望過去,2009年的一場甲型H1N1 流感是扣動大數(shù)據(jù)扳機(jī)的關(guān)鍵力量。在與這場奪去幾百人生命的流行疾病戰(zhàn)斗中,人們發(fā)現(xiàn)了流行疾病前置預(yù)測的重要性。傳統(tǒng)的公共衛(wèi)生管理中,一般要求醫(yī)生在發(fā)現(xiàn)新型流感病例時(shí)告知疾病控制與預(yù)防中心。但這種處理方式有一個(gè)致命弊端:流行疾病的傳播性遠(yuǎn)遠(yuǎn)快于后置傳遞的信息——人們都會在發(fā)病多日后才選擇醫(yī)院就診,從就診到醫(yī)院發(fā)出診斷預(yù)警信息,這其中約有一至兩周的滯后周期。這也就直接導(dǎo)致,當(dāng)一場流行疾病真正在公眾中爆發(fā)時(shí),已經(jīng)錯(cuò)過了最佳預(yù)警時(shí)期。
所以,在公共衛(wèi)生流行疾病的管理中,如何抓住這往往被醫(yī)療管理者和大眾都忽略的黃金一周成為關(guān)鍵。我們可以先回放,當(dāng)一種流行疾病在一個(gè)個(gè)體上出現(xiàn)時(shí),人們的行為都是如何應(yīng)激的:第一天,他們會先忽略一些小小的不舒服,繼續(xù)工作學(xué)習(xí);第三、五天,甚至接下來的一周中,當(dāng)病癥擴(kuò)大時(shí),不舒適感增強(qiáng),他們開始通過網(wǎng)絡(luò)查詢病癥以及對應(yīng)的治療方案。這時(shí),人們的行為出現(xiàn)分流,一部分人繼續(xù)自我治療,而另一部分人則選擇到醫(yī)療機(jī)構(gòu)診治。
而這其中從第三天開始之后的一周到兩周的時(shí)間中,發(fā)生的行為大數(shù)據(jù)成為預(yù)測的關(guān)鍵。這一時(shí)期中,人們在網(wǎng)絡(luò)上詢問各種關(guān)于病癥的問題,以及自我治療的方法。無論是詢問病癥關(guān)鍵詞,還是藥品關(guān)鍵詞都可以成為大數(shù)據(jù)預(yù)警的觸發(fā)機(jī)制。大數(shù)據(jù)公司可以通過實(shí)時(shí)監(jiān)控,發(fā)現(xiàn)不同病癥的地域分布、觸及人群廣度,并結(jié)合醫(yī)療工作者豐富的經(jīng)驗(yàn)值來組合判斷流行疾病爆發(fā)的可能性。
如谷歌的“流行感冒預(yù)測”就是目前海外認(rèn)知度頗高的案例,他們把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行了比較,最終通過數(shù)學(xué)模型的搭建,構(gòu)成了預(yù)測系統(tǒng),在2009年發(fā)布了冬季流行感冒預(yù)測結(jié)果,與官方數(shù)據(jù)的相關(guān)性高達(dá)97%。目前,谷歌流行疾病預(yù)測包括了流感趨勢、登革熱趨勢。
中國政府相關(guān)部門也在2010年開始嘗試與百度等互聯(lián)網(wǎng)科技公司合作,嘗試通過大數(shù)據(jù)的挖掘管理,分析實(shí)現(xiàn)流行疾病預(yù)警管理。中國疾病預(yù)防控制中心副主任、中科院院士高福也認(rèn)同大數(shù)據(jù)在公共衛(wèi)生預(yù)防控制上的作用。他公開表示,通過大數(shù)據(jù)可以在流感到來之前為人們提供一些解釋性信息,為流感的預(yù)防提供緩沖時(shí)間。
如今,中國已經(jīng)不僅僅預(yù)測流感,還開始預(yù)測包括肝炎、肺結(jié)核、性病等4種主要疾病。提供這項(xiàng)大數(shù)據(jù)預(yù)測服務(wù)的是百度,數(shù)據(jù)源除了query數(shù)據(jù)之外,還用到了google沒有用到的微博數(shù)據(jù),以及百度知道的與疾病相關(guān)提問的趨勢。借助其在移動互聯(lián)網(wǎng)的14個(gè)過億用戶入口,移動數(shù)據(jù)也將為預(yù)測提供下一步更加意義深遠(yuǎn)的支持,如:各地疾病人群遷徙的數(shù)據(jù)特征,各地天氣變化等等。據(jù)說,未來的預(yù)測將從現(xiàn)在的4種擴(kuò)展到30多種主要疾病。
在具體的數(shù)據(jù)分析與挖掘方面,百度疾病預(yù)測將地區(qū)差異作為重要變量,針對每個(gè)城市分別建模,光是基于數(shù)據(jù)輸出模型就達(dá)到300余個(gè)。加之后臺數(shù)據(jù)的精心準(zhǔn)備,讓百度的疾病預(yù)測在最終的產(chǎn)品端可以提供全國331個(gè)地級市,2870個(gè)區(qū)縣的疾病態(tài)勢預(yù)測。
大數(shù)據(jù)終于不再只是飛,落地中國公共衛(wèi)生管理也只是一個(gè)美好的開始,我們可以想的更多,這個(gè)數(shù)據(jù)庫的模型可以更加豐富,例如:在數(shù)據(jù)收集端,通過智能移動健康設(shè)備實(shí)現(xiàn)個(gè)人健康數(shù)據(jù)實(shí)時(shí)監(jiān)測,數(shù)據(jù)即可輸送至公共衛(wèi)生管理大數(shù)據(jù)庫,也可以建立個(gè)人健康管理電子檔案。在數(shù)據(jù)利用端,通過個(gè)人電子健康檔案,可實(shí)現(xiàn)家族疾病以及慢性疾病的實(shí)時(shí)監(jiān)控,并對此實(shí)現(xiàn)長期對癥治療。