物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

大數(shù)據(jù)全方位滲透生活 信息安全遭遇嚴(yán)峻挑戰(zhàn)

作者:甘曉
來源:中國科學(xué)報
日期:2013-12-06 14:39:14
摘要:這些年,在信息技術(shù)領(lǐng)域紅極一時的“大數(shù)據(jù)”,正不知不覺地加緊滲透到我們的生活中。它前所未有地豐富了我們的生活并產(chǎn)生了極大的便捷,同時也對公眾的個人隱私構(gòu)成威脅。

  3D打印、移動互聯(lián)、機(jī)器人、量子通信、大數(shù)據(jù)、干細(xì)胞、納米技術(shù)……日新月異的當(dāng)代科技一方面沖擊著我們的大腦,另一方面已在影響乃至改變我們的生活。這些前沿科技領(lǐng)域在國內(nèi)外的進(jìn)展如何?中國科學(xué)家身處其中發(fā)揮了何種作用?公眾從正在醞釀的科技變革中汲取了怎樣的便利與實惠?未來又將如何發(fā)展?本報從今天開始,推出年終專稿“新科技改變生活”系列報道,系統(tǒng)梳理、展示這些技術(shù)領(lǐng)域的研用現(xiàn)狀以及它們對社會生活帶來的沖擊、改變及重構(gòu)。

  經(jīng)常上網(wǎng)的你大概對這樣的場景并不陌生:當(dāng)你習(xí)慣性地瀏覽網(wǎng)頁時,卻驚訝地發(fā)現(xiàn)廣告欄里竟然出現(xiàn)了前幾天在購物網(wǎng)站里搜索過的商品?!笆钦l干的?他怎么知道我想要買什么?”第一次遇見這樣的狀況,被看穿的感覺一定不好受。然而,這恰恰是大數(shù)據(jù)時代帶給我們的一個“驚喜”。

  這些年,在信息技術(shù)領(lǐng)域紅極一時的“大數(shù)據(jù)”,正不知不覺地加緊滲透到我們的生活中。它前所未有地豐富了我們的生活并產(chǎn)生了極大的便捷,同時也對公眾的個人隱私構(gòu)成威脅。

  任何新技術(shù)的應(yīng)用似乎都難以避免一種窘境:在機(jī)遇與風(fēng)險之間尋找平衡。信息技術(shù)領(lǐng)域同樣如此。未來,大數(shù)據(jù)應(yīng)用將在解決現(xiàn)實問題上產(chǎn)生更多亮點,也必將遇到信息安全方面更為嚴(yán)峻的挑戰(zhàn)。

  全方位滲透生活

  早在1980年,美國未來學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數(shù)據(jù)贊頌為“第三次浪潮的華彩樂章”。不過,直到2009年,“大數(shù)據(jù)”才開始成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。

  今天,“大數(shù)據(jù)”已經(jīng)在各行各業(yè)衍生出形形色色的數(shù)據(jù)應(yīng)用。中國工程院院士李國杰曾表示:“推動大數(shù)據(jù)研究的動力主要來自企業(yè)的經(jīng)濟(jì)效益”。IBM、谷歌、亞馬遜、Facebook等跨國巨頭正是發(fā)展大數(shù)據(jù)技術(shù)的主要推動者。

  2008年推出的“谷歌流感趨勢”,至今看來仍不失為一個典型的大數(shù)據(jù)應(yīng)用范例。谷歌設(shè)計人員認(rèn)為,人們輸入的搜索關(guān)鍵詞代表了他們的即時需要。他們編入了“溫度計”、“肌肉疼痛”、“發(fā)燒”、“噴嚏”等與流感有關(guān)的關(guān)鍵詞,當(dāng)用戶輸入這些關(guān)鍵詞時,系統(tǒng)便會開始跟蹤分析,創(chuàng)建流感圖表和地圖。

  為了驗證“谷歌流感趨勢”預(yù)警系統(tǒng)的正確性,谷歌多次把測試結(jié)果與美國疾病控制與預(yù)防中心的報告作對比,結(jié)果證實兩者存在很大的相關(guān)性。

  中科院軟件研究所副研究員張敏告訴《中國科學(xué)報》記者:“這正是大數(shù)據(jù)的應(yīng)用方式之一,即發(fā)現(xiàn)統(tǒng)計規(guī)律?!彼J(rèn)為,大數(shù)據(jù)的應(yīng)用方式還包括分析個體規(guī)律和集成形成知識。

  在國內(nèi),購物網(wǎng)站對大數(shù)據(jù)應(yīng)用顯得極為積極。中科院軟件所的幾名研究人員曾幫助淘寶網(wǎng)進(jìn)行廣告排序的改進(jìn)。他們抓取了淘寶網(wǎng)近900萬條廣告點擊數(shù)據(jù),通過分析廣告類目、展現(xiàn)位置、商品價格、圖片內(nèi)容等因素對用戶行為的影響,建立了用戶偏好模型。

  “我們基于這些用戶偏好分析,幫助淘寶網(wǎng)建立了新的廣告排序算法,在線上測試中將廣告收益提高了5.5%。”該所副研究員楊達(dá)對《中國科學(xué)報》記者說。

  電商平臺的偏好,僅僅是大數(shù)據(jù)應(yīng)用的冰山一角。在醫(yī)療、商業(yè)、教育、金融、軍事、科研等領(lǐng)域,大數(shù)據(jù)技術(shù)也正在如火如荼地應(yīng)用著。

  連接虛擬與現(xiàn)實

  今年7月,華東師范大學(xué)一名女生收到來自學(xué)校勤助中心的短信:“同學(xué)你好,發(fā)現(xiàn)你上個月餐飲消費較少,不知是否有經(jīng)濟(jì)困難?如有困難,可電話、短信或郵件我?!?/P>

  事實上,這名女生因為減肥減少了飯卡支出,觸發(fā)了學(xué)校對于飯卡消費數(shù)據(jù)的監(jiān)控系統(tǒng)。這個監(jiān)控系統(tǒng)通過對飯卡消費數(shù)據(jù)分析,了解學(xué)生的經(jīng)濟(jì)狀況,推測如果花銷顯著少于正常情況,校方是否應(yīng)采取必要的干預(yù)措施。

  這名女生把短信截圖發(fā)到微博上,立即引來一片贊揚聲:“負(fù)責(zé)的學(xué)校,讓冰冷的數(shù)據(jù)有了人性之美。”

  這一案例也成為業(yè)內(nèi)人士一直津津樂道的一個觀點:大數(shù)據(jù)技術(shù)應(yīng)用不能僅在數(shù)據(jù)上下功夫,還需要更多地與現(xiàn)實生活相結(jié)合。

  大數(shù)據(jù)被寄予厚望的地方或許恰恰在于此——其創(chuàng)造價值的過程本身就是一場“商業(yè)和科學(xué)革命”。因而,數(shù)據(jù)處理與分析等基礎(chǔ)技術(shù)的突破已經(jīng)不是當(dāng)前的最大障礙,關(guān)鍵在于如何從商業(yè)、社會的角度充分理解數(shù)據(jù)。

  “數(shù)據(jù)背后是網(wǎng)絡(luò),網(wǎng)絡(luò)背后是人,研究網(wǎng)絡(luò)數(shù)據(jù)實際上是研究人組成的社會網(wǎng)絡(luò)?!痹?012年5月召開的第424次香山科學(xué)會議上,李國杰提出建立一門大數(shù)據(jù)研究的“網(wǎng)絡(luò)數(shù)據(jù)科學(xué)”,重點研究數(shù)據(jù)背后的社會網(wǎng)絡(luò)。

  就在他提出建立這門新型交叉學(xué)科之前的兩個月,美國聯(lián)邦政府宣布了“大數(shù)據(jù)研究和發(fā)展倡議”計劃,擬用2億美元提高從大量數(shù)字?jǐn)?shù)據(jù)中訪問、組織、收集發(fā)現(xiàn)信息的工具和技術(shù)水平。

  《大數(shù)據(jù)時代》一書的中文譯者周濤認(rèn)為,大數(shù)據(jù)分析和利用與提升國家競爭力及國民幸福程度密切相關(guān),數(shù)據(jù)儲備和數(shù)據(jù)分析能力將成為未來新型國家最重要的核心戰(zhàn)略能力。

  周濤稱:“包括與國家安全、社會穩(wěn)定相關(guān)的尖端武器制造與性能模擬實驗,群體事件以及謠言的預(yù)警和干預(yù);與國家科技能力相關(guān)的等離子即高能粒子實驗分析,納米材料及生物基因工程;與國民經(jīng)濟(jì)繁榮相關(guān)的經(jīng)濟(jì)金融態(tài)勢感知與失穩(wěn)預(yù)測,精準(zhǔn)營銷與智能物流倉儲等。”

  面向2020年,中國也將在戰(zhàn)略高度上將信息科技發(fā)展作為主戰(zhàn)場之一,在新科技革命進(jìn)程中,加速人、機(jī)、物三元世界的融合發(fā)展。

  挑戰(zhàn)信息安全

  通過立法和各種有效手段保護(hù)個人隱私刻不容緩

  回到文章開頭,被大數(shù)據(jù)應(yīng)用猜到購物喜好的尷尬大概源于對個人隱私泄露的不安。的確,目前大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)之一便是對個人隱私信息的擔(dān)憂。

  張敏回憶起前些年看過的一個科幻故事,描寫的是當(dāng)時的作者暢想的現(xiàn)代生活:主人公早晨醒來打開一部類似手機(jī)的機(jī)器,機(jī)器自動彈出了主人公將要前往地點的路線及相關(guān)信息,不僅如此,主人公最喜歡的餐廳和電影也被自動推送出來。

  “你能相信嗎,有一臺機(jī)器比你自己還了解你?!睆埫舾袊@。不過在她看來,這樣美好的未來對于個人隱私也是相當(dāng)危險的。

  “棱鏡計劃”是談?wù)摯髷?shù)據(jù)時不得不提的事件。根據(jù)美國中情局前職員愛德華·斯諾登提供的信息,美國情報機(jī)構(gòu)在2007年開始的“棱鏡”竊聽計劃中,對美國9家互聯(lián)網(wǎng)公司的數(shù)據(jù)進(jìn)行挖掘工作,從音頻、視頻、圖片、郵件、文檔以及連接信息中分析個人的聯(lián)系方式與行動。該計劃一經(jīng)曝光,便受到國際社會的譴責(zé)。

  然而,《大數(shù)據(jù)時代》作者舍恩·伯格在評論斯諾登事件時曾表示,令他驚奇的并不是“棱鏡計劃”本身,而是大家對這個計劃如此驚奇,大多數(shù)人竟然仍以小數(shù)據(jù)的經(jīng)驗和視野來看待它。

  從大數(shù)據(jù)應(yīng)用創(chuàng)新的角度來看,“棱鏡計劃”無疑是一個非常出色的案例,同樣暴露了大數(shù)據(jù)應(yīng)用對個人隱私的威脅。

  大數(shù)據(jù)時代如何保護(hù)個人隱私是一個共同關(guān)心的問題。在前不久召開的中國計算機(jī)學(xué)會青年計算機(jī)科技論壇上,南京大學(xué)計算機(jī)系教授仲盛介紹,傳統(tǒng)互聯(lián)網(wǎng)對個人信息保護(hù)的方式之一便是“去識別”,即去掉姓名等關(guān)鍵信息。那么,大數(shù)據(jù)時代,“去識別”還能保護(hù)隱私嗎?

  例如,一家醫(yī)院在提供醫(yī)療服務(wù)時發(fā)現(xiàn)張家村有兩名45歲的男性患有某種疾病,其中一名未婚。在這條信息里,病人的個人信息雖然被去除了,但只要知道張家村有誰滿足45歲和未婚兩個條件,依然能知道究竟是誰患病。

  仲盛指出,正是數(shù)據(jù)集成暴露了個人隱私。“即使每一個機(jī)構(gòu)發(fā)布的數(shù)據(jù)都是安全的,但把它們結(jié)合在一起便什么都知道了。”他說。

  從技術(shù)而言,科學(xué)家至今還沒有最有效的辦法為個人隱私“上保險”。大數(shù)據(jù)時代的信息安全恐怕需要新的社會規(guī)則來規(guī)范使用數(shù)據(jù)的行為。

  2013年年初,世界經(jīng)濟(jì)論壇發(fā)表《解除個人信息的價值:從收集到使用》的報告,甚至建議所有數(shù)據(jù)收集都應(yīng)當(dāng)使用密碼,以達(dá)到“限制使用數(shù)據(jù)”的目的。

  大數(shù)據(jù)的應(yīng)用對公眾信息安全來說無疑增加了一個新的維度。李國杰在接受媒體采訪時曾表示:“如何通過立法和各種手段真正保護(hù)個人的隱私,這是國家需要高度重視的一個新的安全問題。”

人物訪談