大數(shù)據(jù)讓隱私無比糾結(jié)
正被美國全球通緝的斯諾登昨天“闖入”上海一場大數(shù)據(jù)研討會。確切地說,研討會的多位講者都提到被斯諾登捅破的“棱鏡門”。從純技術(shù)角度觀察,“棱鏡”是一個(gè)典型的通過分析海量通訊數(shù)據(jù)獲取安全情報(bào)的大數(shù)據(jù)案例;但它也引發(fā)思考:大數(shù)據(jù)時(shí)代,個(gè)人隱私該何處安放?
昨天發(fā)言的上海交大教授汪小帆透露,美國《科學(xué)》雜志兩周前刊文提到了大數(shù)據(jù)和“棱鏡門”,只需看標(biāo)題就能明白它的意思:《網(wǎng)絡(luò)科學(xué)處于監(jiān)控爭議的中心》。
昨天的研討會由高級智庫“中國信息化百人會”主辦,主題是“大數(shù)據(jù):挑戰(zhàn)和機(jī)遇”。不過,講者談挑戰(zhàn)比談機(jī)遇更多;而諸多挑戰(zhàn)中,隱私是核心關(guān)鍵詞。
手機(jī)將“出賣”你
大數(shù)據(jù)時(shí)代,隱私空間之小,也許超出人們的想象。
電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心主任周濤教授介紹了今年公開的一項(xiàng)最新研究成果:某個(gè)手機(jī)用戶只要曾出現(xiàn)在4個(gè)基站的服務(wù)區(qū),利用大數(shù)據(jù)模型,研究者就能把他從百萬用戶中區(qū)分出來,識別他的身份,準(zhǔn)確率為95%。此文發(fā)表在《自然》出版集團(tuán)的學(xué)術(shù)刊物《科學(xué)報(bào)告》上。
周濤半開玩笑地說,這篇論文的結(jié)論就是,別讓我在4個(gè)基站看到你。
周濤是舍恩伯格撰寫的暢銷書《大數(shù)據(jù)時(shí)代》的中文譯者。他表示,大數(shù)據(jù)的“1.0版本”僅僅是分析那些與目標(biāo)直接相關(guān)的數(shù)據(jù),但到“2.0版本”后,大數(shù)據(jù)更關(guān)心“數(shù)據(jù)的外化”,也就是將更多看似無關(guān)的數(shù)據(jù)納入視野。
周濤本人也正研究如何通過大數(shù)據(jù)識別個(gè)人信息,結(jié)論同樣驚人。他告訴記者,通過分析一個(gè)人某段時(shí)間的GPS定位數(shù)據(jù),就能知道他的性取向:“瞞了家人幾十年的秘密,也許一個(gè)手機(jī)軟件就能出賣你?!贝送庵軡€透露,他還在用類似方法發(fā)現(xiàn)腐敗分子,識別率也很高。
無論是“4個(gè)基站”,還是“手機(jī)與性取向”的研究,說到底都提示出一點(diǎn):通常被認(rèn)為與隱私無甚關(guān)聯(lián)的信息,在大數(shù)據(jù)時(shí)代都將發(fā)生質(zhì)變。周濤透露,國外科學(xué)家已經(jīng)建立了模型,通過分析人們在“臉譜”網(wǎng)站(Facebook)上的行為,也能判斷他的性取向,所需要的只是用戶添加的“喜歡”或“不喜歡”標(biāo)簽,大約需要100個(gè)。
當(dāng)規(guī)則遭遇現(xiàn)實(shí)
周濤強(qiáng)調(diào),他的研究被置于嚴(yán)格的監(jiān)管之下,而且是基于同性戀者自愿提供的信息,并不侵犯隱私。但是否每個(gè)大數(shù)據(jù)從業(yè)者都如此遵守規(guī)則?
在思維世紀(jì)公司董事長章林光看來,現(xiàn)在的問題是根本沒有完善的規(guī)則。
目前,公認(rèn)的網(wǎng)絡(luò)隱私原則,簡單說是“知情同意”。某機(jī)構(gòu)在獲取網(wǎng)民信息前,必須就信息獲取的范圍、用途等,向網(wǎng)民告知并獲得同意。但章林光說,大數(shù)據(jù)時(shí)代,這種知情同意失去了操作性。比如,谷歌曾嘗試分析網(wǎng)民搜索的關(guān)鍵詞組合,比如“感冒藥”“藥房”等,于是能領(lǐng)先政府疾控部門一個(gè)星期預(yù)測出流感疫情。但在知情同意的問題上,谷歌并非無可指摘。且不說該研究要得到億萬網(wǎng)民的同意是否可行,起碼的一點(diǎn)是,用大數(shù)據(jù)分析海量的搜索行為,其研究方向本身就是不確定的――誰都不知道,看似無關(guān)的數(shù)據(jù)被整合之后,最終能挖掘出什么。因此,要網(wǎng)站每次都明確告知用戶搜集信息的目標(biāo),基本沒有可能。
章林光說,如果基于現(xiàn)在的原則,那么數(shù)據(jù)的采集、挖掘、處理、管理只能在法律面前徘徊。而且在他看來,目前的規(guī)則必然導(dǎo)致“個(gè)人信息交易的黑市”。
中國工程院院士鄔賀銓昨天也明確提出,平衡信息共享與隱私保護(hù)的矛盾,是大數(shù)據(jù)發(fā)展的關(guān)鍵,亟需出臺《信息公開法》和《信息保護(hù)法》,既要鼓勵(lì)面向群體且服務(wù)社會的數(shù)據(jù)挖掘,又要防止侵犯個(gè)人隱私。
網(wǎng)民該讓步嗎?
北京郵電大學(xué)管理學(xué)院教授萬巖說,她曾對自己的學(xué)生做了一個(gè)問卷:公開自己的信息從而得到更有針對性的營銷,或是嚴(yán)格保護(hù)隱私但必須自己動(dòng)手搜索商品,你會選哪一個(gè)?學(xué)生們的回答大致是五十對五十。
章林光也提出,“棱鏡門”事件雖然反響惡劣,但也有調(diào)查表明,半數(shù)美國人對美國政府的做法未必持反對態(tài)度。
這些結(jié)論似乎暗示,普通人對網(wǎng)絡(luò)隱私的態(tài)度,也許還很有寬容度。
章林光建議,公眾必須接受、或者說忍受一個(gè)事實(shí)――大數(shù)據(jù)時(shí)代,人就是透明的,“個(gè)人隱私保護(hù)現(xiàn)在被過度解讀,這窒息了數(shù)據(jù)共享?!?/P>
中國電信政企客戶事業(yè)部總經(jīng)理韓臻聰和電子科大的周濤也持類似觀點(diǎn)。他們都認(rèn)為,民眾中有一股不冷靜的情緒,而這將阻礙社會進(jìn)步。
中國互聯(lián)網(wǎng)協(xié)會副理事長高新民透露,今年央視“3 15”晚會曝光網(wǎng)絡(luò)營銷公司用Cookie軟件定位網(wǎng)民的事件后,不少企業(yè)向他反映,許多人關(guān)閉了Cookie。高新民認(rèn)為,Cookie不等于暴露隱私,沒有Cookie就沒有大數(shù)據(jù)。
章林光呼吁,有必要對隱私的定義進(jìn)行公開討論,真正劃清“個(gè)人隱私”與“公開數(shù)據(jù)”的邊界,否則大數(shù)據(jù)就是紙上談兵,未來十年也未必有什么進(jìn)展。
如果所有人都可以真正參與討論,這當(dāng)然是一個(gè)中肯的建議。昨天,有影響力人物都已異口同聲地表態(tài),網(wǎng)民們究竟該如何選擇呢?