物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

專家解讀:大數(shù)據(jù)是未來的新石油

作者:邱晨輝
來源:中國青年報
日期:2014-01-10 09:23:39
摘要:大數(shù)據(jù)來襲,究竟意味著什么?在中國科協(xié)近日舉辦的科學家與媒體面對面活動上,中國聯(lián)通網(wǎng)絡技術研究院首席專家唐雄燕給出一組直觀數(shù)據(jù)來描繪了大數(shù)據(jù)的未來圖景:到2030年,中國一個普通的家庭會有40~50個智能終端,一個家庭產(chǎn)生的數(shù)據(jù)是20TB,相當于半個國家圖書館的藏書容量,即2600萬冊,40TB。

  大數(shù)據(jù)來襲,究竟意味著什么?在中國科協(xié)近日舉辦的科學家與媒體面對面活動上,中國聯(lián)通網(wǎng)絡技術研究院首席專家唐雄燕給出一組直觀數(shù)據(jù)來描繪了大數(shù)據(jù)的未來圖景:到2030年,中國一個普通的家庭會有40~50個智能終端,一個家庭產(chǎn)生的數(shù)據(jù)是20TB,相當于半個國家圖書館的藏書容量,即2600萬冊,40TB。

  “最近兩三年產(chǎn)生的數(shù)據(jù)可能比人類歷史上4萬年產(chǎn)生的數(shù)據(jù)還要多,實際就是由于互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)是大數(shù)據(jù)來源的最重要的地方。”唐雄燕說,如果在一輛普通家用轎車上安裝傳感器,大約需要幾十到近百只,而豪華轎車的傳感器數(shù)量可達200余只。在傳感器的監(jiān)測之下,汽車每小時能產(chǎn)生5~250GB的數(shù)據(jù),而谷歌的無人駕駛汽車每秒產(chǎn)生約1GB數(shù)據(jù)。而據(jù)IDC預測,到2020年,全球?qū)⒂?00億個物聯(lián)網(wǎng)終端,遠超人類的數(shù)量。

  大數(shù)據(jù)就是未來的新石油。唐雄燕說:“數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟資產(chǎn)類別,就像貨幣或黃金一樣,將形成數(shù)據(jù)材料、數(shù)據(jù)探礦、數(shù)據(jù)加工、數(shù)據(jù)服務等一系列新興產(chǎn)業(yè)。”正如《大數(shù)據(jù)時代》一書里所說的:知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。

  一個經(jīng)典的營銷案例是:美國一家零售連鎖超市Target創(chuàng)建的一套女性購買行為在懷孕期間產(chǎn)生變化的模型。一次,一男子闖入了他家附近的Target店,向店鋪經(jīng)理大吼:“你們竟然給我17歲的女兒發(fā)嬰兒尿片和童車優(yōu)惠券,她才17歲啊!”店鋪經(jīng)理向來者道歉,表明那肯定是個誤會。但一個月后,這個憤怒的父親打來電話道歉,他女兒的確懷孕了。

  “谷歌流感趨勢”也曾震撼世人。2009年2月,谷歌在《自然》雜志上發(fā)文,解釋了谷歌僅僅通過研究人們上網(wǎng)的搜索記錄,就能夠預測季節(jié)性流感的爆發(fā)和傳播。谷歌的預測與美國疾控中心的預測數(shù)據(jù)存在很高的相關性。但美國疾控中心通告新流感往往會有一兩周的延遲,而谷歌的預測數(shù)據(jù)更有效、更及時。為此,谷歌公司處理了5000萬條詞條與將近5億數(shù)學模型。

  “要在數(shù)據(jù)里面找出有價值的東西來,這是大數(shù)據(jù)技術的核心,迅速完成數(shù)據(jù)價值的提純?!碧菩垩嗾f。以監(jiān)控攝影為例,有的監(jiān)控累計一整天,其中真正有價值的可能只有“發(fā)現(xiàn)你干壞事的那一兩秒鐘”,在這中間怎么找出來,就是數(shù)據(jù)挖掘技術的關鍵。

  當然,在利用大數(shù)據(jù)價值的同時,也須警惕數(shù)據(jù)安全和隱私保護問題。工信部電信研究院互聯(lián)網(wǎng)中心主任何寶宏說,對于政策制定,原來對用戶的隱私保護更多側(cè)重于隱私本身,如個人姓名、電話號碼、銀行賬號等,而大數(shù)據(jù)時代除了保護這些信息,更需要一些新的思路和方法,如果只是保護用戶信息的采集環(huán)節(jié),在大數(shù)據(jù)時代就是不完整的,因為總有一些其他信息能夠分析出有些涉及用戶隱私的信息。

人物訪談