物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

十面“霾“伏下的大數(shù)據(jù)預(yù)言

作者:RFID世界網(wǎng)收錄
來源:比特網(wǎng)
日期:2014-03-03 10:11:16
摘要:十面“霾”伏的敵人來自何方?大數(shù)據(jù)時代的到來或許可以尋根溯源,因為它能幫助人們更準確地了解、判斷生存環(huán)境中最重要的一面—空氣質(zhì)量。

  即將過去的2013年,“霧霾”幾乎成為許多都市人最擾心的一個熱詞。在北京,政府甚至不得不以工地停工、公車停駛、工廠停產(chǎn)等種種措施,盡力減少各種污染物的排放。

  十面“霾”伏的敵人來自何方?大數(shù)據(jù)時代的到來或許可以尋根溯源,因為它能幫助人們更準確地了解、判斷生存環(huán)境中最重要的一面—空氣質(zhì)量。

  未來大數(shù)據(jù)的價值核心在于預(yù)測。中科大信息科學(xué)技術(shù)學(xué)院院長李衛(wèi)平介紹,中科大先進技術(shù)研究院中正在進行著一項科研,通過收集和分析霧霾天氣產(chǎn)生的各種數(shù)據(jù),找到產(chǎn)生霧霾天氣最主要的原因?!斑@是一些看上去雜亂無章的數(shù)據(jù),我們建立一個大數(shù)據(jù)庫,從中找尋規(guī)律性的東西?!边@個科研項目與微軟合作,一旦找到其中規(guī)律,有望為政府治理霧霾天氣提供科學(xué)依據(jù)。

  2013年10月30日,在微軟亞洲研究院創(chuàng)新日上透露的一種新技術(shù),試圖讓人們了解所在地區(qū)空氣質(zhì)量的真實情況。在此基礎(chǔ)上,人們就能做出更明智且更有利于健康的決策,例如何時何地最適合戶外運動,或者何時應(yīng)戴上口罩或關(guān)上窗戶。

  “這些工作都是在大數(shù)據(jù)的基礎(chǔ)上才能夠進行,無論模式如何先進,沒有海量的數(shù)據(jù)進入,都不能達到很好的效果。”中國氣象局公共氣象服務(wù)中心高級工程師唐千紅說。

  在大數(shù)據(jù)時代,數(shù)據(jù)并非單純指人們在互聯(lián)網(wǎng)上發(fā)布的信息。全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關(guān)位置、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化。

  微軟根據(jù)現(xiàn)有監(jiān)測站所提供的空氣質(zhì)量數(shù)據(jù)以及城市里的其他多種數(shù)據(jù)來源(包括氣象情況、交通流量、人員流動趨向、路網(wǎng)結(jié)構(gòu)、人口集中點等),運用數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù),對大數(shù)據(jù)加以充分利用,并在監(jiān)測信息和對應(yīng)結(jié)果之間建立一個隱式映射,從而可以實時推斷出包含細顆粒物信息的城市空氣質(zhì)量數(shù)據(jù)。

  大數(shù)據(jù)時代下的氣象服務(wù)是什么樣子?唐千紅認為,在看得見的未來,融入了地理信息、社會經(jīng)濟數(shù)據(jù)的氣象服務(wù),能夠讓人們知道任意時間地點可能會發(fā)生什么,例如這陣風(fēng)是否會吹翻門口的廣告牌,前面一個高速路口是不是在下雨、會不會發(fā)生山洪。

  其實大數(shù)據(jù)就在腳下,盡管很多時候我們沒有意識到。

  全球的數(shù)據(jù)量正在以每18個月翻一倍的驚人速度增長,世界正在高速數(shù)字化。事實上,從城市交通到空氣質(zhì)量,從建筑設(shè)計到影視制作,大數(shù)據(jù)分析應(yīng)用已經(jīng)滲透到生活的方方面面。大數(shù)據(jù)到底怎樣改變了人們的生活軌跡?為此我們采訪了微軟研究院院長Peter Lee、微軟亞洲研究院院長洪小文、微軟全球資深副總裁周以真,揭開大數(shù)據(jù)的神秘面紗。

  數(shù)字商業(yè)時代:什么是大數(shù)據(jù)與機器學(xué)習(xí)?這一技術(shù)的商業(yè)應(yīng)用前景如何?

  洪小文:我常常舉一個例子,譬如說你媽媽明天要來北京看你,她在郵件里告訴你航班的號碼,明天下午5點鐘會到??墒悄隳翘煜挛缭陂_會,三四點的時候計算機就自動把郵件里面的航班號碼抽出來,自己去航空公司的網(wǎng)站一查,告訴你班機晚點,要7點才來。而且它還會根據(jù)交通狀況決定什么時候通知你出發(fā),以什么方式出發(fā)。它可以建議你坐出租車、坐地鐵要多少分鐘,甚至可以在你的社交網(wǎng)絡(luò)里找到附近的朋友開車來載你。

  這些自動化都可以做得到,但是今天還沒有這樣的系統(tǒng)和服務(wù),所以就只能隔幾分鐘看一看,很浪費時間,而且在很多場合不允許。這樣的東西其實是大數(shù)據(jù)與機器學(xué)習(xí)的表征,需要很多不同種類的數(shù)據(jù),有郵件的數(shù)據(jù)、地圖的數(shù)據(jù)、飛機的數(shù)據(jù)、交通的數(shù)據(jù)。大數(shù)據(jù)不僅是大,還要有多樣性和集成性。

  大數(shù)據(jù)還應(yīng)用在其他方面,比如報刊雜志上的文章到底有多少人看,大家有什么評價,轉(zhuǎn)發(fā)給誰。以前這些東西可能要做問卷才能得到,今天通過互聯(lián)網(wǎng)更有機會獲取。如果搜集的大數(shù)據(jù)都是零散的、繁雜的,你怎么去看?這就需要數(shù)據(jù)可視化,這一點對管理者非常重要。管理者在做一個決定之前,想看看這個東西在某一個區(qū)域大家的反應(yīng)會怎么樣,調(diào)出來一看就知道。

  大數(shù)據(jù)與機器學(xué)習(xí)真的是在每一個行業(yè)都有類似的應(yīng)用。

  數(shù)字商業(yè)時代:有人說,大數(shù)據(jù)與云計算是一個問題的兩面,云計算是支撐大數(shù)據(jù)時代的基礎(chǔ)。但當大數(shù)據(jù)和云計算真正落地,或是走向消費者的過程中遇到的障礙和挑戰(zhàn)有哪些?

  周以真:實際上,普通用戶已經(jīng)享受到很多大數(shù)據(jù)和云計算所帶來的利益和好處,只是我們并沒有清晰地意識到而已。比如用Windows Phone進行文字輸入,輸入前一個字,就會有下一個字或詞匯的提示聯(lián)想?;蛘哂檬謾C或PC收發(fā)郵件時,垃圾郵件的過濾功能。這些都是集成大數(shù)據(jù)和機器學(xué)習(xí)的技術(shù)才能得以實現(xiàn)。

  類似的應(yīng)用無處不在,甚至可能存在的地方太多了,我們都已經(jīng)忽略它了。

  另外一個典型的例子是關(guān)于云。比如我們把手機上的照片存儲在云端,即使手機丟失再換一個新的,你仍可以從云上重新把照片下載下來。

  數(shù)字商業(yè)時代:可穿戴設(shè)備就像“人體的物聯(lián)網(wǎng)”,通過傳感技術(shù)可以檢測出用戶的體溫、血壓、心率等數(shù)據(jù),這些個人的身體數(shù)據(jù)庫非常有價值。那么微軟未來在可穿戴設(shè)備這一塊最大的機會是在哪兒,是在硬件設(shè)備,是在云端,還是在軟件上?

  Peter Lee:這三個領(lǐng)域都有,但是我最感到振奮的就是云端。之所以說是云端,是因為云計算的環(huán)境當中有大量的數(shù)據(jù)、大量的計算能力,再加上機器學(xué)習(xí)的功能,可以展示出非常高級智能的產(chǎn)品。比如說從云端可以看到你過去一年運動量夠不夠,判斷你所吃的食物是否足夠健康,還可以把信息反饋給你的醫(yī)生。這些都需要有非常好的云架構(gòu)。