春運(yùn)遷徙圖:原來這就是大數(shù)據(jù)
2014年新春,大數(shù)據(jù)借助春運(yùn)又火了一把。先是1月25日,中央電視臺(tái)《晚間新聞》與百度合作,首次啟用百度地圖定位可視化大數(shù)據(jù)播報(bào)了國內(nèi)春節(jié)人口遷徙情況,引發(fā)了巨大關(guān)注。第二天,國內(nèi)首個(gè)運(yùn)用大數(shù)據(jù)播報(bào)國內(nèi)春節(jié)人口遷徙實(shí)況的網(wǎng)站“百度遷徙”上線,網(wǎng)友可以實(shí)時(shí)了解全國春運(yùn)的最新動(dòng)態(tài),包括春運(yùn)最熱的線路、最熱門的遷出城市和遷入城市等。
大數(shù)據(jù)是一種服務(wù)
未來,搜索引擎公司會(huì)發(fā)展成為大數(shù)據(jù)服務(wù)企業(yè)。中國工程院院士鄔賀銓認(rèn)為:“搜索引擎公司可以利用搜索以及各種方式獲取大數(shù)據(jù),服務(wù)于網(wǎng)民、社會(huì)和企業(yè)自身;另一方面,還可以提供大數(shù)據(jù)解決方案,幫助其他機(jī)構(gòu)解決各種決策問題?!?/P>
要分析大數(shù)據(jù),先要獲得大數(shù)據(jù)。百度LBS(地理位置服務(wù))技術(shù)總監(jiān)顧維灝告訴記者,在百度LBS開放平臺(tái)上,聚集了超過40萬的開發(fā)者,為數(shù)十萬款應(yīng)用軟件提供定位服務(wù),已覆蓋數(shù)億部手機(jī)?!敖刂?013年12月,我國手機(jī)網(wǎng)民有5億。通過分析手機(jī)網(wǎng)民定位信息的大數(shù)據(jù),能夠映射出人群的遷徙軌跡。”顧維灝說。
以百度地圖為例,該應(yīng)用每天接受35億次位置請(qǐng)求。在定位服務(wù)方面,顧維灝和他的同事使用了很多專業(yè)的技術(shù)方法,如爬山法、概率分析法,最后發(fā)展到深度的機(jī)器學(xué)習(xí)方法,讓定位的精度不斷攀升。目前,他們的研究方向,是關(guān)于室內(nèi)的定位方法。顧維灝表示,通過云計(jì)算平臺(tái)數(shù)據(jù)處理,加上精準(zhǔn)定位,“百度遷徙”能夠?qū)崿F(xiàn)全面、準(zhǔn)確、即時(shí)反映人口遷徙狀況。
在大數(shù)據(jù)中發(fā)現(xiàn)新聞點(diǎn)
百度品牌溝通部總監(jiān)徐繼業(yè)向記者介紹,今年春運(yùn)成都往返北京的線路連續(xù)多日躋身全國十大熱門線路。經(jīng)分析發(fā)現(xiàn),出現(xiàn)這種情況是因?yàn)樵絹碓蕉嗟娜藦摹斑^年回家看父母”變成“把父母接到大城市過年”,這樣逆向遷徙成為春運(yùn)新特征。徐繼業(yè)認(rèn)為,如果沒有大數(shù)據(jù)提供的洞察,逆向遷徙這一新聞點(diǎn)很難被發(fā)掘出來。
借助大數(shù)據(jù)來做新聞,給人一種形象、精確、全面、科學(xué)、結(jié)構(gòu)化的印象。中國人民大學(xué)輿論研究所所長(zhǎng)、中國人民大學(xué)新聞學(xué)院副院長(zhǎng)喻國明認(rèn)為,上世紀(jì)60年代的精確新聞報(bào)道是經(jīng)過結(jié)構(gòu)化調(diào)查、民意測(cè)驗(yàn)等調(diào)查得到的,它的及時(shí)性和數(shù)據(jù)的全面性是不夠的,而大數(shù)據(jù)本身就有及時(shí)性和全面性等特點(diǎn),所以與傳統(tǒng)的精確新聞報(bào)道相比,上了一個(gè)新臺(tái)階。
在喻國明看來,春運(yùn)遷徙提供的大數(shù)據(jù),為各級(jí)政府部門以后配置運(yùn)力、科學(xué)化調(diào)配各種運(yùn)輸手段,進(jìn)行各種防控,都是很好的數(shù)據(jù)支撐;對(duì)于社會(huì)學(xué)者和社會(huì)研究者來說,它更多的是規(guī)律性的發(fā)現(xiàn)和把握;對(duì)普通老百姓來說,通過這些數(shù)據(jù)分析,知道哪個(gè)地方熱、哪個(gè)地方?jīng)?、哪個(gè)地方擁堵等,有利于更加合理安排自己的出行?!按髷?shù)據(jù)給人們提供了多種可能性,未來很多社會(huì)的決策、社會(huì)的行為,包括商業(yè)的營銷,都要建立在大數(shù)據(jù)分析的基礎(chǔ)之上,這就是大數(shù)據(jù)的價(jià)值所在?!彼硎尽?/P>
“傳統(tǒng)媒體相對(duì)于一些自媒體,它的優(yōu)勢(shì)在于可以做深入挖掘報(bào)道,傳統(tǒng)媒體現(xiàn)在面臨的情況是要做深入報(bào)道分析,需要重視和利用大數(shù)據(jù),與其具有的公信力所結(jié)合,使得它具有更多的說服力?!鼻迦A大學(xué)黨委宣傳部部長(zhǎng)、新聞中心主任向波濤認(rèn)為,觀眾也會(huì)更喜歡數(shù)據(jù)新聞,因?yàn)樾侣勚v究真實(shí),用數(shù)據(jù)說話的新聞是真實(shí)的。
大數(shù)據(jù)開發(fā)利用還剛剛起步
早在多年前,美國政府就利用搜索引擎公司的數(shù)據(jù),分析國內(nèi)地區(qū)性流感的發(fā)病趨勢(shì)。在國內(nèi),越來越多的人開始關(guān)注大數(shù)據(jù)的實(shí)用性?!按汗?jié)期間,央視結(jié)合百度大數(shù)據(jù)做的電視新聞中我比較關(guān)心的是熱門線路排行榜,這個(gè)跟我個(gè)人生活更緊密。”國家行政學(xué)院新聞中心主任胡敏表示。在他看來,大數(shù)據(jù)的應(yīng)用必將更加貼近老百姓的生活,比如全國兩會(huì)就要召開了,利用大數(shù)據(jù),媒體可以提前分析老百姓關(guān)心的問題,并作出針對(duì)性的報(bào)道。
其實(shí),在百度遷徙正式上線之前,顧維灝和他的團(tuán)隊(duì)已經(jīng)做了多次的嘗試?!拔覀?cè)?jīng)做過地鐵站的分析,以北京市海淀黃莊地鐵站為例,我們得出定位的密度,定位的密度代表人群的密度,從而可以看出,該地鐵站D出口基本上沒有什么人走?!彼硎荆瑢?duì)這樣的公共設(shè)施數(shù)據(jù),他們也會(huì)分享給相關(guān)政府部門,給他們做參考。
此外,研究團(tuán)隊(duì)還做過對(duì)中關(guān)村商圈的分析和用戶駕車導(dǎo)航軌跡的挖掘。通過顧客在商場(chǎng)里逛街的足跡,可以分析出哪些商鋪是熱門商鋪,或者某一類人更喜歡去這家商鋪,通過大數(shù)據(jù)的分析,可以優(yōu)化線上和線下的交易。
徐繼業(yè)認(rèn)為,大數(shù)據(jù)的開發(fā)和利用,在中國還是起步的階段?!叭ツ辏覀儼l(fā)布了熱點(diǎn)圖、查詢艾滋病高發(fā)的區(qū)域等大數(shù)據(jù),衛(wèi)生部、中科院的教授都跟我們有接觸,也在研究怎么利用我們的大數(shù)據(jù)幫助他們進(jìn)行科研工作,幫助政府科學(xué)決策。”