萬(wàn)萬(wàn)沒(méi)想到,這些不起眼的數(shù)據(jù)里也藏了商機(jī)
這些年來(lái),科技發(fā)展的過(guò)程也可以被看作為不斷挖掘新數(shù)據(jù)的過(guò)程?;ヂ?lián)網(wǎng)記錄下我們的每一次瀏覽和點(diǎn)擊,移動(dòng)互聯(lián)網(wǎng)記錄下我們身處何地,現(xiàn)在自拍軟件和FaceID還要記錄下我們的長(zhǎng)相。
毫無(wú)疑問(wèn),數(shù)據(jù)也是昂貴的,即使經(jīng)常被當(dāng)做黑產(chǎn)倒賣(mài),那些擁有獨(dú)特?cái)?shù)據(jù)來(lái)源的企業(yè)往往是在機(jī)器學(xué)習(xí)方面發(fā)展靠前的。
那么,是否存在另辟蹊徑的方法?除了有意識(shí)的點(diǎn)擊之外,我們能不能在其他不起眼的數(shù)據(jù)中挖掘出價(jià)值?
答案是當(dāng)然。
通話(huà)記錄
提起通話(huà)記錄,大多數(shù)人都會(huì)覺(jué)得相當(dāng)敏感。實(shí)際上不通過(guò)電信公司,一樣能獲得有價(jià)值的數(shù)據(jù)。
一篇發(fā)表在皇家學(xué)會(huì)中的論文提出了這樣的實(shí)踐:不涉及運(yùn)營(yíng)商,單純監(jiān)測(cè)工廠、寫(xiě)字樓密集區(qū)等區(qū)域的基站,通過(guò)基站信號(hào)來(lái)計(jì)算區(qū)域中電話(huà)接聽(tīng)和撥出的數(shù)量,從而來(lái)預(yù)判這一地區(qū)的失業(yè)概率。
顯然,如果某一地區(qū)接聽(tīng)和撥出電話(huà)的數(shù)據(jù)量開(kāi)始下降,那么這里的工廠距離裁員也就不遠(yuǎn)了。
研究人員表示,對(duì)于經(jīng)營(yíng)狀況、裁員計(jì)劃這種事,實(shí)地調(diào)查往往聽(tīng)不到什么真話(huà),或者是收到阻礙。而直接通過(guò)電話(huà)信號(hào)預(yù)測(cè),來(lái)的要直接的多。
對(duì)于這篇論文,也有人覺(jué)得,隨意獲取電話(huà)信號(hào)頻率來(lái)判斷區(qū)域經(jīng)濟(jì)情況,這說(shuō)明我們離《1984》真的不遠(yuǎn)了。
攝像頭
相信不少人都曾經(jīng)看過(guò)有關(guān)“711”傳奇式成功經(jīng)歷的文章,里面提到過(guò)一個(gè)細(xì)節(jié):在日本的711中,收銀員的機(jī)器上有按鈕分別表示“性別:男/女”、“年齡:14~18/20~25……”、“身份:主婦/白領(lǐng)/學(xué)生”。收銀員在收銀時(shí)會(huì)順便記錄下這些顧客信息,對(duì)照消費(fèi)記錄,就成為了一種非常樸素的數(shù)據(jù)收集方式。
現(xiàn)在在網(wǎng)購(gòu)時(shí),電商平臺(tái)可以輕易獲取我們的信息和購(gòu)物喜好,那么在實(shí)體店呢?利用新零售中線(xiàn)上線(xiàn)下賬號(hào)一體化或許可以解決。但有研究表明,無(wú)處不在的攝像頭可以完成這一工作。
目前實(shí)體商店的攝像頭只是起到監(jiān)控作用,但只要加入一張芯片,就能把它變成數(shù)據(jù)分析能手。攝像頭不光可以記錄下消費(fèi)者的年齡性別,還可以記錄下他們端詳每一件商品的時(shí)間和在店中的行走路線(xiàn)。對(duì)于實(shí)體商店來(lái)說(shuō),這些數(shù)據(jù)讓他們可以對(duì)店面中的商品、陳列、促銷(xiāo)信息等等做出改進(jìn)。
作業(yè)本
看到作業(yè)本三個(gè)字,你一定猜中了這一案例來(lái)自中國(guó)。不管是家長(zhǎng)還是老師,為小學(xué)生批改口算題都是一件痛苦的事情,動(dòng)輒幾十道題,按計(jì)算器都要按個(gè)十分鐘。
一家位于杭州的創(chuàng)業(yè)企業(yè)——大拿科技,正在利用圖像識(shí)別解決這一問(wèn)題。利用他們推出的App“愛(ài)作業(yè)”,只需對(duì)著作業(yè)本拍下一張照片,算法就會(huì)為你圈出錯(cuò)誤的地方。
其中的原理很簡(jiǎn)單,利用圖像識(shí)別技術(shù)識(shí)別出數(shù)字并執(zhí)行計(jì)算。識(shí)別印刷體數(shù)字不難,但想要準(zhǔn)確識(shí)別出小學(xué)生們的手寫(xiě)體恐怕就要費(fèi)點(diǎn)功夫。大拿科技的解決方式是……作業(yè)本。大拿科技就地取材,在杭州的幾所小學(xué)共收集了500~600本使用過(guò)的數(shù)學(xué)算術(shù)題作業(yè)本,并拍攝照片為機(jī)器學(xué)習(xí)算法提供訓(xùn)練資源。
在取得初步的成功后,他們還購(gòu)買(mǎi)了1000本全新的數(shù)學(xué)習(xí)題冊(cè)來(lái)收集不同題型、擴(kuò)充數(shù)據(jù)庫(kù)。
農(nóng)民伯伯的U盤(pán)
我們可能想象不到,現(xiàn)代農(nóng)業(yè)是一項(xiàng)數(shù)據(jù)化程度非常之高的產(chǎn)業(yè)。在美國(guó),農(nóng)民甚至是第一批民用GPS的使用者,遠(yuǎn)遠(yuǎn)超過(guò)了谷歌地圖。
而大多數(shù)農(nóng)民都會(huì)有收集數(shù)據(jù)的習(xí)慣,從灌溉量、種植量、收獲量,到哪種化肥更好用,這些記錄都散落在農(nóng)業(yè)從業(yè)者的電腦、U盤(pán)甚至記事本中。當(dāng)智慧農(nóng)業(yè)概念來(lái)臨,政府、農(nóng)業(yè)機(jī)構(gòu)都渴望獲得這些數(shù)據(jù)。
遺憾的是,目前大多數(shù)農(nóng)業(yè)從業(yè)者沒(méi)能從這些數(shù)據(jù)中獲取到收益,農(nóng)業(yè)數(shù)據(jù)往往在他們不知情的情況下被“拿走”了。有消息稱(chēng),全球最大的種子公司孟山都與美國(guó)最大的農(nóng)用機(jī)械公司約翰迪爾有著親密的合作關(guān)系,于是,農(nóng)民利用約翰迪爾農(nóng)機(jī)時(shí)產(chǎn)生的數(shù)據(jù)就全被約翰迪爾與孟山都共享了。
在中國(guó)的智慧農(nóng)業(yè)發(fā)展中,比較典型的是像佳格天地這樣,依靠衛(wèi)星遙感和氣象來(lái)分析農(nóng)業(yè)發(fā)展。而那些散落在農(nóng)民自己手里的非結(jié)構(gòu)化數(shù)據(jù),還沒(méi)能被很好的利用。看來(lái)在中國(guó),如何幫助農(nóng)業(yè)生產(chǎn)者保護(hù)和利用自己的數(shù)據(jù)會(huì)是一門(mén)好生意。