AI和大數(shù)據(jù)讓科技公司的地位比從前更難撼動
在新的一周里,谷歌發(fā)布了一項(xiàng)新的AI調(diào)查研究,這項(xiàng)研究再次彰顯當(dāng)今AI事業(yè)蓬勃發(fā)展的強(qiáng)勢勁頭。消費(fèi)者生活和經(jīng)濟(jì)體發(fā)展越來越依賴科技進(jìn)步,而科技公司的生態(tài)體系則依靠小公司不斷顛覆大公司來實(shí)現(xiàn)不斷創(chuàng)新和非壟斷。但當(dāng)科技競爭涉及到由大數(shù)據(jù)庫驅(qū)動的機(jī)器學(xué)習(xí)時,大科技公司的地位將比從前更難以撼動。
這項(xiàng)新研究由谷歌同卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)投入大量資金一起合作完成,于周一公布了預(yù)印版。谷歌同CMU 大學(xué)花了整整兩個月時間將50個圖像識別器連接到一起,并采集了3億標(biāo)識過的圖片。此項(xiàng)目的目的是檢驗(yàn)在不調(diào)整算法而是進(jìn)行大量數(shù)據(jù)輸入的情況下,機(jī)器能否更準(zhǔn)確的識別圖像。
答案是肯定的。 Google和CMU的研究人員對新的數(shù)據(jù)庫進(jìn)行了一個標(biāo)準(zhǔn)的圖像處理系統(tǒng)培訓(xùn)之后,他們表示機(jī)器在圖像識別相關(guān)的標(biāo)準(zhǔn)測試(如發(fā)現(xiàn)圖中的物體)中獲得了新的進(jìn)展。顯然輸入數(shù)據(jù)的量和圖像識別的準(zhǔn)確度之間有直接關(guān)系。這項(xiàng)發(fā)現(xiàn)明確了之前關(guān)于AI界能否在維持下現(xiàn)有算法、只增加數(shù)據(jù)輸入的條件下獲得更多產(chǎn)出的問題。
由此發(fā)現(xiàn)可看出像谷歌、臉書和微軟這種數(shù)據(jù)巨頭公司,通過大數(shù)據(jù)的支持,會比之前預(yù)想的收益更大。谷歌3億圖像的數(shù)據(jù)庫并不能產(chǎn)出巨大利潤。圖像數(shù)據(jù)庫從1百萬增長到3億多帶來的識別精度增長只有3%。但此次研究論文的作者表示他們認(rèn)為可以通過將軟件調(diào)整到更適合超大數(shù)據(jù)庫的方式來擴(kuò)大優(yōu)勢。即使最終這一預(yù)期沒能達(dá)成,但在科技界,一點(diǎn)小優(yōu)勢也十分重要。舉個例子,在無人駕駛汽車中,視覺識別精準(zhǔn)就特別關(guān)鍵。對于某些產(chǎn)品而言,哪怕只有絲毫的性能優(yōu)化,也能快速的帶來幾十億的收入增長。
囤積數(shù)據(jù)早已是以AI為主要業(yè)務(wù)公司的防御策略。像谷歌、微軟這樣的公司都已開放軟件甚至是硬件的源碼,但對能使這些工具有用的支撐數(shù)據(jù)卻并沒有這么開放。但也不是說數(shù)據(jù)不開放:去年,谷歌公開了從700多萬YouTube 視頻中采集的數(shù)據(jù);Salesforce 也開放了從維基百科中收集的數(shù)據(jù)庫,方便算法可在各語言中使用。針對這些開放數(shù)據(jù),來自AI開發(fā)實(shí)驗(yàn)室Manifold的合伙人盧克·德·奧利維拉(Luke de Oliveira)和勞倫斯伯克利國家實(shí)驗(yàn)室(Lawrence Berkeley National Lab)的訪問研究員表示(想必大家也想到了),這種公開的數(shù)據(jù)庫通常對潛在競爭對手而言價值并不高。“這種數(shù)據(jù)庫絕不是那種對產(chǎn)品后續(xù)市場定位有關(guān)鍵影響的數(shù)據(jù)庫。”
谷歌和CMU的研究人員表示,他們希望他們最新的研究、所謂的“大數(shù)據(jù)”的價值,能催化創(chuàng)建處更大的、Google規(guī)模的開放圖像數(shù)據(jù)庫。他們寫道:“我們真誠地希望這能激發(fā)視覺界的人員不要低估數(shù)據(jù),并開發(fā)集體努力來構(gòu)建更大的數(shù)據(jù)集”。負(fù)責(zé)研究的CMU的Abhinav Gupta表示,想實(shí)現(xiàn)這一點(diǎn),一個可行的選擇是與通用視覺數(shù)據(jù)基金會(Common Visual Data Foundation)合作,這是由Facebook和微軟發(fā)起的非營利組織,該公司已經(jīng)發(fā)布了開放圖像數(shù)據(jù)集。
同時,數(shù)據(jù)匱乏的公司想要在持有豐富數(shù)據(jù)的科技巨頭公司間生存下去,則更需要創(chuàng)新意識。 DataRobot公司首席執(zhí)行官Jeremy Achin表示,機(jī)器學(xué)習(xí)對更多公司和行業(yè)而言越發(fā)重要,小型公司(認(rèn)真地)將數(shù)據(jù)集中在一起,使其風(fēng)險預(yù)測與較大競爭對手競爭的保險模式可能會受到更廣泛的關(guān)注。
使機(jī)器學(xué)習(xí)更少的依靠數(shù)據(jù)的進(jìn)步可以提高AI的數(shù)據(jù)經(jīng)濟(jì)性; Uber去年收購了一家從事該項(xiàng)目的公司。但是現(xiàn)在也可以嘗試并回避AI傳統(tǒng)運(yùn)營商通常的數(shù)據(jù)優(yōu)勢。Fast.ai,一家致力于使機(jī)器學(xué)習(xí)更大眾化的公司,其聯(lián)合創(chuàng)始人雷切爾·托馬斯(Rachel Thomas)表示,初創(chuàng)公司可以在互聯(lián)網(wǎng)巨頭很少涉及的產(chǎn)業(yè)(如農(nóng)業(yè))展開機(jī)器學(xué)習(xí)。“我不確定這些大公司是不是在所有行業(yè)都那么有優(yōu)勢。在很多領(lǐng)域,并沒有去收集相關(guān)數(shù)據(jù)”。即使人工智能巨頭公司也有未涉及的盲點(diǎn)區(qū)域。