有時候,“小數(shù)據(jù)”就夠用了
在思考你的事業(yè)有什么人工智能(artificial intelligence, AI)的實際應(yīng)用時,很容易會以為,需要很大量的數(shù)據(jù)數(shù)據(jù)才能開始進行。人工智能是由數(shù)據(jù)驅(qū)動的,所以,你手上的數(shù)據(jù)愈多,你的人工智能就愈聰明。是嗎?不一定。
把人工智能應(yīng)用到數(shù)據(jù)上,以擷取情報,在這么做的時候,情境脈絡(luò)(context)很重要。換句話說,你可以打造一個你能想象得出最大的數(shù)據(jù)湖(data lake),但是,假如你不知道要尋求什么,也沒有所需要的相關(guān)數(shù)據(jù),你就不可能得到你想要的成果。
這是因為人工智能并不是魔法黑盒子,不會在吸收堆積如山的數(shù)據(jù)之后,就自動吐出結(jié)果。人工智能是指規(guī)模很大的一組技術(shù),每種技術(shù)各有明確、調(diào)整過的目的。企業(yè)若能專注在他們期望看到的影響和目標,并把重心放在收集能配合那些目標的適當數(shù)據(jù)集,就有最佳機會可藉由人工智能,得到真正能發(fā)揮影響力的結(jié)果。
讓我們看看美國郵局(United States Postal Service,簡稱USPS)的郵件分類自動化經(jīng)驗。USPS運用機器與光學字符識別技術(shù)(optical character recognition,OCR),目前已可在沒有真人協(xié)助下,判讀并處理98%的手寫地址郵件,以及99.5%的機器打印寄件數(shù)據(jù)郵件。USPS把這項技術(shù),結(jié)合了規(guī)模相當小且很有限的美國郵政編碼和城市,現(xiàn)在每小時就可處理超過36,000份郵件。USPS近年來面臨嚴酷的財務(wù)危機,因此這個自動化作業(yè)帶來極大的好處。
使用小量但精準度高的數(shù)據(jù),運用人工智能而得到很大的效益,這方面另一個有趣的例子是在航空業(yè)。2015年,波音公司(Boeing)與卡內(nèi)基美隆大學(Carnegie Mellon University)合作創(chuàng)設(shè)航空資料分析實驗室(Aerospace Data Analytics Lab),為航空公司開發(fā)人工智能技術(shù)。其中一個計劃的目標,是要把維修紀錄標準化,以便運用人工智能,大幅降低維修成本。
每架飛機都被要求保留非常詳細的維修紀錄。然而,飛機在全球各地飛來飛去,溝通這些紀錄開始出現(xiàn)問題。第一個大問題就是最基本的語言障礙。其他的問題還更嚴重。有些紀錄是數(shù)字形式,有些是手寫的。有些維修人員遵守規(guī)定逐行記錄,但有些人只在紙的邊緣潦草寫下文字和縮寫。一般維修人員幾乎不太可能馬上轉(zhuǎn)譯這些不同的記錄方式。但如果運用人工智能,外加少量的飛機維修專門術(shù)語數(shù)據(jù)集,就能實時掌握并隨時轉(zhuǎn)譯這些紀錄。善用人工智能,來改善飛機維修工作流程的速度與正確性,可為航空公司省下數(shù)十億美元。
憑借精準的數(shù)據(jù),人工智能就能帶來極大的影響,前述只不過是其中兩個實例而已。你要如何把這些想法應(yīng)用在你的公司里?以下是三個主要步驟:
建立與企業(yè)標的相符的目標。在執(zhí)行任何任務(wù)時,跨部門團隊共同訂立目標,確保目標與企業(yè)標的一致,是很關(guān)鍵的步驟,在人工智能方面也不例外。人工智能的本質(zhì)是規(guī)范性的,你把企業(yè)目標的范圍界定得愈狹窄,數(shù)據(jù)集的情境脈絡(luò)愈明確,你就愈可能得到有意義的結(jié)果。
有一個常被忽略的重點,就是企業(yè)應(yīng)為此建立一個跨部門團隊,而且讓整個組織都知道。這有助于決定,組織的哪些單位最需要人工智能的協(xié)助。如果你的團隊里有營運、銷售、財務(wù)部門的人和高階主管,就較可能找出真正的瓶頸和機會在哪里,你也較可能想出一些實際的解決方案,真的開始解決那些問題。
克服數(shù)據(jù)混亂狀態(tài)。每家公司都有一些對他們有獨特價值的數(shù)據(jù)集。然而,數(shù)據(jù)跟價值之間常常缺乏鏈接。你可能已握有數(shù)據(jù),但它不夠清楚、明確,也無法實際使用。若想要克服數(shù)據(jù)混亂狀態(tài)、取出小量但非常精準的數(shù)據(jù),有個好用的架構(gòu)可以采用,就是聚焦在顧客、合作伙伴和供貨商的生命周期。按照生命周期,就能呈現(xiàn)其中所有的步驟、系統(tǒng)和利害關(guān)系人。檢視這些生命周期,可幫你找出會遺失價值的漏洞。這些都是你的機會,可創(chuàng)造清楚而可衡量的影響。專注在這些漏洞周圍的關(guān)鍵數(shù)據(jù),就能獲得更精準且可使用的數(shù)據(jù)。
為你的任務(wù)選擇適當?shù)募夹g(shù)。機器學習(machine learning)跟人工智能都受到高度關(guān)注,它們這么受矚目,是有道理的。這兩者都是令人驚嘆的技術(shù),在任何企業(yè)對消費者(B2C)或企業(yè)對企業(yè)(B2B)的公司里,都可望為任何層級的高階主管創(chuàng)造價值。而且,使用它們的成本,甚至比五年前低了許多。不要雇用擁有上百位資料科學家的團隊,而應(yīng)去查看那個正在成長的生態(tài)系統(tǒng),選擇合適的工具,用來完成你想完成的任務(wù)。
在數(shù)字商業(yè)的世界里,企業(yè)總是在尋求大規(guī)模且快速的解決方案,也就是能讓他們?nèi)〉脙?yōu)勢的大突破。但事實是,若你務(wù)實一點,就可以開始累積許多較小的成功果實,而且進行得很快。長期來看,逐步積累的成果也能發(fā)揮極大效用。
這就是看待人工智能的正確態(tài)度。它不是一個魔法黑盒子,而是一組高度專業(yè)化的工具。它不是要用來追求過于高遠的目標,而是要幫你解決實質(zhì)問題。它的重點不在堆積如山的數(shù)據(jù),而是要使用小量、高度精確的數(shù)據(jù)。(陳佳穎譯)