機(jī)器學(xué)習(xí)領(lǐng)域創(chuàng)業(yè),你還有哪些機(jī)會?
機(jī)器學(xué)習(xí)與人工智能在數(shù)據(jù)驅(qū)動型商業(yè)項目中發(fā)展迅猛,幾乎遍布每個角落。這里我選了幾個可能還未被大公司吞食的領(lǐng)域。
「鋤頭和鏟子」 戲碼
即在那次加利福尼亞州淘金熱中,鎬鍬承包商大賺了一筆(然而探礦者的貢獻(xiàn)被忽略了)。機(jī)器智能的鎬與鍬就是硬件、數(shù)據(jù)輸入端及(有爭議的)算法本身。
1.很明顯,機(jī)器智能算法的開發(fā)大多數(shù)都是開源的。當(dāng)然也有例外——去年,哈佛大學(xué)申請了一項有效替代 BackProp 算法的專利,即 Feedback Alignment Algorithm ——我想知道,他們打算如何使之商業(yè)化?幫助人們方便利用學(xué)習(xí)算法的高質(zhì)量 SaaS 產(chǎn)品,會找到有這方面需要的用戶,而且 MetaMind,正將深度學(xué)習(xí)技術(shù)帶入數(shù)據(jù)集,它們就是這樣一家公司。另一個我喜歡的項目叫做自動統(tǒng)計專家(The Automatic Statistician),它利用貝葉斯推理(Bayesian inference)找出數(shù)據(jù)擬合的最佳模型。Curious AI,是一家通用人工智能(General AI)公司,它們的第一個商業(yè)項目就是垃圾分類(中規(guī)中矩的盈利模式范本),據(jù)報道,公司旨在以工具包的形式出售人工智能軟件。
2.大公司可以接觸到龐大數(shù)據(jù)庫,還能獲取更多的數(shù)據(jù)。不過,到目前為止,大公司的關(guān)注點都集中在一些唾手可得的成果上,比如社交或商業(yè)數(shù)據(jù),因此,創(chuàng)業(yè)公司仍有機(jī)會在某些領(lǐng)域大展拳腳:難以獲得數(shù)據(jù)以及(或者)難以標(biāo)簽化數(shù)據(jù)的地方。Affectiva 的臉部表情回應(yīng)數(shù)據(jù)庫就是這個類型,還有 Pallas Ludens(端到端數(shù)據(jù)注釋服務(wù)),以及 opensensors.io(為傳感器數(shù)據(jù)公共資源附加價值)?;蚝歪t(yī)學(xué)圖像數(shù)據(jù)——受制于某些棘手的隱私問題——會讓個性化治療、護(hù)理以及更好的診斷成為可能。這方面,看 Genomics England 公司是個好例子。
3. 硬件前沿,GPUs 已經(jīng)讓一些巨大進(jìn)展成為可能。(一張NVIDIA GeForce GTX Titan就能讓我檢測蝙蝠的音頻信號)
蝙蝠信號的聲譜圖(下圖)及ConVnet預(yù)測(上圖)。
但是,這些只是圖像處理器。高效學(xué)習(xí)以及推理的 下一個拐點,會來自為機(jī)器學(xué)習(xí)特別設(shè)計處理器這一領(lǐng)域。Graphcore 稱之為智能處理器單元(Intelligent Processor Units)。同時,Nervana Systems, Teradeep(Yann LeCun 擔(dān)當(dāng)顧問)以及 Thinci 正在打造他們自己的定制硬件。將一些對教育有幫助的公司(Udacity, Coursera, Kaggle 等),或管理代碼庫和項目的公司(比如 Atlassian,上市準(zhǔn)備中)包括進(jìn)來,也是很有意義的。
情感開發(fā)
眾多初創(chuàng)公司在這個領(lǐng)域的表現(xiàn)都差強(qiáng)人意。正如 MIT 的情感計算小組(Affective Computing group)所言:
情感對于人類體驗來說至關(guān)重要,它影響認(rèn)知、觀念、以及學(xué)習(xí)、交流、甚至理性決策等日?;顒?。然而,技術(shù)人員卻大大忽略了情感的作用并為用戶創(chuàng)造出一種經(jīng)常讓人感覺挫敗的體驗...
用來訓(xùn)練一個微表情探測器的圖片
第一個任務(wù)是訓(xùn)練識別人類情感的模型。Emotient,RealEyes 及 Affectiva,都使用了臉部表情來推理情感,目前(看起來)很大程度上是一種營銷手段。Cogito Corp 及 Beyond Verbal 關(guān)注的是從語音中解讀情感線索,進(jìn)而展開市場調(diào)研,提供更好的用戶體驗。
接著是模仿情感行為,比如,為了和人類自然互動。那個「友善」的機(jī)器人 Jibo,就是只用一只「眼睛」表達(dá)情感的絕佳的例子。盡管未能找到其他例子,不過,一定會出現(xiàn)比較便宜的、具有自適性和回應(yīng)性的機(jī)器人玩具(比如Paro,治愈系海豹機(jī)器人,不過僅供娛樂)。這些機(jī)器人的優(yōu)勢在于,避免了對話性機(jī)器人玩具隱私方面的擔(dān)憂,比如像 Toy Talk 及 Mattel 的 Hello BarbieTM,至少在聲音的本地化而非云端處理后。
另一些應(yīng)用包括個性化保健與教育、沖突解決方案、協(xié)商訓(xùn)練,以及自適應(yīng)游戲。這些領(lǐng)域看起來很適合運用機(jī)器學(xué)習(xí),因為情感體驗是主觀和多變的。
行業(yè)滲透
機(jī)器智能是否會讓人類勞動力顯得多余,對此,我持觀望態(tài)度,不過我會指出,它當(dāng)然會有望幫助人類完成許多專業(yè)任務(wù)(而且在這一過程中,能為消費者在金錢方面提供更好的選擇和價值)。
這些技術(shù)能做什么?拿法律行業(yè)為例,Ravn Systems 實現(xiàn)了法律工作中(重復(fù)而單調(diào)的)文件審查自動化;Bitproof’s Peter 是一個人工智能法律助手,能請求簽名,生成合同以及證明文件;Premonition.ai 使用數(shù)據(jù)來搜索司法審判中的無意識偏見。
在招聘,保險,財務(wù)管理等領(lǐng)域,類似工具能讓專業(yè)人士將更多的時間花在工作上更加讓人滿意的方面,諸如鍛煉判斷力,進(jìn)行決策以及娛樂客戶。
醫(yī)療改革
藥物發(fā)現(xiàn)總是昂貴而有風(fēng)險的,需要相當(dāng)?shù)闹腔?。但是,加入你能用?shù)據(jù)減少風(fēng)險,找到更好的藥物研發(fā)目標(biāo),會怎樣?這是 Stratified Medical 的假設(shè),運用深度學(xué)習(xí)進(jìn)行藥物發(fā)現(xiàn)。
另外,Enlitic 和 Zebra Medical 尋求運用深度學(xué)習(xí)來開發(fā)精確的診斷/決策支持工具,而 Your.MD 已經(jīng)與英國國家衛(wèi)生服務(wù)組織合作,開發(fā)提供個性化健康援助的 app。
搜索優(yōu)化
「什么電影來著,有個我妹妹喜歡的德國演員...和外星人有關(guān)...很朋克的那部?」
搜索軟件需要處理不準(zhǔn)確、主觀和個人的信息,就像人類做的那樣。它需要幫助我們從一堆龐雜信息中,發(fā)現(xiàn)與之相關(guān)的內(nèi)容。這一過程包括學(xué)習(xí)文本和內(nèi)容特征。事實上,這需要一篇博文的篇幅來講清楚,不過,這里有些例子:
Clarify 通過API使得音頻和視頻變得可檢索。它就是掃描文本,找關(guān)鍵詞來確定相關(guān)性,一個很贊的省時應(yīng)用。
Lumi 根據(jù)瀏覽歷史來推測你的品味,提供相關(guān)流行內(nèi)容。
Youssarian Lives 是一個能夠進(jìn)行側(cè)面連接的搜索引擎。
EyeEm 已經(jīng)將機(jī)器學(xué)習(xí)用于圖片市場,這樣,無需便簽就能進(jìn)行搜索特征,比如「愉快的」和「多雨倫敦」,而 Cortexica 及 Sentient Technologies / Shoes.com 也以類似的方式重新定義產(chǎn)品搜索。
搜索相關(guān)性的一個必要方面,當(dāng)然是「值得信任(trustworthiness)」,這樣,社交媒體及新聞網(wǎng)站的內(nèi)容和主張的就能進(jìn)行驗證或根據(jù)真實性評分。有人在做這個嗎?
網(wǎng)絡(luò)安全
網(wǎng)絡(luò)安全領(lǐng)域的機(jī)器學(xué)習(xí)已經(jīng)吸引了大批風(fēng)險資本(例如,Lookout 的 2.82 億注資, Vectra Networks 獲得了 7800 萬,Darktrace 的 4000 萬,以及 Cybereason 的 8900 萬),但是,一系列壞消息(比如最近 TalkTalk 用戶數(shù)據(jù)被黑)表明市場仍有相當(dāng)大的缺口。
雖然就像任一片紅海一樣,但是,還是難以區(qū)分許多擁有表明相似產(chǎn)品的初創(chuàng)公司。在這方面我無疑有著更多的工作,也會密切留意網(wǎng)絡(luò)安全初創(chuàng)公司方面的加速器 Cyber London。
有太多應(yīng)用領(lǐng)域了,很難去僅僅關(guān)注一兩個。
對新數(shù)據(jù)集的研發(fā)和應(yīng)用的步伐正使得機(jī)器智能成為一個如此令人興奮的領(lǐng)域。尤其是,此刻的倫敦蘊(yùn)藏著真正意義上的動力,靠近世界級學(xué)術(shù)機(jī)構(gòu)的東道主(倫敦帝國學(xué)院,英國倫敦大學(xué),哈佛和劍橋),擁有一個已經(jīng)建立起來的創(chuàng)業(yè)生態(tài)系統(tǒng)(例如,Entrepreneur First加速器積極擁抱機(jī)器學(xué)習(xí)型人才),還有成為目標(biāo)客戶中心——金融,法律及政治——的地理位置。