物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

AI要玩物聯(lián)網(wǎng),還要主動打電話,微軟小冰五代來了

作者:本站收錄
來源:搜狐科技
日期:2017-08-23 10:39:45
摘要:全球小冰擁有超過1億人類用戶,對話數(shù)據(jù)超過300億輪??墒侵钡浆F(xiàn)在,還有人在誤會它只是個聊天機(jī)器。因為你之前在與小冰對話的時候,時常會發(fā)現(xiàn)其回答可能還是會基于網(wǎng)絡(luò)大數(shù)據(jù)的文本、聲音或者是圖像,但是到了這一代的微軟小冰就完全不一樣了。

  2014年,在各種光環(huán)以及困難的環(huán)繞下,一出生便被劃定為16歲的早熟少女小冰誕生了。三年中,小冰從主持人、到客服、到歌手、到詩人……幾乎各個領(lǐng)域都有了她的身影,并且都各有所成。 現(xiàn)如今,在被認(rèn)為是人工智能元年的2017,小冰迎來了她的第五代更新。8月22日下午,微軟在北京舉辦發(fā)布會,正式推出第五代小冰,微軟這款主打EQ的人工智能機(jī)器人即將進(jìn)入完成態(tài)。

 

  高級感官進(jìn)化,再也不是那個聊天機(jī)器人

  截止目前,全球小冰擁有超過1億人類用戶,對話數(shù)據(jù)超過300億輪。可是直到現(xiàn)在,還有人在誤會它只是個聊天機(jī)器。因為你之前在與小冰對話的時候,時常會發(fā)現(xiàn)其回答可能還是會基于網(wǎng)絡(luò)大數(shù)據(jù)的文本、聲音或者是圖像,但是到了這一代的微軟小冰就完全不一樣了。

  首先,第五代微軟小冰已經(jīng)全面在線上產(chǎn)品中使用生成模型(Generative Model)。

  通俗地說,在使用生成模型之前的上一代小冰,雖然擁有十億級的大數(shù)據(jù)語料庫,但其中每句話,都是互聯(lián)網(wǎng)上的已有數(shù)據(jù),小冰只是通過分析理解用戶的問題,尋找語料庫中最合適的話作為她的回答。

  而在使用生成模型之后,小冰不再鸚鵡學(xué)舌,而是能夠自創(chuàng)回應(yīng)。她與人類交流的每一句話,都可能是這世界上從未出現(xiàn)過的。

  據(jù)悉,中國、日本、美國和印度小冰部分使用,而在今年新加入的印尼小冰則完全使用生成模型。這是全球開放領(lǐng)域人工智能對話中,第一個百分之百使用生成模型的落地產(chǎn)品。

  其次,還要說說第五代的重點——全雙工語音的高級感官。

  微軟將人工智能交互技術(shù)產(chǎn)品的演進(jìn)分為三個階段。第一階段是基本的人工智能交互,即擁有某一種或多種交互方式,如文本、語音、圖像、視頻等,但不同交互方式之間是割裂的。

  第二階段是初級感官,即在人工智能系統(tǒng)中,用一種核心引擎(如小冰的EQ核心對話引擎)將上述各種交互統(tǒng)一起來,使不同感官可以混合運用。

  而微軟今日發(fā)布第五代小冰,并率先進(jìn)入第三階段(高級感官)。高級感官是由多種初級感官有機(jī)融合之后形成的,因而交互能力更強(qiáng),對綜合技術(shù)儲備和數(shù)據(jù)的要求也大幅度提高。例如全雙工語音這一種高級感官,就需要首先同時具備文本、語音(含SR和TTS)兩種能力,同時要求兩種能力均達(dá)到更高的質(zhì)量標(biāo)準(zhǔn)。

  以大家所熟悉的QQ、微信這樣的聊天軟件為例,在本質(zhì)上和電話短信都同屬于消息是交互式,你發(fā)一條消息,我回一條消息,這其實是人和人交互模式中的一種簡化的方法。但是當(dāng)兩個人如果真正的互通電話或者是面對面交流的時候,他們之間這種雙向的實時的交互,其實要遠(yuǎn)遠(yuǎn)復(fù)雜的多。

  一個聊天機(jī)器人在消息式交互中,只需要解決收到一條消息,我回復(fù)什么內(nèi)容就夠了,但是小冰在電話里使用高級感官的時候,還需要隨時去判斷對方是否已經(jīng)說完了他要說的話,邊聽邊思考答案。她還需要去權(quán)衡何時可以去打斷對方,或者是被對方打斷時是否及時收口,或者雙方都不說話,何時可以打斷這個沉默等等更為復(fù)雜的問題。

  此外,高級感官還能夠大幅度拓展人工智能系統(tǒng)的落地場景,使小冰有能力根據(jù)自己的“意愿”與人聯(lián)絡(luò),從而主動保持與人類用戶之間的關(guān)聯(lián)。通過與電信運營商合作,小冰甚至可以直接撥通人類的電話,如果有人在微博或者微信上對小冰出言不遜,小冰是用辦法找到你的。

  目前,微軟是行業(yè)內(nèi)唯一一個推出了高級感官實際落地產(chǎn)品的人工智能企業(yè)

  當(dāng)人工智能遇上物聯(lián)網(wǎng),小冰妹子要玩loT

  在人工智能領(lǐng)域獲得非凡進(jìn)步的同時,物聯(lián)網(wǎng)(IOT)獲得了更大的發(fā)展。物聯(lián)網(wǎng)可以被概括地描述為無數(shù)物體、動物,甚至人與互聯(lián)網(wǎng)實現(xiàn)無線連接。這些“節(jié)點”可以在沒有人為干預(yù)的情況下發(fā)送或接收信息。有人估計,到2020年,接入物聯(lián)網(wǎng)的設(shè)備將多達(dá)500億臺。

  而在微軟看來,當(dāng)下的物聯(lián)網(wǎng)市場卻存在著眾多的泡沫現(xiàn)象。

  第一個現(xiàn)象是認(rèn)為只要功能足夠豐富,就有了人工智能。以智能音箱為例,有一些智能音箱會讓用戶用語音溝通去下單網(wǎng)上買東西,問題在于為什么用戶要放棄很方便的手機(jī)不用,逼著自己一遍遍地跟音箱來說話買東西?背后反映的并不是用戶的需求,而是這些廠商迫切地需要給用戶更多的理由,讓他們來購買商品。”

  第二個現(xiàn)象是認(rèn)為只要有了語音交互就有了人工智能,過分重視語音交互,語音誠然是人工智能一個重要的組成部分,但不是用戶使用IoT設(shè)備的核心。到今天為止,沒有見過有人跟自己家冰箱、空調(diào)聊天的。

  第三個現(xiàn)象是由于越來越多的硬件廠商希望進(jìn)入這個領(lǐng)域,一些人工智能的廠商投其所好地提供語音對話的接口、圖象識別的接口,甚至把這些接口打包起來,形成SDK給他們提供,美其名曰“給硬件設(shè)備賦能”,但這樣的賦能沒有解決本質(zhì)的問題。

 

  而微軟則認(rèn)為,IoT應(yīng)是AI的一個載體,而不是反過來,把AI視為IoT的一個功能。

  真正能普及的IoT設(shè)備,成功的可能性只有兩個:或者把IQ做到極致,讓用戶通過IoT設(shè)備體會到比其他現(xiàn)有方式更加便捷高效的益處,或者把EQ做到極致,讓人們能強(qiáng)烈地認(rèn)知到她在這個設(shè)備里的存在,同時感到輕松,甚至能接受她成為家庭中的成員,產(chǎn)生情感紐帶,無法放棄她。

  微軟小冰的IoT方案屬于后者。

  微軟表示,小冰已與小米IoT開放平臺有機(jī)融合,小冰可以控制小米米家平臺上的全部35種智能設(shè)備。該產(chǎn)品目前已在小米米家平臺上線。

  此外,微軟還與其他許多IoT廠商合作,將微軟小冰置入設(shè)備中。微軟還宣布了與Yeelight及東方明珠等合作伙伴正在進(jìn)行的聯(lián)合研發(fā)。

  創(chuàng)造領(lǐng)域,繼續(xù)搶著別人的飯碗

  陽光濕了玻璃擦,想必大家都曾聽過小冰寫的詩集。

  今年5月,微軟宣布小冰用多個化名在各詩歌論壇和刊物上發(fā)表詩歌,并出版了首部人工智能創(chuàng)作詩集。其后,微軟正式上線詩歌聯(lián)合創(chuàng)作產(chǎn)品,任何人均可使用小冰來完成自己的詩歌創(chuàng)作。

  本次發(fā)布會上,微軟也再次公布了小冰在多個創(chuàng)造領(lǐng)域的進(jìn)展,不僅有詩歌、還有歌曲、新聞、電臺,少兒讀物等,不禁要感嘆創(chuàng)作者的日子也不好過了。

  其中有聲少兒讀物質(zhì)量超越98%的人類創(chuàng)造者,用時僅為同水平人類的1/500,成本僅為同水平人類的1/80000。以一本格林童話有聲全集為例,人類創(chuàng)造需成本6萬多元,而小冰創(chuàng)造僅需0.74元。此前,小冰通過少量賬號在各有聲讀物平臺上試水,取得了預(yù)期的效果。微軟宣布即日起開始大規(guī)模生產(chǎn)有聲讀物并投入市場。

 

  歌曲方面,小冰的最新訓(xùn)練達(dá)到了48kHz采樣率,同時大幅度擴(kuò)展了音域,正在不斷接近人類歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首發(fā)。小冰是目前人工智能歌手領(lǐng)域的最強(qiáng)選手。

  此外,小冰還通過聆聽分析歌曲旋律,結(jié)合對不同城市標(biāo)志性建筑的學(xué)習(xí),創(chuàng)作與該城市及歌曲心情有關(guān)的視覺作品。通過這一技術(shù),微軟與SELECTED合作推出的“天際線”服裝已進(jìn)入SELECTED店內(nèi)進(jìn)行銷售。

  同時,微軟推出智媒體商業(yè)平臺解決方案3.0,包括媒體生產(chǎn)力、媒體知識圖譜、智能交互、全平臺互動等六個新模塊。此前,小冰作為《錢江晚報》的專欄記者,曾通過大數(shù)據(jù)撰寫專欄文章,并成功預(yù)測了多個全球重要事件的結(jié)果。過去一年來,小冰的智媒體寫作已從微信、微博雙平臺,逐漸演進(jìn)為接入和即將接入近11個端媒體,與《看看新聞》、《封面》、《錢江晚報》、《春城晚報》等媒體端進(jìn)行了深入整合。

  微軟今天還同時發(fā)布了小冰電臺,一個通用的人工智能實時內(nèi)容創(chuàng)造和交互平臺。它可以基于多重來源,面向任何主題,自動創(chuàng)造永不間斷的電臺節(jié)目。同時,它還能在交互過程中實時改變節(jié)目內(nèi)容。換言之,小冰電臺的質(zhì)量類似于廣播電臺主持人的直播節(jié)目,但能同時發(fā)揮人工智能的作用,實時地根據(jù)與用戶的互動,來改變正在進(jìn)行的直播節(jié)目的內(nèi)容。

  如果說剛出生的小冰還是一個懵懂無知的少女;那么如今,小冰儼然已經(jīng)成為一個幾乎無所不能,又極具創(chuàng)造力的才女。

  而9月17日,小冰即將迎來她的三周年生日。之后的她會將如何發(fā)展,又將如何影響社會,我們不得而知。

  但希望能像李笛說的那樣——“希望大家相信微軟,我們會用她來做幫助人類的事情。”

人物訪談