人臉解鎖都是小意思,看看錘子發(fā)布會(huì)還有哪些AI黑科技
又到了每一年聽(tīng)相聲的時(shí)候。
錘子科技在今天,也就是5月15日,于國(guó)家體育場(chǎng)(鳥(niǎo)巢)舉行了新品發(fā)布會(huì)。
自從老羅越來(lái)越少講情懷,越來(lái)越踏實(shí)之后,看錘子科技發(fā)布會(huì)樂(lè)趣似乎減少了;但也是從錘子發(fā)布會(huì)捧紅了訊飛輸入法之后,錘子發(fā)布會(huì)似乎有了一個(gè)新看點(diǎn)——錘子又會(huì)捧紅哪些AI技術(shù)公司?
今天的發(fā)布會(huì)上,錘子科技發(fā)布了新款旗艦手機(jī)堅(jiān)果R1和個(gè)人工作平臺(tái)Smartisan TNT Station(看起來(lái)像平板電腦的升級(jí)版),而這兩款產(chǎn)品中,AI技術(shù)得到了淋漓盡致的應(yīng)用。
人臉解鎖
錘子新款旗艦手機(jī)堅(jiān)果R1和Smartisan TNT Station中都加入了人臉解鎖的功能。目前,人臉解鎖已經(jīng)幾乎是智能手機(jī)AI功能的標(biāo)配了。
錘子科技的人臉解鎖功能由曠視Face++提供。作為國(guó)內(nèi)領(lǐng)先的圖像識(shí)別初創(chuàng)公司,曠視已經(jīng)為包括小米、vivo在內(nèi)的多家國(guó)內(nèi)手機(jī)品牌提供人臉識(shí)別解鎖方案,該方案基于RGB可見(jiàn)光的二維人臉圖像,可以完成活體檢測(cè)和身份識(shí)別,在大角度人臉,有遮擋、復(fù)雜光照等條件下,表現(xiàn)均比較優(yōu)秀。
AI降噪
在錘子新品手機(jī)堅(jiān)果R1和Smartisan TNT Station中,均搭載了由意騰科技(Intelligo Technology)提供的AI降噪功能。盡管華為、三星的新款旗艦機(jī)均有類(lèi)似功能,但錘子科技現(xiàn)場(chǎng)演示的結(jié)果依然不俗。
(發(fā)布會(huì)現(xiàn)場(chǎng)演示AI降噪功能)
對(duì)于開(kāi)發(fā)這一功能的意騰科技,外界可查信息并不多,我們目前僅了解到這是一家2016年時(shí)從聯(lián)發(fā)科獨(dú)立而出的新創(chuàng)公司,曾幫助聯(lián)發(fā)科設(shè)計(jì)了AI處理器和算法。
“點(diǎn)擊說(shuō)話”功能
在錘子科技發(fā)布會(huì)今天的現(xiàn)場(chǎng)中,最引人注目功能之一的是TNT Station的“點(diǎn)擊說(shuō)話”功能。只要用戶按住屏幕,就可以直接說(shuō)話進(jìn)行操作或輸入內(nèi)容。值得一提的是,這一部分操作指令或語(yǔ)音內(nèi)容將會(huì)直接與用戶點(diǎn)擊的位置進(jìn)行交互。
例如,當(dāng)你在幻燈片制作中,只要點(diǎn)擊幻燈片說(shuō)話,就能輸入內(nèi)容,而再點(diǎn)擊這句話說(shuō)出“加粗、斜體、白色”這些針對(duì)文本的編輯指令時(shí),就能夠改變這句話的文本格式;而在表格制作中,點(diǎn)擊某個(gè)表格說(shuō)話,就能輸入內(nèi)容,全選這些表格點(diǎn)擊說(shuō)出求和后,就能立刻得到這些表格內(nèi)的求和結(jié)果。
盡管現(xiàn)場(chǎng)演示環(huán)節(jié)中,出現(xiàn)了或多或少的一些插曲,但不可否認(rèn)的是這一語(yǔ)音交互的功能,是目前市面上出現(xiàn)的絕大多數(shù)智能手機(jī)或平板中的語(yǔ)音交互功能中,最具有效率的。通過(guò)點(diǎn)擊交互,它增加了系統(tǒng)對(duì)用戶指令識(shí)別的精準(zhǔn)程度。
科大訊飛和三角獸為這一功能提供了技術(shù)支持。
科大訊飛作為國(guó)內(nèi)語(yǔ)音智能領(lǐng)域的代表企業(yè),一直以來(lái)都是錘子科技的合作伙伴。在2016年的錘子秋季發(fā)布會(huì)上,就著重介紹了訊飛輸入法的語(yǔ)音輸入功能,讓這家人工智能公司被大眾所熟知。
而三角獸是國(guó)內(nèi)一家人工智能語(yǔ)義公司,基于大數(shù)據(jù)和深度學(xué)習(xí)算法,提供對(duì)話式交互解決方案和端對(duì)端交互系統(tǒng)。這家公司也在今天剛剛完成了B輪1.1億元融資,投資者包括富士康、漢富資本、中民投和光聚科創(chuàng)。
Crystal Ball
它可以在預(yù)測(cè)你的操作步驟,提前將你有可能做出的下面1到N步操作結(jié)果放在屏幕右邊,以供你選擇。在幻燈片中,它可以預(yù)測(cè)你可能的排版,或提前為你將圖片中的元素截取出來(lái);在表格中,它可以通過(guò)你已經(jīng)輸入的行列標(biāo)題,對(duì)后續(xù)行列內(nèi)容進(jìn)行預(yù)判。
(最右側(cè)的就是Crystal Ball模塊)
最讓人驚嘆的是,在使用錘子科技閃電膠囊功能記錄了PPT的靈感后,這一功能可以將這些文字靈感,提前通過(guò)網(wǎng)絡(luò)爬蟲(chóng)爬取相關(guān)圖片并存儲(chǔ),然后在你需要的時(shí)候幫你一鍵生成為恰當(dāng)?shù)幕脽羝浖?/p>
根據(jù)介紹,這一功能是由永中軟件與錘子科技共同開(kāi)發(fā),永中軟件是一家Office套件開(kāi)發(fā)公司。
在錘子科技發(fā)布會(huì)上,提到的大部分AI功能其實(shí)并沒(méi)有太尖端的技術(shù);但是有趣的是,它在目前可以實(shí)現(xiàn)AI技術(shù)前提下,將很多功能的體驗(yàn),從產(chǎn)品角度進(jìn)行了提升,擺脫了Siri曾經(jīng)面對(duì)的“有AI,沒(méi)體驗(yàn)”的尷尬境地。
在之前,老羅一直強(qiáng)調(diào)這次的新品發(fā)布會(huì)將帶來(lái)革命,是否能夠革命現(xiàn)在還說(shuō)不準(zhǔn),但是它給我們帶來(lái)了一個(gè)信號(hào),人工智能真的已經(jīng)進(jìn)入了一個(gè)產(chǎn)品時(shí)代。