物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

捷通華聲靈云開拓語音識別新天地

作者:prnews
日期:2012-08-30 16:42:47
摘要:捷通華聲靈云開拓語音識別新天地

比爾•蓋茨曾表示,“未來人機(jī)交互最重要的技術(shù)將是語音技術(shù)、觸摸技術(shù)和視覺技術(shù),而其中語音交互技術(shù)將帶來人機(jī)交互的根本性變革”。如今,語音技術(shù)的應(yīng)用已經(jīng)隨處可見,銀行、電信、政府、交通等社會服務(wù)領(lǐng)域均有它的身影,如:在汽車中,通過語音識別技術(shù)(ASR)可實現(xiàn)語音輸入目的地、語音查找興趣點,菜單查找等語音聲控功能。

目前,隨著Siri的出現(xiàn)引爆了整個智能人機(jī)交互領(lǐng)域,它讓人們對語音技術(shù)有了新的認(rèn)識,也充滿了期待。眾多企業(yè)紛紛涉足語音識別市場,一時間魚龍混雜,讓人眼花繚亂。然而用戶并不需要對技術(shù)有太多了解,只要覺得它好用就行。作為一家致力于智能人機(jī)交互(HCI)技術(shù)的高新技術(shù)企業(yè),捷通華聲公司可謂其中的佼佼者。

2011年,捷通華聲秉承“技術(shù)服務(wù)生活”的企業(yè)理念,推出全球第一個全方位智能人機(jī)交互感知云——靈云,通過“云+端”的方式,讓用戶感知機(jī)器,同時讓機(jī)器感知人,雙向感知交互的過程中,讓機(jī)器領(lǐng)會人的意思,更好的為人服務(wù);讓人收到機(jī)器反饋的結(jié)果,享受發(fā)號施令的愉悅。

基于靈云的語音識別技術(shù)更加完美,語音識別音庫更加豐富,不局限話題范圍,不限制發(fā)音人,用戶可以自由地和機(jī)器進(jìn)行“自由說”。高質(zhì)量的識別效果,出色的環(huán)境適應(yīng)能力,高達(dá)95%的識別率,讓捷通華聲語音識別技術(shù)脫穎而出。無論是PC、家電、汽車、手機(jī)等命令菜單的聲控,還是隨時隨地用聲音進(jìn)行查詢和搜索服務(wù),靈云語音識別技術(shù)均能一一滿足。

實際上,語音識別技術(shù)不僅是你說它做的簡單交互,而是更加人性化的感知問答。在此基礎(chǔ)上,捷通華聲精益求精,對靈云語音識別技術(shù)進(jìn)行了語義理解的優(yōu)化,使用WEB、IM、WAP、SMS、APP等多種表現(xiàn)形式,與用戶進(jìn)行實時交互溝通,給用戶提供全方位的服務(wù)。當(dāng)然,未來需要挑戰(zhàn)的項目還有很多,噪音處理、用戶情緒等機(jī)器還不能很好的判斷,HCI仍在路上,不過,也許不久的將來,這些都將在靈云上實現(xiàn),我們期待人與機(jī)器真正的“交流”。

隨著語音應(yīng)用在各行各業(yè)的逐步深入,語音識別技術(shù)的應(yīng)用范圍將迅速拓展。靈云語音識別技術(shù)將找到與更多行業(yè)的結(jié)合點,與廣大行業(yè)合作伙伴攜手,量身打造特定的應(yīng)用方案,去攻克各種技術(shù)難題,在推動更多行業(yè)的智能化發(fā)展進(jìn)程的同時,推動整個HCI產(chǎn)業(yè)的發(fā)展。

HCI技術(shù)正逐步改變著移動產(chǎn)品乃至移動互聯(lián)網(wǎng)的格局,更多的技術(shù)如手寫識別技術(shù)(HWR)、光學(xué)字符識別(OCR)、人工智能技術(shù)(AI)等綜合使用才能完美詮釋HCI的內(nèi)涵,靈云正是這樣一個涵蓋多項HCI技術(shù)的平臺。

通過語音合成技術(shù)(TTS)實現(xiàn)海量和動態(tài)信息的播報;通過ASR技術(shù)解決傳統(tǒng)電話按鍵操作所無法實現(xiàn)的復(fù)雜菜單操作,實現(xiàn)通過人機(jī)自助式語音交互;通過OCR技術(shù)解決大量票據(jù)錄入的繁瑣工作,實現(xiàn)智能化服務(wù);通過HWR技術(shù)解決異地簽批文件的問題,實現(xiàn)移動辦公……靈云,將改變?nèi)藗兊纳罘绞?,開啟人機(jī)交互世界新精彩。更多詳情,請關(guān)注靈云網(wǎng)站(hcicloud.com)。

 

人物訪談