物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊(cè)

捷通華聲靈云讓OCR技術(shù)觸手可及

作者:prnews
日期:2012-08-01 16:00:02
摘要:捷通華聲靈云讓OCR技術(shù)觸手可及

在通訊不斷快速發(fā)展的今天,一個(gè)終端所內(nèi)置應(yīng)用已經(jīng)無(wú)法滿足用戶多方位的需求,各式各樣的程序不僅占據(jù)了用戶大量的內(nèi)存,讓用戶在使用時(shí)查找起來(lái)也比較費(fèi)力。隨著聯(lián)網(wǎng)功能逐漸成為各種嵌入式設(shè)備的標(biāo)配,基于云端的各種云服務(wù)應(yīng)運(yùn)而生,方便快捷,省時(shí)省力的云+端方式深受用戶好評(píng)。

捷通華聲的靈云OCR系統(tǒng)正是“云+端”方式的一種典型應(yīng)用,它也被稱為“在線“OCR系統(tǒng)”。靈云下的OCR與傳統(tǒng)的OCR終端截然不同:傳統(tǒng)的OCR軟件只是通過(guò)單一的終端設(shè)備,無(wú)法聯(lián)網(wǎng),應(yīng)用、操作較單一;靈云OCR系統(tǒng)則通過(guò)云服務(wù)全方位拓展應(yīng)用領(lǐng)域。如:每年我國(guó)有眾多數(shù)字圖書館建設(shè)中的大量紙張數(shù)據(jù)信息,所有銀行、稅務(wù)局、保險(xiǎn)公司的大量票據(jù),公安邊防海關(guān)等部門的各類證照卡數(shù)據(jù)信息等等,都需要輸入到電腦里并做分析存儲(chǔ),幾乎可覆蓋到國(guó)家及各部委的所有重點(diǎn)行業(yè)領(lǐng)域。與此同時(shí),新興的商業(yè)及個(gè)人應(yīng)用與服務(wù)市場(chǎng)更是一個(gè)巨大的市場(chǎng)空白,捷通華聲公司在這一即將成熟的領(lǐng)域已搶占先機(jī)。

與漢王、文通等公司出品的以軟件+硬件的方式的OCR設(shè)備不同,靈云OCR系統(tǒng)為云+端的組合,比如將身邊的手機(jī)、平板電腦、PC機(jī)等設(shè)備作為終端,是將靈云OCR引擎放到服務(wù)器平臺(tái),通過(guò)前端應(yīng)用來(lái)進(jìn)行調(diào)用。與傳統(tǒng)的OCR軟件+終端設(shè)備的應(yīng)用模式有了質(zhì)的不同。靈云OCR系統(tǒng)還可安裝在用戶的手機(jī)、平板電腦或是PC中,可支持多種圖像格式,支持黑白、灰度、彩色圖像的處理,支持簡(jiǎn)體中文、繁體中文、英語(yǔ)、日語(yǔ)、韓語(yǔ)等多種語(yǔ)言??勺R(shí)別多種字體,能自動(dòng)分析出橫排文本、豎排文本、表格和圖像等區(qū)域,并對(duì)文本和表格區(qū)域的文字進(jìn)行識(shí)別,可以對(duì)由于掃描引起的圖像傾斜進(jìn)行自動(dòng)校正。當(dāng)手機(jī)照相圖像由于非統(tǒng)一照度和近距拍攝造成的灰度畸變和幾何畸變的時(shí)候,可進(jìn)行自動(dòng)校正。

很多人也許會(huì)有這樣的疑問(wèn),手機(jī)中如何操作OCR?把它當(dāng)做其中的終端靠譜嗎?目前幾乎所有的智能手機(jī)終端都帶有分辨率、清晰度越來(lái)越高的照相功能,而這些移動(dòng)終端用戶只需將身邊所關(guān)注的報(bào)刊、招聘、促銷等各類需要關(guān)注的文字信息進(jìn)行拍照,通過(guò)手指的輕輕劃動(dòng)操作,便可將拍下的各類信息上傳到捷通華聲靈云OCR平臺(tái),平臺(tái)通過(guò)對(duì)這些圖像進(jìn)行識(shí)別處理、并經(jīng)自動(dòng)糾錯(cuò)編輯后,即可將結(jié)果信息快速反饋給用戶,讓用戶全方位、全時(shí)段獲取有價(jià)值的信息。顯然利用手機(jī)作為OCR的終端將會(huì)更加友好。更可隨時(shí)完成這樣的操作。

指尖的點(diǎn)觸已經(jīng)可以順利完成原有只能在辦公設(shè)備齊全的辦公室或家中完成的工作,這是靈云平臺(tái)在移動(dòng)互聯(lián)網(wǎng)快速發(fā)展的今天獨(dú)具創(chuàng)意的產(chǎn)品集合:它還可提供語(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)、手寫識(shí)別(HWR)、光學(xué)字符識(shí)別(OCR)、即時(shí)翻譯(MT)等多種智能人機(jī)交互技術(shù)(HCI)應(yīng)用服務(wù)。靈云,簡(jiǎn)單的說(shuō)就是讓手機(jī)、電腦等數(shù)字設(shè)備在與人的交互過(guò)程中,實(shí)現(xiàn)能說(shuō)會(huì)聽、能寫能識(shí),感知并完成人們過(guò)去通過(guò)鍵盤、鼠標(biāo)發(fā)出的操作要求,從而使機(jī)器設(shè)備具有全方位、多樣的人機(jī)交互能力,與用戶之間的交互變得更輕松、簡(jiǎn)單、自然,更回歸人性,促進(jìn)人與機(jī)器之間的和諧互動(dòng)、觸手可及。

 

人物訪談