顧小鳳教授:專家眼中的國內(nèi)手寫識別成長軌跡
聯(lián)合電訊社/北京--現(xiàn)年76歲的顧小鳳是國內(nèi)最早從事手寫識別技術(shù)研究,同時也是該領(lǐng)域最為高端的專家之一。離休之后他除了擔(dān)任北京捷通華聲語音技術(shù)有限公司下稱“捷通華聲”手寫識別技術(shù)方面的顧問外,更多時間花在為學(xué)術(shù)刊物審稿上,并且還抽空喂養(yǎng)著幾只流浪貓。
不僅見證了國內(nèi)手寫識別技術(shù)從無到有、上世紀(jì)90年代“萬碼奔騰、千筆如林”的輸入時代、手寫技術(shù)的后PC個人臺式機時代,也為推動整個進程做出了卓越貢獻。
“手寫識別技術(shù)最初在國內(nèi)并沒有引起多大重視、專門研究的人也不多,就連我當(dāng)時也并沒有想到能夠發(fā)展到今天這個地步。”顧小鳳坦言。
從OCR到聯(lián)機手寫:國內(nèi)手寫識別先驅(qū)之一
顧小鳳,北京大學(xué)教授,1934年生于上海,1964年北京大學(xué)畢業(yè)后留校任教直至離休。
在手寫識別領(lǐng)域,他憑借《計算機——激光漢字編輯排版系統(tǒng)》項目躋身國家科技進步一等獎獲得者,同時亦是中國專利CN87104719.5“用計算機及圖形輸入板制作高分辨率漢字字形的方法”的第一發(fā)明人。
手寫識別技術(shù)上世紀(jì)80年代初在中國正式起步,然而最初這一技術(shù)并不被看好,因為手寫板作為PC機的外設(shè)可有可無,從事該領(lǐng)域的機構(gòu)寥寥無幾。
“北京大學(xué)涉足手寫輸入的契機主要來自日本松下電器公司的一次邀請。當(dāng)時他們有一款文字處理機產(chǎn)品但只針對日本用戶,主動與我們聯(lián)系希望能夠加以漢字識別方面的改造。北大計算機研究所出了3個人去日本待了3個月,與松下的技術(shù)員一起工作。我們也由此對手寫識別技術(shù)產(chǎn)生了興趣。”顧小鳳回憶道。
手寫識別技術(shù)主要分為手寫OCR和聯(lián)機手寫兩大類,后者在國內(nèi)的發(fā)展歷史更短。
1985年,北京大學(xué)介入手寫OCR的研究,課題組由顧小鳳主持。1990年7月成果通過機電部主持的鑒定,居國內(nèi)領(lǐng)先地位。1992年5月完成了該系統(tǒng)的商品化工作。
1990年開始,顧小鳳和他的課題組又馬不停蹄地開始了聯(lián)機手寫字符識別技術(shù)的研究。在他的記憶中,除后來創(chuàng)建漢王科技的劉迎建1980年前后已有相關(guān)的產(chǎn)品外,大陸僅有北京大學(xué)、巨人集團和哈爾濱工業(yè)大學(xué)3家機構(gòu)進行聯(lián)機手寫技術(shù)的開發(fā)。
到他1998年離休時,課題組已經(jīng)拿出了數(shù)個版本的成果,并形成產(chǎn)品由北大方正經(jīng)銷,但遺憾的是北大方正對該產(chǎn)品并不看好。
顧小鳳對此解釋稱:“國內(nèi)手寫識別技術(shù)起步相對冷清的局面,我也經(jīng)常思考和與同行交流,結(jié)論是可能鍵盤輸入發(fā)展太快,上世紀(jì)80、90年代時鍵盤輸入法層出不窮。”
而后PC時代的到來,打破了這一冷清局面。筆記本電腦、掌上電腦、手機的出現(xiàn),大大拓寬了聯(lián)機手寫的應(yīng)用范圍,最終造就了今天的輝煌。
與最新電子產(chǎn)品掛鉤--聯(lián)機手寫應(yīng)用前景廣闊
目前聯(lián)機手寫技術(shù)在眾多電子產(chǎn)品,包括最新潮流的Android手機和iPad平板電腦上都已經(jīng)成為標(biāo)配功能。顧小鳳明確指出,之所以聯(lián)機手寫能夠在“萬碼奔騰”的輸入時代開創(chuàng)出自己的格局,與其應(yīng)用特點有關(guān)。
“與其他輸入法相比,聯(lián)機手寫有兩大截然不同點--第一它能夠配合小型的移動通信設(shè)備,鍵盤輸入在這些設(shè)備上實現(xiàn)起來很困難。”他娓娓道來。
“第二有專家呼吁電腦用得熟后,很多人寫字寫不好了,而且錯別字一大堆,這跟我們平時手寫訓(xùn)練匱乏有關(guān),而聯(lián)機手寫恰恰能夠?qū)F(xiàn)今的計算機技術(shù)與傳統(tǒng)的手寫方法結(jié)合在一起,保證了寫字的習(xí)慣。這兩個特點是其他任何輸入法都無法取代的。”
除此之外,聯(lián)機手寫不僅僅是一種輸入法,更有其他領(lǐng)域的用途。
“一個是可以用于漢語教學(xué),作為教學(xué)工具。還有一個就是鑒別身份的工具,比如聯(lián)機手寫的筆跡驗證可用于銀行支票。”
談及未來聯(lián)機手寫的進一步發(fā)展方向,顧小鳳指出,在應(yīng)用領(lǐng)域?qū)U展到新的電子產(chǎn)品上,就如今天擴展到掌上電腦和手機上一樣:“推動該技術(shù)走向商用最重要的因素還是電子產(chǎn)品的發(fā)展,有新的產(chǎn)品出來后一定要抓緊時間看能不能用上,能夠用上就一定要迅速進入。”而在文字方面,也將從目前國內(nèi)主流的漢字?jǐn)U展到少數(shù)名族文字。
攜手捷通:“張連毅對知識和人才的尊重感動了我”
2001年,顧小鳳被張連毅的捷通華文請出山,以其十多年的手寫識別技術(shù)研究應(yīng)用經(jīng)驗,指導(dǎo)研發(fā)團隊開發(fā)出國內(nèi)外領(lǐng)先的漢字手寫技術(shù)與產(chǎn)品。
張連毅在業(yè)界也堪稱奇人,出身清華大學(xué)的他做過學(xué)生會主席也擔(dān)任過企業(yè)高管,出過國也在MBA學(xué)業(yè)未完就回國創(chuàng)業(yè)。然而當(dāng)回顧與捷通華文結(jié)緣時,顧小鳳笑稱對手寫識別技術(shù)的執(zhí)著讓大家結(jié)緣。
然而當(dāng)時聯(lián)機手寫市場已呈井噴之勢,請顧小鳳出山的并非捷通華文一家,張連毅隔三岔五就給顧小鳳打電話、登門拜訪,最終戰(zhàn)勝了其他對手。今時今日,張連毅仍對此頗為得意,而在顧小鳳看來,張連毅對知識和人才那種骨子里的尊重是他決定出山的根本原因。
此后,顧小鳳的得意弟子李健也在導(dǎo)師的極力促成下,最終從英特爾中國研究院來到捷通華文擔(dān)任技術(shù)負(fù)責(zé)人捷通華聲與捷通華文業(yè)務(wù)合并后,任捷通華聲總工程師。在兩位技術(shù)專家?guī)ьI(lǐng)下,捷通結(jié)束了購買其他廠商技術(shù)做產(chǎn)品的時代,走上自主創(chuàng)新之路。
“作為一家中小型的民營企業(yè),從捷通華文到今天的捷通華聲,在國內(nèi)并沒有得到強有力的支持,本身處于不利的地位,在這種情況下這家企業(yè)斗志頑強、不屈不撓,不僅堅持下來而且有了很大成就。除了張總本身對專家的重視外,這一點讓我特別有感觸。”顧小鳳總結(jié)稱。
在他看來,目前捷通華聲的核心競爭力在于除了手寫識別技術(shù)外,還擁有語音合成、語音識別技術(shù)等多項智能人機交互HCI技術(shù)--這些技術(shù)相結(jié)合,在解決一些難點問題的同時,也大大豐富了產(chǎn)品線。比如Android屏幕變大而且是全觸屏,電子書閱讀器和平板電腦屏幕更大,對手寫識別技術(shù)要求行識別、多字識別,這種情況下從充分滿足用戶體驗角度來看,應(yīng)用到后臺語言的模型、語義分析包括語法糾錯,單一做手寫識別的企業(yè)是無法做到的。
顧小鳳數(shù)次謙遜地表示,在手寫技術(shù)識別方面自己其實出力不多,做的是與當(dāng)時其他人一樣的事情:“如果非要說貢獻,應(yīng)該是和其他人一起‘你追我趕’地推動了在這一技術(shù)領(lǐng)域的競爭,從而促進了技術(shù)的進步。如果說市場上僅有一家企業(yè)只用一種技術(shù),那么技術(shù)本身也不會發(fā)展到今天的水平。”