富士通研究開發(fā)中心有限公司(FRDC)開發(fā)了一種高精度的聲紋認證技術(shù),該技術(shù)利用深度學(xué)習(xí)方法,可以從一段很短的語音片段中甄別出說話人的身份。該技術(shù)融合了兩個深度學(xué)習(xí)引擎,一個引擎用于提取與語音內(nèi)容相關(guān)的特征,而另一個引擎用于提取與說話人相關(guān)的特征,從而實現(xiàn)了“語音密碼”身份認證的功能,即:只有說話人本人正確說出預(yù)先設(shè)定的內(nèi)容時,其身份才能被接受。利用該技術(shù),在不超過3s的語音片段上,身份認證的錯誤率可達到2.2%左右。