封面?zhèn)髅剑夯诎⒗镌萍夹g(shù)探索機(jī)器寫作
6月29日下午,在云棲大會(huì)·成都峰會(huì)大數(shù)據(jù)分論壇上,新生代資訊平臺(tái)封面新聞首席數(shù)據(jù)官林楠發(fā)表了題為“基于人工智能的垂直新聞?lì)惙?wù)”的演講,新聞服務(wù)+前沿技術(shù)的創(chuàng)造性結(jié)合吸引了與會(huì)者的好奇心。
封面新聞是一款成立于去年、主打80、90后“網(wǎng)絡(luò)原住民”群體的資訊平臺(tái)。成立至今,封面新聞利用數(shù)據(jù)挖掘、機(jī)器人學(xué)習(xí)寫作、興趣推薦算法等前沿技術(shù),在精準(zhǔn)描繪用戶畫像的基礎(chǔ)上,成為一個(gè)透著青春氣息、能實(shí)時(shí)刷新“封面”的“新聞盒子”。
“封面的大數(shù)據(jù)過程是從0到1的創(chuàng)造性過程”,會(huì)上,林楠在談及封面的大數(shù)據(jù)探索時(shí)如是說道,封面在大數(shù)據(jù)化的過程中一直致力于數(shù)據(jù)的打通,比如根據(jù)用戶的興趣偏好,描繪出用戶畫像,再進(jìn)行內(nèi)容推送,這個(gè)過程的最經(jīng)典產(chǎn)物就是封面的“知識(shí)圖譜分析”。
什么是知識(shí)圖譜分析?林楠為我們舉了一個(gè)生動(dòng)的例子:“我們以這幾天火爆的歐洲杯為例,我們可以利用大數(shù)據(jù)的研究型服務(wù)進(jìn)行知識(shí)圖譜分析,用戶不僅可以搜索到所查球隊(duì)球員信息,還可以獲得相應(yīng)的賽事分析,并預(yù)測(cè)比賽結(jié)果?!?/p>
除此以外,封面利用大數(shù)據(jù)的研究型服務(wù)還可進(jìn)行文本質(zhì)量挖掘,即一篇文章的好壞,以及所寫內(nèi)容是正面還是負(fù)面,適合什么樣的人群,全可以通過大數(shù)據(jù)進(jìn)行分析。
對(duì)于備受業(yè)內(nèi)關(guān)注的人工智能發(fā)展,封面也已經(jīng)取得了不少成績(jī)。據(jù)林楠介紹,封面在人工智能的探索主要采用合眾連橫加獨(dú)立探索的模式,已在機(jī)器寫作、人機(jī)交互、新聞數(shù)據(jù)可視化領(lǐng)域進(jìn)行深入探索。比如機(jī)器寫作,便是一種替代人工的重復(fù)性寫作方式,可以根據(jù)用戶的閱讀口味及喜好,對(duì)同一事件進(jìn)行不同風(fēng)格的描述,以貼近用戶需求。
“封面的使命是重新聯(lián)接世界,而這離不開技術(shù)的支撐。”林楠介紹說,“我們已在大數(shù)據(jù)、人工智能和虛擬現(xiàn)實(shí)多個(gè)方面進(jìn)行了嘗試和探索,比如今天剛聯(lián)合阿里云發(fā)布的新聞垂直類知識(shí)圖譜服務(wù),目前已包含有2000名明星、400名政治人物和800名體育人士的相關(guān)信息?!?/p>
據(jù)悉,就在29日上午,封面剛剛聯(lián)合阿里云率先發(fā)布兩項(xiàng)新聞?lì)惔怪狈?wù):“新聞垂直類知識(shí)圖譜服務(wù)”與“新聞敏感詞過濾及級(jí)別判定服務(wù)”。據(jù)林楠透露,合作最看重的是阿里云數(shù)加平臺(tái)豐厚的技術(shù)背景,希望共建大數(shù)據(jù)領(lǐng)域生態(tài)圈和推進(jìn)大數(shù)據(jù)相關(guān)項(xiàng)目。