物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

物聯(lián)網(wǎng)關(guān)鍵技術(shù)之?dāng)?shù)據(jù)庫、物聯(lián)網(wǎng)搜索引擎

作者:本站收錄
來源:互聯(lián)生活圈
日期:2017-09-29 09:19:03
摘要:在物聯(lián)網(wǎng)時(shí)代,大量的設(shè)備互聯(lián)互通,海量的信息生成傳輸,這些都為傳統(tǒng)的Web搜索引擎提出了挑戰(zhàn)。

  物聯(lián)網(wǎng)的發(fā)展使信息的收集變得更加全面和迅速,于是就需要更有效的手段對信息進(jìn)行儲存和組織,并提供便捷的查詢。這就用到了已經(jīng)有著半個(gè)世紀(jì)歷史的數(shù)據(jù)庫技術(shù)。在上世紀(jì)60年代,誕生了以IBM的SABRE為代表的一些成功的早起數(shù)據(jù)庫系統(tǒng)。這些系統(tǒng)在今天看來雖說很落后,但是在當(dāng)時(shí)的時(shí)代背景下仍然是十分先進(jìn)且有實(shí)際作用的。由于這些數(shù)據(jù)庫如果要訪問想要的內(nèi)容,需要遍歷整個(gè)數(shù)據(jù)庫,這就是在其數(shù)據(jù)庫最大的缺陷。而這類早期數(shù)據(jù)庫被統(tǒng)稱為“導(dǎo)航式數(shù)據(jù)庫”。

  數(shù)據(jù)庫與物聯(lián)網(wǎng)

  無線傳感網(wǎng)是物聯(lián)網(wǎng)的一個(gè)重要組成部分,它的一個(gè)重要特點(diǎn)是以數(shù)據(jù)為中心。無線傳感網(wǎng)的數(shù)據(jù)具有以下的特點(diǎn):

  1、海量性

  假設(shè)有一個(gè)擁有100個(gè)傳感器的傳感網(wǎng),而每個(gè)傳感節(jié)點(diǎn)每分鐘只傳回1Kb的數(shù)據(jù),那么每天的數(shù)據(jù)量就達(dá)到1.4Gb。如果是一些大型的敏感的傳感網(wǎng),每天的數(shù)據(jù)量可達(dá)1TB以上。至于未來物物互聯(lián)的物聯(lián)網(wǎng)時(shí)代,產(chǎn)生的數(shù)據(jù)就是十分龐大的數(shù)量。因此物聯(lián)網(wǎng)數(shù)據(jù)具有海量性。

  2、多態(tài)性

  物聯(lián)網(wǎng)的應(yīng)用包羅萬象,產(chǎn)生的數(shù)據(jù)自然也是多種多樣。有溫度、濕度等環(huán)境數(shù)據(jù);有視頻、音頻等多媒體數(shù)據(jù);還有與用戶交換信息的結(jié)構(gòu)化數(shù)據(jù)等等。數(shù)據(jù)的多態(tài)性必然增加數(shù)據(jù)的復(fù)雜性,不同網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)格式可能不同,就算是相同類型的數(shù)據(jù)也會有單位和精度的差別,一個(gè)測量量在不同的時(shí)間也在變化。因此物聯(lián)網(wǎng)數(shù)據(jù)具有多態(tài)性。

  3、關(guān)聯(lián)性及語義性

  物聯(lián)網(wǎng)中的數(shù)據(jù)都不會是相互獨(dú)立的。描述同一個(gè)實(shí)體的數(shù)據(jù)在時(shí)間上具有關(guān)聯(lián)性;描述不同實(shí)體的數(shù)據(jù)在空間上會有關(guān)聯(lián)性;描述實(shí)體的不同維度之間也具有關(guān)聯(lián)性。而不同的關(guān)聯(lián)性組合會產(chǎn)生豐富的語義,可以通過數(shù)據(jù)在時(shí)間或空間或維度上的關(guān)聯(lián)性推斷出實(shí)體的變化。

  物聯(lián)網(wǎng)搜索引擎

  在物聯(lián)網(wǎng)時(shí)代,大量的設(shè)備互聯(lián)互通,海量的信息生成傳輸,這些都為傳統(tǒng)的Web搜索引擎提出了挑戰(zhàn)。首先網(wǎng)絡(luò)接入設(shè)備的多樣化造成了信息生成方式的多樣化。如何高效的組織和管理信息是物聯(lián)網(wǎng)搜索引擎的重中之重。另一方面,用戶的查詢模式也發(fā)生了轉(zhuǎn)變,對搜索引擎的智能有了更高的期待。

  從用戶的角度來看,人們不再滿足于坐在辦公室里通過計(jì)算機(jī)使用搜索引擎。無論在哪里都能隨時(shí)隨地進(jìn)行查詢。搜索引擎應(yīng)該利物聯(lián)網(wǎng)優(yōu)勢,集合多模態(tài)信息進(jìn)行查詢。例如用戶查詢一個(gè)地理信息是,搜索引擎不但要查詢結(jié)果和關(guān)鍵詞的匹配程度,還應(yīng)該能給出與關(guān)鍵詞相關(guān)的一些周邊信息。利用物聯(lián)網(wǎng)技術(shù)可以使搜索引擎的查詢結(jié)果更精確,更智能,更定制化,滿足不同用戶的需求,提供更好的用戶體驗(yàn)。

  索引技術(shù)

  Web爬蟲取回的頁面信息,需要放入索引數(shù)據(jù)庫里。索引建立的好壞對于搜索引擎有很大的影響,優(yōu)秀的索引能夠顯著的提高搜索引擎系統(tǒng)運(yùn)行的效率及檢索結(jié)果的品質(zhì)。文本分析技術(shù)是建立數(shù)據(jù)索引信息的支撐技術(shù),它包含:關(guān)鍵索引項(xiàng)提出、自動(dòng)摘要生成、自動(dòng)分類器、文本聚類等,文本分析的對象包括詞匯、HTTP文本標(biāo)記和URL等。

人物訪談