元數(shù)據(jù)標(biāo)準(zhǔn)研究亟待加強(qiáng)
從IT時(shí)代到DT時(shí)代,大數(shù)據(jù)已成為一場(chǎng)革命,正在改變?nèi)藗兊纳?、工作和思維方式。大數(shù)據(jù)標(biāo)準(zhǔn)研制作為產(chǎn)業(yè)發(fā)展基礎(chǔ),目前仍處于起步階段。為實(shí)現(xiàn)數(shù)據(jù)間無歧義溝通,元數(shù)據(jù)標(biāo)準(zhǔn)研究與應(yīng)用顯得更為迫切。
在研國(guó)標(biāo)有10項(xiàng)
大數(shù)據(jù)領(lǐng)域的標(biāo)準(zhǔn)化工作是支撐大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和應(yīng)用的重要基礎(chǔ)。記者近日從全國(guó)信標(biāo)委大數(shù)據(jù)標(biāo)準(zhǔn)工作組第二次會(huì)議上獲悉,目前大數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)研制還處于起步階段。國(guó)際上有4大標(biāo)準(zhǔn)化組織針對(duì)大數(shù)據(jù)進(jìn)行專門研究,分別是ISO/IEC JTC1 SC32、ISO/IEC JTC1 WG9、ITU和NIST。
為了推動(dòng)和規(guī)范我國(guó)大數(shù)據(jù)產(chǎn)業(yè)的快速發(fā)展,建立大數(shù)據(jù)的產(chǎn)業(yè)鏈,與國(guó)際標(biāo)準(zhǔn)接軌,我國(guó)在2014年12月正式成立了全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)大數(shù)據(jù)標(biāo)準(zhǔn)工作組(以下簡(jiǎn)稱工作組)。工作組主要負(fù)責(zé)制定和完善我國(guó)大數(shù)據(jù)領(lǐng)域標(biāo)準(zhǔn)體系,組織開展大數(shù)據(jù)相關(guān)技術(shù)和標(biāo)準(zhǔn)的研究,申報(bào)國(guó)家、行業(yè)標(biāo)準(zhǔn),承擔(dān)國(guó)家、行業(yè)標(biāo)準(zhǔn)制修訂計(jì)劃任務(wù),宣傳、推廣標(biāo)準(zhǔn)實(shí)施,組織推動(dòng)國(guó)際標(biāo)準(zhǔn)化活動(dòng)。目前,工作組正在研制的國(guó)家標(biāo)準(zhǔn)有10項(xiàng),其中《信息技術(shù)大數(shù)據(jù)術(shù)語》和《信息技術(shù)大數(shù)據(jù)技術(shù)參考模型》兩項(xiàng)國(guó)家標(biāo)準(zhǔn)已經(jīng)完成相應(yīng)的草案,準(zhǔn)備進(jìn)入征求意見階段。
“目前已有138家單位申請(qǐng)成為工作組成員?!敝袊?guó)電子技術(shù)標(biāo)準(zhǔn)化研究院副院長(zhǎng)高林表示,“工作組下一步將繼續(xù)完善和維護(hù)工作組工作平臺(tái),加強(qiáng)元數(shù)據(jù)、數(shù)據(jù)分類、數(shù)據(jù)開放共享等方面的標(biāo)準(zhǔn)化研究,同時(shí)將積極開展測(cè)試評(píng)價(jià)、認(rèn)證等相關(guān)準(zhǔn)備工作?!?/p>
值得一提的是,在研究提出大數(shù)據(jù)技術(shù)框架的基礎(chǔ)上,結(jié)合數(shù)據(jù)全周期管理,數(shù)據(jù)自身標(biāo)準(zhǔn)化特點(diǎn),當(dāng)前各領(lǐng)域推動(dòng)大數(shù)據(jù)應(yīng)用的初步實(shí)踐,以及未來大數(shù)據(jù)發(fā)展的趨勢(shì),工作組提出了大數(shù)據(jù)標(biāo)準(zhǔn)體系框架。大數(shù)據(jù)標(biāo)準(zhǔn)體系由五個(gè)類別的標(biāo)準(zhǔn)組成,分別為:基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、產(chǎn)品和平臺(tái)標(biāo)準(zhǔn)、大數(shù)據(jù)安全標(biāo)準(zhǔn)及應(yīng)用和服務(wù)標(biāo)準(zhǔn)。
有專家認(rèn)為,針對(duì)大數(shù)據(jù),我國(guó)在數(shù)據(jù)管理、云計(jì)算、信息安全等方面,已經(jīng)發(fā)布和在研一些標(biāo)準(zhǔn),適用于大數(shù)據(jù)環(huán)境,提供了一定的基礎(chǔ),但是缺乏標(biāo)準(zhǔn)化整體規(guī)劃;數(shù)據(jù)分析、數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量管理等技術(shù)標(biāo)準(zhǔn),數(shù)據(jù)處理平臺(tái)、開放數(shù)據(jù)集、數(shù)據(jù)服務(wù)平臺(tái)類新型產(chǎn)品和服務(wù)形態(tài)的標(biāo)準(zhǔn)較為缺乏,亟須研制。
需加強(qiáng)元數(shù)據(jù)標(biāo)準(zhǔn)研究
近年來,大數(shù)據(jù)技術(shù)已經(jīng)開始步入高速發(fā)展階段,國(guó)內(nèi)外從事大數(shù)據(jù)方面研究和服務(wù)的公司越來越多,行業(yè)分得越來越細(xì)。不過,在行業(yè)應(yīng)用中,由于缺乏統(tǒng)一的數(shù)據(jù)描述,數(shù)據(jù)在解釋、同步、轉(zhuǎn)換過程中時(shí)常會(huì)存在歧義,數(shù)據(jù)擁有者不能及時(shí)地按業(yè)務(wù)要求提供正確的數(shù)據(jù)時(shí)有發(fā)生。因此,在大數(shù)據(jù)時(shí)代,借助于元數(shù)據(jù)了解數(shù)據(jù)元素含義和上下文的需求越來越強(qiáng)烈。
記者了解到,ISO/IEC JTC1 SC32下設(shè)4個(gè)工作組研究不同領(lǐng)域的標(biāo)準(zhǔn)研制,其中就包括元數(shù)據(jù)。其范圍涉及研制開發(fā)和維護(hù)有利于規(guī)范和管理的元數(shù)據(jù)、元模型和本體的標(biāo)準(zhǔn),此類標(biāo)準(zhǔn)有助于理解和共享數(shù)據(jù)、信息和過程,支持互操作性,電子商務(wù)以及基于模型和基于服務(wù)的開發(fā),包括:建議用于規(guī)定和管理元數(shù)據(jù)、元模型和本體的框架;規(guī)定和管理元數(shù)據(jù)、元模型和本體;規(guī)定和管理過程、服務(wù)和行為數(shù)據(jù);開發(fā)管理元數(shù)據(jù)、元模型和本體的機(jī)制,包括注冊(cè)和存儲(chǔ);開發(fā)交換元數(shù)據(jù)、元模型和本體的機(jī)制,包括基于互聯(lián)網(wǎng)、局域網(wǎng)等的語義。
對(duì)于我國(guó)元數(shù)據(jù)標(biāo)準(zhǔn)制定,有專家就指出,我國(guó)迫切需要加強(qiáng)元數(shù)據(jù)標(biāo)準(zhǔn)或元數(shù)據(jù)模型的研究與應(yīng)用,健全完善元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范及元數(shù)據(jù)模型。需要充分結(jié)合政府各部門現(xiàn)有數(shù)據(jù)資源建設(shè)情況,針對(duì)當(dāng)前政務(wù)大數(shù)據(jù)資源、科技大數(shù)據(jù)資源、電子商務(wù)大數(shù)據(jù)資源等重點(diǎn)領(lǐng)域,研制元數(shù)據(jù)標(biāo)準(zhǔn)或統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)模型框架,使得大數(shù)據(jù)向著標(biāo)準(zhǔn)化、條理化、脈絡(luò)化方向發(fā)展,實(shí)現(xiàn)無歧義溝通、理解和使用數(shù)據(jù)。解決當(dāng)前數(shù)據(jù)在交易、使用等過程中存在的問題,更好地對(duì)數(shù)據(jù)進(jìn)行管控,挖掘大數(shù)據(jù),發(fā)揮數(shù)據(jù)價(jià)值。
相關(guān)鏈接
大數(shù)據(jù)標(biāo)準(zhǔn)體系中五類標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)是指為整個(gè)標(biāo)準(zhǔn)體系提供包括總則、術(shù)語和參考模型、元數(shù)據(jù)等基礎(chǔ)性標(biāo)準(zhǔn)。
技術(shù)標(biāo)準(zhǔn)
主要針對(duì)大數(shù)據(jù)相關(guān)技術(shù)進(jìn)行規(guī)范。包括數(shù)據(jù)治理和數(shù)據(jù)質(zhì)量?jī)深悩?biāo)準(zhǔn)。其中,數(shù)據(jù)治理標(biāo)準(zhǔn)主要針對(duì)數(shù)據(jù)的收集、預(yù)處理、分析、可視化、訪問、能力成熟度評(píng)價(jià)模型等方面進(jìn)行規(guī)范。數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)主要針對(duì)數(shù)據(jù)質(zhì)量提出具體的管理要求和相應(yīng)的指標(biāo)要求,確保數(shù)據(jù)在產(chǎn)生、存儲(chǔ)、交換和使用等各個(gè)環(huán)節(jié)中的質(zhì)量,為大數(shù)據(jù)應(yīng)用打下良好的基礎(chǔ),包括質(zhì)量評(píng)價(jià)、數(shù)據(jù)溯源、質(zhì)量檢測(cè)等標(biāo)準(zhǔn)。
產(chǎn)品和平臺(tái)標(biāo)準(zhǔn)
主要針對(duì)大數(shù)據(jù)相關(guān)技術(shù)產(chǎn)品和應(yīng)用平臺(tái)進(jìn)行規(guī)范。包括關(guān)系型數(shù)據(jù)庫產(chǎn)品、非結(jié)構(gòu)化數(shù)據(jù)管理產(chǎn)品、智能工具、可視化工具、數(shù)據(jù)處理平臺(tái)和測(cè)試規(guī)范六類標(biāo)準(zhǔn)。其中關(guān)系型數(shù)據(jù)庫產(chǎn)品標(biāo)準(zhǔn)針對(duì)存儲(chǔ)和處理大數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫管理系統(tǒng),從訪問接口、技術(shù)要求、測(cè)試要求等方面進(jìn)行規(guī)范,為關(guān)系型數(shù)據(jù)庫管理系統(tǒng)進(jìn)行大數(shù)據(jù)的高端事務(wù)處理和海量數(shù)據(jù)分析提供支持;非結(jié)構(gòu)化數(shù)據(jù)管理產(chǎn)品標(biāo)準(zhǔn)針對(duì)存儲(chǔ)和處理大數(shù)據(jù)的非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng),從參考架構(gòu)、數(shù)據(jù)表示、訪問接口、技術(shù)要求、測(cè)試要求等方面進(jìn)行規(guī)范;智能工具用來幫助用戶對(duì)大數(shù)據(jù)進(jìn)行分析決策,包括ETL、OLAP、數(shù)據(jù)挖掘等工具,智能工具標(biāo)準(zhǔn)對(duì)智能工具的技術(shù)及功能進(jìn)行規(guī)范;可視化工具是對(duì)大數(shù)據(jù)處理應(yīng)用過程中所需用到的可視化展現(xiàn)工具的技術(shù)和功能要求進(jìn)行規(guī)范;大數(shù)據(jù)平臺(tái)標(biāo)準(zhǔn)是針對(duì)大數(shù)據(jù)存儲(chǔ)、處理、分析系統(tǒng)從技術(shù)架構(gòu)、建設(shè)方案、平臺(tái)接口等方面進(jìn)行規(guī)范;測(cè)試規(guī)范針對(duì)大數(shù)據(jù)的產(chǎn)品和平臺(tái)給出測(cè)試方法和要求。
大數(shù)據(jù)安全標(biāo)準(zhǔn)
數(shù)據(jù)安全作為數(shù)據(jù)標(biāo)準(zhǔn)的支撐體系,貫穿于數(shù)據(jù)整個(gè)生命周期的各個(gè)階段。拋開傳統(tǒng)的網(wǎng)絡(luò)安全和系統(tǒng)安全,大數(shù)據(jù)時(shí)代下的數(shù)據(jù)安全標(biāo)準(zhǔn)主要包括通用要求、隱私保護(hù)兩類標(biāo)準(zhǔn)。
應(yīng)用和服務(wù)標(biāo)準(zhǔn)
應(yīng)用和服務(wù)類標(biāo)準(zhǔn)主要是針對(duì)大數(shù)據(jù)所能提供的應(yīng)用和服務(wù)從技術(shù)、功能、開發(fā)、維護(hù)和管理等方面進(jìn)行規(guī)范。主要包括開放數(shù)據(jù)集、數(shù)據(jù)服務(wù)平臺(tái)和領(lǐng)域應(yīng)用數(shù)據(jù)三類標(biāo)準(zhǔn)。其中開放數(shù)據(jù)集標(biāo)準(zhǔn)主要對(duì)向第三方提供的開放數(shù)據(jù)包中的內(nèi)容、格式等進(jìn)行規(guī)范;數(shù)據(jù)服務(wù)平臺(tái)標(biāo)準(zhǔn)是針對(duì)大數(shù)據(jù)服務(wù)平臺(tái)所提出的功能性、維護(hù)性和管理性的標(biāo)準(zhǔn);領(lǐng)域應(yīng)用數(shù)據(jù)指的是各領(lǐng)域根據(jù)其領(lǐng)域特性產(chǎn)生的專用數(shù)據(jù)標(biāo)準(zhǔn),包括工業(yè)電子商務(wù)等領(lǐng)域。