華為助力某大學超算云計算中心解決方案
一、 客戶背景
某大學云計算產(chǎn)業(yè)園依托學??蒲辛α?,整合校內(nèi)學科資源,建設(shè)技術(shù)開發(fā)平臺,引導科研資源向大數(shù)據(jù)應(yīng)用方向傾斜,云計算產(chǎn)業(yè)園運營的業(yè)務(wù)范圍覆蓋云計算、超級計算、空間信息、移動互聯(lián)網(wǎng)等領(lǐng)域,將為政府部門及企業(yè)用戶提供廣泛的數(shù)據(jù)與基礎(chǔ)設(shè)施服務(wù)。
其中,云計算中心依托高速互聯(lián)網(wǎng)接入和大規(guī)模網(wǎng)絡(luò)互聯(lián),采用最新的云計算技術(shù),依托超級計算中心的強大基礎(chǔ)設(shè)施,為云應(yīng)用的發(fā)布、托管和云服務(wù)支撐提供前后端一體化的支持,通過對計算機硬件資源的虛擬化和靈活調(diào)度,面向企事業(yè)單位提供彈性云計算服務(wù),根據(jù)不同用戶的個性化需求定制解決方案及服務(wù)模式。超級計算中心的計算能力高達1170萬億次/秒,是某地區(qū)最大的超算中心,在全國區(qū)域超算中心中僅次于上海超算中心,能夠滿足海量數(shù)據(jù)處理需求,為科研和高端裝備制造、生物制藥、動漫與影視渲染、高分辨率遙感應(yīng)用等用戶提供快捷、優(yōu)質(zhì)的計算服務(wù)。空間信息中心將為現(xiàn)代農(nóng)業(yè)、防災(zāi)減災(zāi)、資源環(huán)境、公共安全、城市精細化管理等關(guān)系國計民生的領(lǐng)域提供數(shù)據(jù)服務(wù)、數(shù)據(jù)加工、咨詢報告以及解決方案等。移動互聯(lián)網(wǎng)借助一站式運營支撐系統(tǒng),使開發(fā)者與行業(yè)用戶得到移動應(yīng)用的運營支持,實現(xiàn)電子商務(wù)的精準營銷以及移動政務(wù)、商務(wù)信息的聚合、分析和服務(wù)等目標。與此同時,云計算產(chǎn)業(yè)園還具備國家級數(shù)據(jù)基礎(chǔ)設(shè)施,提供高強度的網(wǎng)絡(luò)安全環(huán)境,安全設(shè)施符合國家信息安全等級保護五級標準,能夠提供專業(yè)的網(wǎng)絡(luò)安全、信息安全與數(shù)據(jù)安全保障體系,并提供全方位的基礎(chǔ)設(shè)施服務(wù),可以實現(xiàn)主機托管、主機租賃以及帶寬租賃服務(wù)。
二、解決方案
方案按照“一個云數(shù)據(jù)中心,多個業(yè)務(wù)集群資源復用”的架構(gòu)原則建設(shè),統(tǒng)一設(shè)計基礎(chǔ)設(shè)施資源,數(shù)據(jù)中心按照綠色模塊化架構(gòu)設(shè)計。項目一期建設(shè)擬先建設(shè)統(tǒng)一的云計算平臺以及數(shù)據(jù)中心網(wǎng)絡(luò)、存儲等部分。
總體方案的核心設(shè)計思路為:“融合”、“分層”、“分區(qū)”:
融合:為了簡化運維,真正地實現(xiàn)統(tǒng)一、高效、靈活地使用超算及云計算中心的IT基礎(chǔ)設(shè)施資源,方案中采用“一個云管理平臺”的方式,利用華為RH2288 V2和RH5885服務(wù)器承載超算業(yè)務(wù)以及云計算業(yè)務(wù),整個數(shù)據(jù)中心可以實現(xiàn)平滑擴容,靈活地對物理資源與云計算虛擬資源實現(xiàn)統(tǒng)一管理與調(diào)度。
分層:在IT基礎(chǔ)設(shè)施實現(xiàn)融合的基礎(chǔ)上,分層架構(gòu)云計算服務(wù)平臺,超算服務(wù)平臺,作為其上各種業(yè)務(wù)應(yīng)用構(gòu)建的支撐。網(wǎng)絡(luò)上,將數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計中分為核心層與接入層,實現(xiàn)扁平的二層網(wǎng)絡(luò)架構(gòu)。
分區(qū):根據(jù)數(shù)據(jù)中心不同業(yè)務(wù)功能區(qū)域的隔離需求,將數(shù)據(jù)中心網(wǎng)絡(luò)分成多個業(yè)務(wù)區(qū)域,各業(yè)務(wù)區(qū)域之間通過相應(yīng)技術(shù)實現(xiàn)網(wǎng)絡(luò)邏輯隔離;根據(jù)數(shù)據(jù)中心網(wǎng)絡(luò)高效交換的需求,將數(shù)據(jù)中心存儲網(wǎng)絡(luò)和業(yè)務(wù)網(wǎng)絡(luò)分離,保證業(yè)務(wù)數(shù)據(jù)與存儲數(shù)據(jù)之間互不影響。
采用了虛擬化技術(shù),云平臺的管理系統(tǒng)與計算資源和存儲資源需要在內(nèi)交換大量的管理和監(jiān)控數(shù)據(jù);虛擬機需要掛載存儲池的存儲資源,也需要海量的數(shù)據(jù)在數(shù)據(jù)中心網(wǎng)內(nèi)傳輸;同時,網(wǎng)內(nèi)還要傳輸虛擬機的業(yè)務(wù)數(shù)據(jù),為了更好地支持這三類業(yè)務(wù)數(shù)據(jù)的傳輸,在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡(luò)劃分管理、業(yè)務(wù)、存儲三個平面,三個網(wǎng)絡(luò)平面相互隔離,互不影響。
業(yè)務(wù)平面:用來承載用戶端到數(shù)據(jù)中心各個業(yè)務(wù)應(yīng)用系統(tǒng)的流量以及數(shù)據(jù)中心內(nèi)部云主機之間的流量,業(yè)務(wù)平面按照業(yè)務(wù)類別的需求進一步劃分為不同的業(yè)務(wù)服務(wù)區(qū)。
管理平面:用來承載數(shù)據(jù)中心網(wǎng)絡(luò)、服務(wù)器、存儲及安全等設(shè)備之間的管理數(shù)據(jù)、指令操作數(shù)據(jù)以及云計算系統(tǒng)的維護和監(jiān)控數(shù)據(jù)。管理平面與業(yè)務(wù)平面共用核心層交換劑,通過VLAN實現(xiàn)兩個平面的隔離。
存儲平面:用來承載計算子系統(tǒng)和存儲子系統(tǒng)之間的存儲流量。存儲平面網(wǎng)絡(luò)是一個獨立的隔離網(wǎng)絡(luò),保證存儲網(wǎng)絡(luò)的服務(wù)質(zhì)量和安全。
根據(jù)上述設(shè)計思路,將數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)部交換網(wǎng)絡(luò)劃分為核心與接入2個層次,按照網(wǎng)絡(luò)功能的不同劃分為外聯(lián)區(qū)、網(wǎng)絡(luò)服務(wù)區(qū)、業(yè)務(wù)服務(wù)區(qū)等多個功能區(qū)。同時,為更好的支持云計算在數(shù)據(jù)中心的運行管理,將網(wǎng)絡(luò)分為管理、存儲、業(yè)務(wù)3個網(wǎng)絡(luò)平面。
本項目建議的整體網(wǎng)絡(luò)結(jié)構(gòu)可分為:外聯(lián)層、核心網(wǎng)絡(luò)區(qū)、接入網(wǎng)絡(luò)區(qū)、云計算業(yè)務(wù)區(qū)、管理區(qū)、超算業(yè)務(wù)區(qū),以及存儲區(qū)。
方案優(yōu)點:
一個數(shù)據(jù)中心、支持多種業(yè)務(wù)平臺;
數(shù)據(jù)中心統(tǒng)一運維:數(shù)據(jù)中心的設(shè)備進行統(tǒng)一管理、統(tǒng)一運維;
虛擬化:架構(gòu)開放、先進,支持高性能CPU/內(nèi)存/存儲/網(wǎng)絡(luò)虛擬化,Qos保證,高安全性和高穩(wěn)定性;
標準化:接口標準化,支持計費、維護管理、設(shè)備集成、運營支撐、能力API;流程標準化,支持IT管理、維護管理、業(yè)務(wù)管理、安全管理、網(wǎng)絡(luò)管理的標準流程;
自動化:支持端到端的自動化部署;支持自動化管理維護;支持自助運營服務(wù);
智能化:支持彈性資源調(diào)度與分配,支持靈活系統(tǒng)與業(yè)務(wù)部署,支持實時環(huán)境監(jiān)控與報警,持動態(tài)負載均衡與節(jié)能;
超算中心:支持多種類型的并行任務(wù)、支持靈活多樣的調(diào)度策略、支持靈活方便的節(jié)點管理、支持自定義的應(yīng)用業(yè)務(wù)流程、提供通用的作業(yè)管理和調(diào)度平臺、高可用性、高并發(fā)性;
SLA: 創(chuàng)新、智能的服務(wù)建模,可提供面向基礎(chǔ)架構(gòu)、應(yīng)用程序性能管理、工作負荷、安全、合規(guī)和服務(wù)臺管理,提供高可靠性SLA;
網(wǎng)絡(luò)設(shè)備:采用數(shù)據(jù)中心級交換機,保障數(shù)據(jù)中心網(wǎng)絡(luò)高可靠性;
數(shù)據(jù)高可靠性:存儲采用高端NAS集群,支持多節(jié)點負載均衡,保證存儲高IO、高帶寬,同時保證業(yè)務(wù)連續(xù)性,高可用性;
高安全性:華為云解決方案采用端管云協(xié)同,從接入側(cè)安全、網(wǎng)絡(luò)安全、云平臺安全、數(shù)據(jù)安全到管理安全,多層次安全保障設(shè)計,以預(yù)防為主,監(jiān)控與審計為輔,全方位保障數(shù)據(jù)中心安全;
易于管理:提供方便的UI管理界面,具備較強的自發(fā)現(xiàn)、自部署、自服務(wù)、自管理、自恢復、自優(yōu)化能力;
可運營:云計算資源可運營,提供客戶自助服務(wù)、自助管理;
靈活擴展:華為云計算的系統(tǒng)能力支持超大規(guī)模的用戶容量需求,完全能夠滿足未來云數(shù)據(jù)中心發(fā)展需求。后續(xù)根據(jù)業(yè)務(wù)需要實現(xiàn)彈性擴容、按需擴容,不影響已有業(yè)務(wù)的連續(xù)性;
高效的維護能力:系統(tǒng)支持高效的問題定位能力,縮短問題恢復時間;
網(wǎng)絡(luò)平面隔離:在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡(luò)劃分管理、業(yè)務(wù)、存儲三個平面,三個網(wǎng)絡(luò)平面相互隔離,互不影響。
網(wǎng)絡(luò)高可靠性:網(wǎng)絡(luò)設(shè)備均采用集群或堆疊,網(wǎng)絡(luò)鏈路全部冗余鏈路或負荷分擔,存儲采用多路徑方式訪問,保證網(wǎng)絡(luò)鏈路高可用性;
開放性:提供開放的APIs,可供與第三方系統(tǒng)進行對接;
高可交付性:華為具有大規(guī)模批量項目交付經(jīng)驗,可以幫助企業(yè)快速部署云業(yè)務(wù)、超算以及數(shù)據(jù)中心解決方案;
成本效益與性能:動態(tài)計算能力調(diào)整,可以根據(jù)管理策略對應(yīng)用進行監(jiān)控及伸縮,降低維護成本,節(jié)能減排;
定制開發(fā):完全自主知識產(chǎn)品,掌握核心技術(shù),定制開發(fā)能力強,可以快速響應(yīng)客戶需求。
拓撲說明:
外聯(lián)層
外聯(lián)層主要用于數(shù)據(jù)中心與多個互聯(lián)網(wǎng)運營商和專網(wǎng)網(wǎng)絡(luò)互聯(lián),為數(shù)據(jù)中心提供高速的互聯(lián)出口鏈路,實現(xiàn)數(shù)據(jù)中心與互聯(lián)網(wǎng)及專網(wǎng)之間的互通。出口路由器通過運營商鏈路接入多家的運營商網(wǎng)絡(luò),以及專網(wǎng)網(wǎng)絡(luò),提高鏈路的可靠性保護。同時,在該層部署高端防火墻,防火墻建議同時具備流量清洗功能,可以在數(shù)據(jù)中心遭受到DDoS攻擊時候提供防護,為數(shù)據(jù)中心整體提供第一層的安全防護。
核心網(wǎng)絡(luò)區(qū)
核心網(wǎng)絡(luò)層是連接整個數(shù)據(jù)中心各區(qū)域的橋梁樞紐,承擔著內(nèi)部數(shù)據(jù)流量和對外數(shù)據(jù)流量的轉(zhuǎn)發(fā)。
由于本項目為云計算及超算,則該核心網(wǎng)絡(luò)設(shè)備必須支持IETF標準協(xié)議TRILL(Transparent Interconnection of Lots of Links),支持10GE的核心交換組網(wǎng);構(gòu)建超過500個節(jié)點的超大規(guī)模二層網(wǎng)絡(luò),支持用戶業(yè)務(wù)靈活部署,支持云計算虛擬機大范圍遷移。
由于是大二層網(wǎng)絡(luò)結(jié)構(gòu),該區(qū)域是各個應(yīng)用業(yè)務(wù)網(wǎng)關(guān)節(jié)點,且是各業(yè)務(wù)數(shù)據(jù)內(nèi)部外部的交換節(jié)點,該區(qū)域部署安全檢測、分析、防護設(shè)備有天然優(yōu)勢,對各業(yè)務(wù)應(yīng)用起到第二層的安全防護。
運維區(qū)
該區(qū)域部署大部分的安全設(shè)備,如遠程安全接入、漏洞掃描、入侵檢測、審計系統(tǒng)等,為整網(wǎng)的業(yè)務(wù)提供安全的檢測、分析、防護與遠程安全接入功能。
接入網(wǎng)絡(luò)區(qū)
接入網(wǎng)絡(luò)區(qū)提供是為各種設(shè)備提供網(wǎng)絡(luò)接入服務(wù),各種設(shè)備通過接入網(wǎng)絡(luò)設(shè)備提供大量的網(wǎng)絡(luò)接口,進行數(shù)據(jù)的通信。接入網(wǎng)絡(luò)設(shè)備與核心網(wǎng)絡(luò)設(shè)備間通過一定收斂比的鏈路進行互聯(lián),為計算、存儲等設(shè)備提供更大范圍的數(shù)據(jù)交換服務(wù)。
云計算業(yè)務(wù)區(qū)
云計算業(yè)務(wù)區(qū)采用華為RH2288 V2和RH5885服務(wù)器,該區(qū)域通過FusionSphere云化(虛擬化)技術(shù)進行資源池化,形成計算資源池。
云計算資源池按需生成的虛擬化主機。云主機可象傳統(tǒng)主機一樣工作,同時具備更高的彈性資源使用能力、擴展能力、遷移能力,具備更靈活配置和快速部署能力。
管理區(qū)
管理區(qū)包括運維管理和安全管理兩部分,管理區(qū)的這兩部分通過VLAN進行安全隔離,三層互通。
運維管理區(qū)主要職責是對數(shù)據(jù)中心中包括路由器、交換機、防火墻、服務(wù)器、存儲、云計算資源,以及各種應(yīng)用軟件等系統(tǒng)進行統(tǒng)一管理與監(jiān)控。運維管理區(qū)部署與運維管理、監(jiān)控等相關(guān)的服務(wù)器、控制主機、運維客戶端等運維設(shè)備,以及ManageOne統(tǒng)一運營運維管理軟件; 連接操作、管理數(shù)據(jù)中心內(nèi)部所有主機、服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備等控制臺、監(jiān)控機等。
安全管理區(qū)主要職責是對數(shù)據(jù)中心內(nèi)部的網(wǎng)絡(luò)、主機、系統(tǒng)、云計算資源和應(yīng)用等設(shè)施進行統(tǒng)一管理與監(jiān)控。安全管理區(qū)部署安全管理系統(tǒng)的服務(wù)器和系統(tǒng),如補丁分發(fā)系統(tǒng)、網(wǎng)絡(luò)防病毒系統(tǒng)、網(wǎng)頁防篡改系統(tǒng)、主機防護系統(tǒng),以及安全設(shè)備的監(jiān)控臺等。實現(xiàn)對網(wǎng)絡(luò)、安全、設(shè)備、系統(tǒng)、應(yīng)用、數(shù)據(jù)等的管理維護。
超算區(qū)(暫不建設(shè))
以物理基礎(chǔ)設(shè)施的方式為超算服務(wù)平臺提供計算資源,采用多個10GE光纖到CE12800核心交換區(qū),管理納入到數(shù)據(jù)中統(tǒng)一管理平臺ManageOne。
存儲區(qū)
數(shù)據(jù)中心的存儲資源主要包括DSware分布式存儲資源池和NAS存儲。DSware分布式存儲資源池、NAS存儲主要為數(shù)據(jù)中心內(nèi)部的業(yè)務(wù)應(yīng)用以及數(shù)據(jù)備份提供存儲資源。
DSware分布式存儲資源池使用數(shù)據(jù)中心內(nèi)部的存儲網(wǎng)絡(luò)平面?zhèn)魉痛鎯?shù)據(jù),網(wǎng)絡(luò)的存儲平面與業(yè)務(wù)平面物理隔離,保證存儲數(shù)據(jù)傳送的質(zhì)量。NAS存儲使用數(shù)據(jù)中心內(nèi)部的業(yè)務(wù)平面網(wǎng)絡(luò)傳送存儲數(shù)據(jù),通過CIFS、NFS標準協(xié)議向數(shù)據(jù)中心內(nèi)部服務(wù)器提供存儲資源。
三、 客戶價值
某大學超算云計算中心的的建成將對遼沈地區(qū)科技基礎(chǔ)設(shè)施建設(shè)、戰(zhàn)略新興產(chǎn)業(yè)培育、高科技產(chǎn)業(yè)集群發(fā)展發(fā)揮帶動、引領(lǐng)作用,為沈陽市建設(shè)“兩化融合” 實驗區(qū)、走以信息化帶動工業(yè)化的新型工業(yè)化道路作出貢獻。