近幾年,全國范圍電子政務(wù)取得了長足的進展,上海浦東是全國經(jīng)濟發(fā)展的橋頭堡,區(qū)內(nèi)各政府單位對數(shù)據(jù)和系統(tǒng)的安全性要求越來越高,但目前各委辦的信息系統(tǒng)是相對獨立的,各職能部門之間的數(shù)據(jù)不能完全,這與電子政務(wù)系統(tǒng)建設(shè)的總體原則是有所相悖。整個政府信息系統(tǒng)存在信息孤島 、系統(tǒng)建設(shè)重復(fù)投資嚴重 、數(shù)據(jù)安全保障較差等問題。建立一個真正的具有服務(wù)全局的數(shù)據(jù)中心,來解決電子政務(wù)建設(shè)過程中出現(xiàn)的信息孤島、信息共享交換、數(shù)據(jù)安全存儲、業(yè)務(wù)持續(xù)性等問題是此次項目建設(shè)的總體目標。
根據(jù)需求分析以及可行性研究分析,浦東數(shù)據(jù)中心基本確定了包含服務(wù)器區(qū)、存儲區(qū)、備份區(qū)、管理區(qū)等核心支撐區(qū)塊的整體邏輯構(gòu)架。在服務(wù)器區(qū),是上百臺服務(wù)器組成的業(yè)務(wù)集合,應(yīng)用環(huán)境相對比較復(fù)雜,任何的服務(wù)器非計劃宕機,都會造成不良影響,架構(gòu)一個全冗余的業(yè)務(wù)運行平臺以及如何管理好這些服務(wù)器是浦東數(shù)據(jù)中心業(yè)務(wù)數(shù)據(jù)安全的核心目標之一。
中心中的網(wǎng)絡(luò)設(shè)施、供電系統(tǒng)、安全設(shè)備等都采用了冗余配置,在服務(wù)器架構(gòu)上浦東數(shù)據(jù)中心采用了LanderVault的Cluster集群技術(shù)方案來達到提升服務(wù)器資源使用效率和提升可靠性的能力。通過對數(shù)據(jù)中心服務(wù)器的整理,LanderVault管理功能將數(shù)據(jù)中心的業(yè)務(wù)環(huán)境根據(jù)業(yè)務(wù)邏輯進行分組,在實施監(jiān)控和管理的同時,進行集群整合,達到服務(wù)器整體高可用。
業(yè)務(wù)邏輯一致的應(yīng)用系統(tǒng)放在一個子集群組中,定義一臺或多臺集群備份機。浦東新區(qū)數(shù)據(jù)中心服務(wù)器環(huán)境是一個‘大集群’,根據(jù)業(yè)務(wù)邏輯,分成多個子集群,提升了安全級別及工作效率。這些子集群在一個集群管理平臺環(huán)境下,并能夠充分利用服務(wù)器資源,并不需要增加新的服務(wù)器,節(jié)省投資,同時具備了相當?shù)臄U展性。
浦東政府數(shù)據(jù)中心最終將向各委辦提供數(shù)據(jù)服務(wù),通過外部接口,直接訪問到WEB服務(wù)器,本方案為一些應(yīng)用服務(wù)器配置了冗余WEB服務(wù)器,一臺WEB服務(wù)器在正常運作情況下,可能無法滿足訪問的需求,可以通過配置硬件負載均衡設(shè)備實現(xiàn)負載,但會增加不必要投資。通過在集群架構(gòu)上部署LanderVault的Balance負載均衡功能,平衡了網(wǎng)絡(luò)流量,在最大程度上確保了網(wǎng)絡(luò)訪問的順暢。
針對數(shù)據(jù)中心托管、抽取庫、核心數(shù)據(jù)庫等環(huán)境,在高可用系統(tǒng)架構(gòu)中,數(shù)據(jù)庫的資源監(jiān)控將是一個系統(tǒng)工作正常與否的核心問題。本項目針對數(shù)據(jù)庫環(huán)境加載了LanderVault集群組件的數(shù)據(jù)庫插件,以滿足數(shù)據(jù)中心的系統(tǒng)高可用要求。
數(shù)據(jù)庫運行的必要條件檢查:
DB插件檢查數(shù)據(jù)庫系統(tǒng)的進程是否正常運行,服務(wù)是否已啟動,監(jiān)聽是否已經(jīng)打開,這些條件都是一個數(shù)據(jù)庫系統(tǒng)正常工作的必要條件,但還不能充分說明數(shù)據(jù)庫正常。
數(shù)據(jù)庫可用性偵測:
DB插件針對數(shù)據(jù)庫可用性進行偵測,主要是通過模擬Client訪問請求,考量數(shù)據(jù)庫系統(tǒng)是否能迅速有效地響應(yīng),該偵測方式直接地反應(yīng)了數(shù)據(jù)庫的可用狀態(tài),但還不能說明數(shù)據(jù)庫系統(tǒng)沒有問題。
數(shù)據(jù)庫的風險檢測:
數(shù)據(jù)庫系統(tǒng)是業(yè)務(wù)系統(tǒng)的心臟,任何風險都可能導(dǎo)致系統(tǒng)癱瘓,DB插件針對數(shù)據(jù)庫系統(tǒng)的風險檢測主要包括表空間的使用率、數(shù)據(jù)庫設(shè)備的使用率、SGA的命中率等,這類數(shù)據(jù)庫性能指標,可揭示數(shù)據(jù)庫系統(tǒng)本身存在的風險。
浦東新區(qū)政府數(shù)據(jù)中心的集群服務(wù)器的工作狀態(tài),包括操作系統(tǒng)資源使用、數(shù)據(jù)庫運行狀態(tài)、應(yīng)用服務(wù)狀態(tài),服務(wù)器資源的使用狀況,包括CPU、內(nèi)存占用、網(wǎng)絡(luò)流量、存儲空間等狀態(tài)在達到預(yù)警范圍時,通過短信方式直接通知管理人員干預(yù)。
集群架構(gòu)中可以在上述故障或者資源達到設(shè)定閥值時,完成預(yù)定操作,包括切換、重啟等。通過該短信接口,與中心短信平臺結(jié)合,增強中心的服務(wù)能力。
數(shù)據(jù)中心包括數(shù)據(jù)管理平臺、安全管理平臺及備份管理平臺,這些平臺構(gòu)成了整個數(shù)據(jù)中心的核心功能,這些平臺最終將集成在一個大的管理平臺上,相互之間有數(shù)據(jù)和控制信息交換。集群管理平臺嵌入系統(tǒng)層面更深,對服務(wù)器、應(yīng)用環(huán)境形成了更有效的監(jiān)控和管理。
1、 數(shù)據(jù)中心服務(wù)能力提升:提高了整體可靠性,集群建立使得數(shù)據(jù)中心的關(guān)鍵業(yè)務(wù)服務(wù)能力都能夠得到有效的保障;
2、 數(shù)據(jù)中心系統(tǒng)擴容及維護的保障:中心服務(wù)器都可以進入集群管理平臺,集群管理平臺可以通過規(guī)則的定義,任意增加、減少集群節(jié)點;
3、 對項目的投資保護、提高設(shè)備利用率:在沒有多節(jié)點集群管理解決方案之前,只能對關(guān)鍵業(yè)務(wù)做雙機容錯,每個業(yè)務(wù)要做一套雙機,一方面投資巨大,同時也增加了管理的復(fù)雜度;
4、 降低了中心對服務(wù)器、應(yīng)用管理的復(fù)雜度:所有服務(wù)器被整合到一個大集群管理平臺中,對于系統(tǒng)的維護和安全管理變得簡單了;`
5、 針對數(shù)據(jù)中心實際環(huán)境,定制開發(fā)適合數(shù)據(jù)中心管理需要的功能模塊:針對數(shù)據(jù)中心管理平臺,專門定制一套開放式,可與其它管理平臺有效集成的軟件。
咨詢·購買