保障數據中心核心業務系統安全高效可靠地運行,是信息系統管理部門的重要職責和偉大目標,也是IT人的使命所在。IT人擁有不可推卸的權責。
數據中心核心業務系統,從邏輯上看包含多個不同的應用組件,從物理上看運行在多個不同的物理服務器上,數據在不同的設備或系統間流動。
要實現上述目標需要對數據中心進行全方位、多層次的綜合監控,需要對問題處置和應急指揮進行科學管理。
本項目主要針對解決數據中心管理和運行工作中的實際問題,主要作用表現在以下三個方面:
監控對象一體化
實現機房動力、環境、安保、小型機、服務器、網絡、安全、存儲設備、數據庫、中間件、應用軟件等跨平臺一體化的實時狀態、性能、事件、配置等數據的采集、正則化匯聚和保存。
監控展示一體化
所有監控對象的狀態、性能、事件都集中的以三維效果圖的方式展示出來,更方便、直觀、高效的讓數據中心工作人員準確的定位故障發生位置并處理所發生的緊急情況。
監控管理一體化
一體化集中監控管理系統實現7X24小時實時監控和報警、知識庫支持的實時事件故障處理,自動化管理報表生成,資產管理、知識管理、機房管理等日常管理功能,讓工作人員在日常數據中心管理維護上更加輕松,以避免在不必要的環節浪費大量人力、物力,讓工作人員將主要精力放在數據中心內核心業務上來,提高數據中心的整體業務效率。
一體化集中監控管理系統的實施,將保障數據中心核心業務系統的安全、高效、可靠地運行,極大的提高數據中心管理工作的自動化、信息化工作效率,為更好的服務于社會提供強有力的保障。
通過需求調研,本建設項目的需求包括兩個方面,一個是監控管理系統的功能需求,另一個是監控范圍的需求,包括具體的監控對象,監控指標。
從功能上講,本項目需要實現監測、控制和管理的一體化。具體包括:三維效果展示、事件告警管理、知識庫管理、資產管理、機房值班管理、統計報表等。
從監控范圍上講,本項目需要實現的監控類別包括: 動力、環境、安保、小型機、服務器、網絡、安全、存儲設備、數據庫、中間件、應用軟件等,從而實現一體化集中監控的目標。
從應用軟件的層面看,IT一體化集中監控管理系統共由六大子系統構成,包括Web客戶端、管理客戶端、Web服務、監控服務器、后臺服務進程和監控代理。各子系統具體功能及相互關系如下圖:
系統上線運行之后,使用最多的就是Web 客戶端。它提供了監控管所需要的一切。
管理客戶端是增減監控對象、調整監控策略、優化監控代理部署和監控策略的強大工具。
Web服務包括工程文件、數據中轉、自身監控、備份恢復、升級許可等諸多服務。除了數據中轉服務外,Web服務不依賴后臺的其它任何服務。它能夠對系統的其它組件進行起、停操作和狀態檢測,從而實現IT一體化集中監控管理系統的持續運行。
監控服務器是IT一體化集中監控管理系統中最核心的子系統。除Web客戶端外,其它四個子系統都與監控服務器子系統直接交互。它內嵌強大的實時數據庫,擁有偵聽器、數據匹配、事件生成、數據保存、數據訪問、連通檢查和SNMP輪詢在內的高性能的內核服務。例如,它的數據匹配引擎,可以同時快速匹配出幾乎任何代理發送過來的任何格式的數據;它的事件生成引擎按事件生成規則快速生成事件;它的數據保存服務按照保存策略快速地將監控指標的實時數據保存到關系數據庫。
后臺服務是由一組可以獨立安裝在不同機器上的程序組成,包括告警服務、策略執行、協議執行、級聯服務、業務監控接口、動環監控接口等。監控服務器加后臺服務的設計,即保持了監控服務器的微內核又擁有了各種后臺服務安裝部署的靈活性。
共濟IT一體化集中監控管理系統監控協議即支持由標準協議支持的監控對象,也包括非標準的監控對象。標準協議包括:SNMP、IPMI、WMI、SYSLOG等。非標準監控對象通過由各類腳本(例如perl)寫成的監理代理來完成。這些腳本化的監控代理(我們簡稱“腳本代理”)即安全又高效,即可以本地部署,也可以遠程部署,一切按需求靈活設置。
根據不同的監控管理需求,現提出兩種系統架構:
² 單個中心機房IT監控:
IT一體化集中監控管理系統部署之后,分為客戶層、服務層、業務層和采集層,通過四個層的實施,來實現綜合監控和科學管理。系統部署的一個例子如下圖所示:
經過部署后,四個層需要實施的內容有:
1. 客戶層?蛻魧影瑘缶⻊掌鳎▓缶W關)、管理客戶端和Web客戶端。報警服務器部署報警網關,負責對外的電話、短信和郵件報警,需要單獨部署一臺服務器;管理客戶端安裝C/S客戶端軟件,主要負責監控應用服務器的配置和使用,需要單獨為管理員配置一臺服務器。Web客戶端可以通過Web查看,只要網絡連通,任何工作機都可以根據權限進行查看,針對本項目的特點需單獨提供一臺服務器進行WEB瀏覽,同時需要將Web瀏覽界面圖像信號傳送給大屏系統,展示到大屏中。
2. 服務層;服務層包含綜合監控應用服務器和綜合監控數據庫服務器。綜合監控服務器需要高性能服務器主機和Liunx操作系統,可保證更高的穩定性和性能,負責部署綜合監控平臺、工單管理子系統、報表子系統、系統管理服務、聯動服務、Web服務、數據配置、存儲和報警服務和事件日志查詢服務。綜合監控數據庫服務器需要高性能服務器主機和數據庫服務,用于存儲監控的歷史數據和事件、配置信息等數據。
3. 業務層;業務層包含監控的各種業務系統,包括稅收征管業務系統、網上報稅業務系統和貨運發票業務系統等。這些業務系統的運行狀態是監控的核心,其它方面的監控都是輔助于業務系統監控。業務層監控的功能是綜合監控系統與各個業務系統通訊,獲取業務系統狀態。
4. 采集層;采集層包含各種硬件、系統和動力與環境。通過對本層的監控,可以更加準備的分析出業務出現故障的原因和實現預警功能。本層采用分布式設計,能夠靈活增減監控設備,而無需在軟件上修改代碼,只需要配置即可。
² 多機房聯網型的IT監控:
對于聯網型的監控,可利用IT一體化集中監控管理系統的級聯功能,實現各前端機房內設備的集中監控管理。部署同樣分為四層:客戶層、中心服務層、本地服務層和現場采集層。部署圖如下:
1. 客戶層:客戶層包含報警服務器(報警網關)、管理客戶端和Web客戶端。報警服務器部署報警網關,負責對外的電話、短信和郵件報警,需要單獨部署一臺服務器;管理客戶端安裝C/S客戶端軟件,主要負責監控應用服務器的配置和使用,需要單獨為管理員配置一臺服務器。Web客戶端可以通過Web查看,只要網絡連通,任何工作機都可以根據權限進行查看,針對本項目的特點需單獨提供一臺服務器進行WEB瀏覽,同時需要將Web瀏覽界面圖像信號傳送給大屏系統,展示到大屏中。
2. 中心服務層:中心服務層包含中心應用服務器和數據庫服務器。中心應用服務器需要高性能服務器主機和Liunx操作系統,可保證更高的穩定性和性能,負責部署針對所有前端站點機房的綜合監控平臺、工單管理子系統、報表子系統、系統管理服務、聯動服務、Web服務、數據配置、存儲和報警服務和事件日志查詢服務。綜合監控數據庫服務器需要高性能服務器主機和數據庫服務,用于存儲所有前端站點機房監控的歷史數據和事件、配置信息等數據。
3. 本地服務層:本地服務層包含一臺前端應用服務器。前端應用服務器負責部署本機房內設備、操作系統、業務系統以及動環系統的綜合監控,并把監控信息即時傳遞給中心服務層。本層采用分布式結構,增減所監控前端機房數量時,只需增加或減少相應數量的前端應用服務器。
4. 現場采集層:現場采集層包含各種硬件、系統和動力與環境。通過對本層的監控,可以更加準備的分析出業務出現故障的原因和實現預警功能。本層采用分布式設計,能夠靈活增減監控設備,而無需在軟件上修改代碼,只需要配置即可。
一體化集中監控管理管理系統分為四個層次結構,
系統四層結構如下圖所示:
軟件架構中每個層次的作用是:
1. 顯示層;本層主要是提供給用戶圖形交互界面,將大量的復雜的監控數據通過圖形化的方式分層次和優先級地展現給管理員,使一體化集中監控管理系統的監控更加簡單和易用。顯示層主要實現了客戶端功能,具有C/S和B/S雙重架構,包括管理客戶端和Web客戶端。管理客戶端具有系統管理功能;Web客戶端通過友好的頁面展示監控內容,顯示故障報警,用戶可以通過Web瀏覽獲知整個系統的運行狀態。
2. 應用層;本層是核心服務程序,負責維護采集層的數據、提供顯示層瀏覽服務和報警功能。應用層包含業務管理模塊和報警網關模塊。業務管理模塊負責從采集層獲取監控數據,經過處理,將報警數據進行顯示和發送給報警網關模塊,并對數據進行記錄,以便報表分析處理。報警網關模塊接收到報警后,通過電話、短信或Email發送給管理員。應用層各個服務都是監察的核心模塊,系統設計了軟件看門狗服務,自動監測各個服務的運行狀態,當運行狀態下一體化集中監控相關服務出現異常,將由軟件看門狗服務自動重啟異常服務,恢復監察業務。
3. 采集層;本層負責采集監控數據。采集層根據前端不同的監控對象采用不同的采集方式。針對動力與環境監控,采集方式多采用串口RS232方式;針對業務監控、服務器、網絡、存儲和通訊的監控,多采用網絡方式。
4. 設備層;包括被監控的設備和系統,也包括各類專門的監控工具。 |