電源、機房環(huán)境集中監(jiān)控系統(tǒng)的出現(xiàn),將原來相對分散的各個機房的電源、空調(diào)設備的運行狀態(tài)和環(huán)境數(shù)據(jù)進行了集中,方便了監(jiān)控。然而隨著我國通信事業(yè)的發(fā)展,通信布局從原來的大型母局式轉變到接入設備更靠近用戶的模塊局方式,模塊局的數(shù)量逐年遞增,監(jiān)控中心通信服務器及數(shù)據(jù)庫服務器的負載能力基本上已經(jīng)達到了滿負荷。另外,隨著電源技術的發(fā)展,智能化的設備也要求接入到系統(tǒng)中,這就帶來了系統(tǒng)響應緩慢,查詢歷史數(shù)據(jù)時間太長以及頻繁告警等問題。因而,對電源、機房環(huán)境集中監(jiān)控系統(tǒng)進行系統(tǒng)優(yōu)化和升級勢在必行。
現(xiàn)有系統(tǒng)分析
通信電源、機房環(huán)境集中監(jiān)控系統(tǒng)主要存在以下問題:
首先,系統(tǒng)運行以數(shù)據(jù)庫為核心,要求中心數(shù)據(jù)庫實時更新,這就造成了對中心數(shù)據(jù)庫的訪問過于頻繁,壓力過大。
其次,數(shù)據(jù)庫服務器是下端前置設備和上端管理節(jié)點的連接通道,如果它出現(xiàn)問題,會引起系統(tǒng)的癱瘓。
最后,現(xiàn)有的通信服務器數(shù)量雖多,但它們之間不能進行靈活的切換。這樣造成了兩方面問題,一是系統(tǒng)的中心通信服務器主備用功能不強;二是可能出現(xiàn)中心通信服務器的負載不均衡現(xiàn)象,當大多數(shù)端局都連在一個通信服務器上時,就會出現(xiàn)問題。
系統(tǒng)優(yōu)化和升級的具體操作
改造系統(tǒng)結構
目前的集中監(jiān)控系統(tǒng)(以下簡稱:監(jiān)控系統(tǒng))多采用兩級結構,數(shù)據(jù)監(jiān)控量越來越大。
圖1 目前監(jiān)控系統(tǒng)結構圖
因此,我們采用三層結構(見圖2),即市中心(SC)層、區(qū)域中心(SS)層和監(jiān)控單元(SU)層,各層的軟件通過數(shù)據(jù)交換協(xié)同工作,共同實現(xiàn)電源、機房環(huán)境集中監(jiān)控的要求。區(qū)域中心(SS)設在集中監(jiān)控中心(SC)下,它所監(jiān)控的范圍是所在工作區(qū)域系統(tǒng)內(nèi)的動力設備及環(huán)境。在此層,設置主備兩臺服務器,提高系統(tǒng)可靠性和穩(wěn)定性,并能任意增加區(qū)域監(jiān)控終端和統(tǒng)計管理終端。同時,它還負責處理各通信局(站)監(jiān)控單元(SU)采集來的數(shù)據(jù),并將處理過的數(shù)據(jù)上傳到監(jiān)控中心,以緩解監(jiān)控中心的壓力,提高了系統(tǒng)查詢、下發(fā)數(shù)據(jù)的運行速度。
圖2 改造后的結構圖
這種結構的優(yōu)點是:
組網(wǎng)方便、靈活,大大減輕了中心的負荷壓力,解決了系統(tǒng)瓶頸問題。
物理區(qū)域分布,使一個區(qū)域節(jié)點故障不會影響其他區(qū)域節(jié)點,提高了系統(tǒng)的可用性和可靠性。
系統(tǒng)接入能力強,理論上可以無限接入,并可組成多級結構,可在監(jiān)控網(wǎng)內(nèi)任意地點安裝監(jiān)控終端。
優(yōu)化數(shù)據(jù)庫,修改表結構
數(shù)據(jù)庫開銷中的90%以上都是重復信息。系統(tǒng)升級后,對這些信息進行了過濾,減輕了系統(tǒng)的負荷。
另外,由于監(jiān)控規(guī)模不斷擴大,形成了數(shù)量龐大的數(shù)據(jù)庫表,不易于管理。針對這個問題,我們采用了更先進的數(shù)據(jù)庫結構。具體操作是:取消端局分表結構,將端局表合并為一個表,包括主機表、機房表、設備表、設備狀態(tài)表等。修改后的數(shù)據(jù)庫表增加了表的檢索能力和檢索速度。
修改告警數(shù)據(jù)傳輸方式
目前監(jiān)控系統(tǒng)告警查詢采取查告警表的方式,導致告警表的任務異常繁忙,嚴重時會影響監(jiān)控系統(tǒng)正常運行。
升級后,通過軟件與監(jiān)控模塊建立的通信協(xié)議機制,不斷的輪詢,判斷接收數(shù)據(jù)的合理性或將接到的控制數(shù)據(jù)轉換為監(jiān)控模塊能識別的控制命令。通信服務器到監(jiān)控中心主機的告警采用通知方式,告警反應時間比原來更快。具體操作是:
監(jiān)控工作站增加服務端口(3388),負責接收告警、門禁及操作記錄等信息。告警信息由通信服務程序直接傳送到監(jiān)控工作站,不再通過報警表傳遞。
通信服務器程序服務端口(8300)增加功能,提供告警、門禁及操作記錄等信息。監(jiān)控工作站的更具情況可直接向通信服務程序查詢。
歷史數(shù)據(jù)傳輸
目前的歷史數(shù)據(jù)傳輸時間太過集中,造成整點時刻網(wǎng)絡及數(shù)據(jù)庫繁忙,并存在歷史數(shù)據(jù)丟失現(xiàn)象。
升級后,每個局的歷史數(shù)據(jù)在不同時刻傳輸,傳送時刻由系統(tǒng)采用隨機數(shù)方法產(chǎn)生。此外,在監(jiān)控前置機中給每一個歷史數(shù)據(jù)塊增加上傳標志,標明該歷史數(shù)據(jù)塊是否已經(jīng)成功上傳;如上傳失敗,則繼續(xù)將歷史數(shù)據(jù)上傳到通信服務器。
同樣,電池曲線也增加上傳標志,以保證電池曲線在上傳失敗后能繼續(xù)上傳到通信服務器。
配置表同步
現(xiàn)運行的監(jiān)控系統(tǒng)各個監(jiān)控部分之間缺乏配置同步機制,維持系統(tǒng)配置一致比較麻煩。
針對這一問題,我們建立了配置表同步機制。配置同步的邏輯采用自頂向下的方式,首先由監(jiān)控工作站或管理工作站開始,先將配置更改信息寫入數(shù)據(jù)庫操作記錄表,然后由通信服務器讀入配置更改信息,再由通信服務器將此信息發(fā)送給監(jiān)控前置機。監(jiān)控工作站采取查操作記錄表方式更新本機配置。
自動配置更新可按如下層次更新,包括:端局層、機房層、監(jiān)控器層、設備層、變量層。
遠程控制
本系統(tǒng)采用TCP/IP作為基本的通信協(xié)議,但現(xiàn)有遠程控制都通過通信服務器和數(shù)據(jù)庫中轉,過于依賴中心服務器,導致系統(tǒng)出現(xiàn)以下問題:
1、控制信息回饋不及時,不能準確提示控制成敗標志。
2、延長了控制操作的時間,存在控制不及時的隱患。
3、數(shù)據(jù)庫或通信服務器出現(xiàn)問題時,不能執(zhí)行遠程控制操作。
升級后,改變遠程控制邏輯,由監(jiān)控工作站直接控制監(jiān)控前置機。這樣帶來了以下好處:
1、控制操作執(zhí)行速度快,不存在延時問題。
2、信息回饋準確及時。
3、在通信服務器或數(shù)據(jù)庫出現(xiàn)問題時,不影響遠程控制操作。
系統(tǒng)時間
監(jiān)控前置機對時系統(tǒng)存在問題,有時會出現(xiàn)錯誤時間。針對這一問題,我們修改了系統(tǒng)對時邏輯。當連續(xù)對時三次以上,不出現(xiàn)較大間隔時間誤差時,視為正確時間,否則視為錯誤時間。最大誤差間隔時間可調(diào),一般設為對時周期的2~5倍。
告警過濾
產(chǎn)生誤告警的幾種主要原因見表1。
表1 產(chǎn)生誤告警原因列表
系統(tǒng)某些誤告警不能屏蔽,會產(chǎn)生頻繁告警。通過以下操作,可減少系統(tǒng)誤告警數(shù)量。
告警次數(shù)過濾:以超過告警線的次數(shù)來判斷是否產(chǎn)生告警/解除,當連續(xù)n次以上超過告警線才產(chǎn)生告警/解除,否則視為誤告警處理。次數(shù)n可以設定為0~10;次數(shù)設為0時,視為告警次數(shù)過濾無效。
告警延時過濾:以超過告警線的時間來判斷是否產(chǎn)生告警/解除,超過最大告警延時時間才產(chǎn)生告警/解除,否則視為誤告警處理。延時時間有效數(shù)據(jù)為0.5~60秒,超出此范圍視為告警延時無效;當不使用告警延時功能時,應設為0。
告警死區(qū)過濾:當監(jiān)控量超過告警線產(chǎn)生告警后,如果監(jiān)控量在告警線上下波動,沒有超過死區(qū)上下線,不產(chǎn)生重復告警及告警解除。告警死區(qū)設為0時,視為告警死區(qū)過濾無效。告警死區(qū)值根據(jù)具體情況指定,一般設為量程的2%左右。
同時,系統(tǒng)只將對用戶有用的報警和事件記錄放入信息欄。
復位控制
針對目前監(jiān)控前置機在系統(tǒng)通信中斷時復位頻繁,造成硬盤等故障發(fā)生率提高的問題,我們在監(jiān)控前置機增加系統(tǒng)通信斷復位次數(shù)限制,避免系統(tǒng)頻繁重啟。次數(shù)可指定,默認為3。
智能化設備的接入
升級后的監(jiān)控系統(tǒng)可實現(xiàn)對任意智能設備的接入,但相對于通信接口間的硬件轉換,通信協(xié)議的轉換相對要復雜一些。其實現(xiàn)方式一是局方智能設備智能接口直接連接到監(jiān)控系統(tǒng)嵌入式監(jiān)控設備上,由其將轉換過的標準協(xié)議傳送到上位機;二是直接將局方智能設備智能接口接到上位機上,通過軟件實現(xiàn)協(xié)議轉換。無論是嵌入式監(jiān)控設備還是上位機,都可以根據(jù)智能設備及智能協(xié)議不同插入不同的協(xié)議模塊。
監(jiān)控系統(tǒng)使用的軟件協(xié)議轉化器是在局站中心的計算機中運行的,只占有很少的資源。它是一個小的轉換程序,在編寫時就能根據(jù)智能設備廠家提供的通信協(xié)議,將廠家提供的所有設備數(shù)據(jù)接入到監(jiān)控系統(tǒng),可以方便我們詳細全面地了解智能設備的運行狀況。
但是,監(jiān)控系統(tǒng)不建議使用硬件協(xié)議轉換器,因為這樣增加了成本,并且在通信鏈路上增加了一個環(huán)節(jié),影響了系統(tǒng)的安全性。此外,由于這種硬件協(xié)議轉換器是各個監(jiān)控廠家自己生產(chǎn)的,當局端有新增設備時,會產(chǎn)生一系列問題。
增加圖像監(jiān)控
國家相關部門已下達機房改造的規(guī)定,一些大型的機房已慢慢成為無人職守型。為了保證上述機房的安全運行要求,升級后的系統(tǒng)增加了圖像監(jiān)控功能,能夠隨時觀察到機房的運行情況,并能得到相關的錄像資料。升級后的系統(tǒng)狀況如下。
系統(tǒng)結構:采用三級系統(tǒng)結構,包括遠程現(xiàn)場、監(jiān)控區(qū)域和監(jiān)控中心三級。
傳輸方式:PCM-2M通信線路連接或采用E1抽時隙復用數(shù)據(jù)方式。
監(jiān)控現(xiàn)場:每個現(xiàn)場可接若干臺攝像機,攝像機的鏡頭和云臺可控。
告警聯(lián)動:可以任意監(jiān)視各個現(xiàn)場,并接收各現(xiàn)場的報警信息,及時切換至告警現(xiàn)場,并可將現(xiàn)場情況錄像。
改進圖形界面
改進后的監(jiān)控系統(tǒng)圖形監(jiān)控界面具有組態(tài)功能,并提供了多種圖形控件,包括所需的組件和畫面制作向導等。界面中每一簡單的控件(線條、文本、按鈕等)均有影響其外觀的屬性。其中靜態(tài)屬性在系統(tǒng)投入運行后保持不變;動態(tài)屬性則隨系統(tǒng)運行過程中I/O設備數(shù)據(jù)的變化而變化。動態(tài)屬性的組態(tài)過程即完成動畫連接,如果用戶對自動生成的監(jiān)控系統(tǒng)的圖形界面不滿意,還可以進行任意修改和編輯。在圖形界面上還根據(jù)用戶需要安置這些組件,如報警信息顯示,報表組態(tài)及打印,查詢和顯示等組件模塊。
無線的人機界面
針對當前移動領域的發(fā)展及應用情況,監(jiān)控系統(tǒng)具備了手機短信息模塊,可將各類型的報警信息即時傳送到相關維護人員,并可進行簡單的交互控制。
增加基于B/S結構的遠程WEB實時監(jiān)控
B/S結構,即Browser/Server(瀏覽器/服務器)結構,在傳統(tǒng)的C/S結構中間加上一層WEB服務層,把原來客戶機所的功能交給WEB服務層來實現(xiàn)。它有三層結構:表示層(用戶界面),功能層(WEB服務器)和數(shù)據(jù)層(數(shù)據(jù)庫服務器)。與C/S結構相比,B/S結構有以下優(yōu)點:
(1) 用戶端只需安裝單一的瀏覽器軟件(如IE),界面統(tǒng)一,使用簡單。
(2) 由于客戶端無須安裝專用軟件,系統(tǒng)升級時只需更新WEB服務端的軟件,使系統(tǒng)易于維護。
(3) 采用標準的TCP/IP協(xié)議,HTTP協(xié)議,有良好的廣域網(wǎng)支持,擴展性好,易于實現(xiàn)多用戶監(jiān)控,信息共享程度高。
采用B/S結構開發(fā)的實時遠程WEB監(jiān)控系統(tǒng)提供了完整清晰的動態(tài)監(jiān)控過程。頁面以秒為單位自動刷新。刷新時,整個文件重新執(zhí)行一次到數(shù)據(jù)庫的連接、查詢和顯示,能將數(shù)據(jù)的變化及時反映給用戶。通過屏幕流程圖數(shù)據(jù)和數(shù)據(jù)表格的配合使用,完成了對設備從整體到細節(jié)的監(jiān)控。
優(yōu)化和升級后系統(tǒng)的性能
響應速度
升級后,監(jiān)控中心對監(jiān)控數(shù)據(jù)的響應速度有了明顯的提高,報警數(shù)據(jù)從現(xiàn)場發(fā)生到監(jiān)控中心的反應時間在10秒以內(nèi)。
通信的主備路由功能
系統(tǒng)升級后,增加了系統(tǒng)通信的主備路由功能,主服務器運行主通信服務程序,備用服務器運行備用通信服務程序。當主服務器失效時,系統(tǒng)自動切換到備用服務器上,使用備用數(shù)據(jù)庫和備用通信服務程序。端局可以動態(tài)的接入任意一個中心通信服務器,由此在中心實現(xiàn)動態(tài)的負載均衡和通信備份功能,再不會因為某一臺通信服務器的故障而使中心和端局的通信中斷。
當前通過97網(wǎng)接入的局向,可以配置一個撥號解調(diào)器,當97網(wǎng)出現(xiàn)故障時,自動啟用撥號備用路由進行通信。
系統(tǒng)的擴容能力
當前使用的系統(tǒng),監(jiān)控中心的承載能力是有限的。系統(tǒng)升級后,系統(tǒng)構架是專網(wǎng),通過以太網(wǎng)絡設備組成三級網(wǎng)絡系統(tǒng),提供可擴展光端口,而且是點對點樹狀結構,有極強擴展能力,不會產(chǎn)生傳輸瓶頸。
區(qū)域中心可以隨時接入新的通信服務器分擔通信及數(shù)據(jù)處理的任務。這樣,整個系統(tǒng)的實際擴容能力將不再受網(wǎng)絡結構的限制。
監(jiān)控中心的兼容性
系統(tǒng)升級后的通信服務器支持Unix、Redhat Linux平臺,因此不必再選用昂貴的Alpha服務器;甚至在規(guī)模較小時,可采用性能良好的PC做同心服務器。在規(guī)模較大的監(jiān)控系統(tǒng)中,可采用多通信服務器協(xié)同處理數(shù)據(jù),這樣并不需要配置太高的服務器也能達到很高的處理能力和接入能力。
數(shù)據(jù)庫的壓力減小
系統(tǒng)升級后,監(jiān)控站和通信服務器對數(shù)據(jù)庫的連接數(shù)量和訪問次數(shù)減少,從而減輕數(shù)據(jù)庫的壓力,使系統(tǒng)接入能力大大增強。同時,數(shù)據(jù)表的數(shù)量的減少,方便了數(shù)據(jù)庫表的維護。
來源:機房監(jiān)控 http://www.dr4xxf.cn/ 本文采集于網(wǎng)絡,如有問題有聯(lián)系刪除
北京金恒智能系統(tǒng)工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板、轉載本站內(nèi)容等行為者,本站保留追究其法律責任的權利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網(wǎng)站XML
智慧機房
在線體驗