400-650-1086
首頁 > 最新資訊 > IT新聞 > 正文

機房環(huán)境監(jiān)控的意義是什么?

admin 2020-01-03 23:37:21 0

一、監(jiān)控管理對可用性管理的意義。

  根據ITIL的定義,所謂的“可用性”指的是:“一個配置項或IT服務根據需要履行協定職能的能力??捎眯匀Q于可靠性、可維護性、可服務用性、性能和安全??捎眯酝ǔR园俜直扔嬎?。這種計算通常基于協定服務時間和宕機時間”。高可用性IT管理是指:是指通過對IT架構及運維管理、基礎設施及管理、災備建設及運維、安全及管理等高可用性關鍵要素的改進與優(yōu)化,提升IT系統的可用性,從而更好地保障業(yè)務持續(xù)運營和創(chuàng)新的過程。

  在衡量可用性方面,具體又分為MTTR/MTBF/MTBSI等三個不同的指標(如下圖)。從下圖可見,無論是MTBSI還是MTTR,均有一個重要的組成部分——“Detecttime(偵測時間)”。可見“能否通過有效的監(jiān)控管理,及時、有效地發(fā)現數據中心中各管理對象的故障”,已構成數據中心高可用性一個充分條件。

  所以說,集中監(jiān)控管理就像是高可用性管理的一雙眼睛,有了它整個數據中心的組件情況才能一目了然,高可用性的目標才具備實現的管理基礎。

二、監(jiān)控管理對數據中心運營的作用。

  數據中心的管理對象主要包括基礎設施與IT基礎架構兩大部分。其中基礎設施包括供配電、UPS、空調、消防、安保、環(huán)境監(jiān)測等機房系統;基礎架構包括網絡設備、主機設備、存儲設備等IT設備。

  集中監(jiān)控的目標就是要能夠通過管理與技術的應用,對基礎設施與IT基礎架構的運行情況進行監(jiān)視,實現故障與異常的實時發(fā)現與通知;此外還可以通過對監(jiān)控數據搜集與整理,為容量管理、事件管理、問題管理、符合性管理提供分析的基礎,最終實現數據中心高可用性的目標。

  1.事件管理與可用性管理

  隨著技術的發(fā)展,有許多第三方監(jiān)控工具開始出現,這些工具可以實現跨設備、跨平臺、跨系統的集中數據采集,同時也能針對不同的監(jiān)控對象設置相應的閥值,最終還可以實現統一的展現與告警。這些工具的出現,使得IT管理人員可以以一種更快速、更準確的方式發(fā)現被管理的組件所出現的故障。從而為故障的修復,以及服務的恢復爭取了寶貴的時間,提升了整個基礎架構的可用性。

  2.容量管理

  監(jiān)控管理還會利用監(jiān)控工具的性能采集功能,對一些關鍵應用的關鍵性能點進行監(jiān)控,取得這些關鍵點的性能數據,用來評估IT系統的容量。當發(fā)現IT組件目前的性能與原來的容量計劃存在偏差后,可以及時對這些組織的性能進行擴容,減少因性能不足而導致業(yè)務中斷的可能性。

  3.安全管理與符合性管理

  監(jiān)控管理可以利用目前的一些安全監(jiān)控工具,去檢查組件的安全情況與運行中對合規(guī)要求的符合情況。如GDS目前的一些合作伙伴,其利用一些安全軟件,對防火墻、防病毒與入侵檢查設備進行實時日志采集與安全分析,同時比對公司的安全策略或一些安全標準,幫助數據中心管理人員對目前數據中心運營中安全問題進行快速定位與問題分析。

三、監(jiān)控管理面臨的挑戰(zhàn)

  1.采集層的集中化

  從目前市場上的工具來看,還沒有哪個監(jiān)控工具可以支持業(yè)界全線的IT產品,尤其是存儲與光傳輸設備這一塊。另外,不同客戶對監(jiān)控的深度也要求迥異,有些客戶可能僅需要監(jiān)控到網絡、設備與系統層面,有些則需要對其數據庫、中間件甚至是應用進行監(jiān)控,這也為監(jiān)控采集層的集中帶來不少的難度。最后,不同客戶對成本與安全要求的不同,進一步提升了監(jiān)控工具在采集層集中的難度。

  2.處理層的集中化

  目前許多設備的監(jiān)控往往只能反映出某一臺設備的可用性,卻不能完整的展現出整體的應用結構以及互相之間的影響關系,一旦一臺核心的交換機發(fā)生故障后,管理員會發(fā)現,突然之間,滿世界都是各種各樣的告警,頭昏眼花,疲于奔命,卻不知道到底該如何解決。因此,如何能進行事件關聯,協助管理員能從各個孤立的事件中迅速定位,這是對監(jiān)控管理的另一項挑戰(zhàn)。

  3.展現層的集中化

  隨著監(jiān)控內容的增加,目前數據中心運營人員面臨的另外一個問題是如何能讓監(jiān)控室的人員可以在眾多監(jiān)控終端中迅速地發(fā)現系統報警,畢竟無法要求負責監(jiān)控的人員7X24小時地盯著監(jiān)控屏幕。所以監(jiān)控終端的報警方式集中化,甚至是監(jiān)控工具展現層的集中化就成為了監(jiān)控管理目前所面臨的一項挑戰(zhàn)。

  4.監(jiān)控工具與管理的集中

  監(jiān)控管理的目的并不是監(jiān)控工具本身,而是通過人工或技術的手段可以及時發(fā)現基礎設施與基礎架構上的問題,并按照既定的要求,將發(fā)現的問題按照既定管理流程與工具,調動相應的技術、管理人員介入,最終有效地解決數據中心中可能出現的事件、容量與可用性等問題。因此,如何讓數據中心工作人員清楚在監(jiān)控工具中報出問題后,應如何執(zhí)行后續(xù)管理流程,避免錯報、漏報,成為監(jiān)控管理的一項重要挑戰(zhàn)。

四、監(jiān)控管理發(fā)展的趨勢

  1.業(yè)務監(jiān)控

  數據中心提供的是信息服務,也可以說是業(yè)務服務,獨立的對一臺設備進行監(jiān)控已經不能滿足未來的需求。對于管理人員來說,更關心的是數據中心提供的一個業(yè)務、一個服務是否能夠正常的運行,因此,未來的監(jiān)控解決方案,需要更多的從業(yè)務及服務的層面出發(fā),將獨立的物理設備,與業(yè)務緊密關聯,形成業(yè)務設備視圖,每個設備的可用性,都能夠反映到業(yè)務的可用性上。

  2.虛擬化云監(jiān)控

  虛擬化是未來數據中心的趨勢,但監(jiān)控工具很難區(qū)分其監(jiān)控的服務器是一臺物理機,還是一臺虛擬機,也不可能知道硬件系統會對服務器可用性存在潛在影響,而虛擬化平臺的可用性直接影響到運行在其之上的虛擬服務器的可用性。監(jiān)控軟件處理的應該是主服務器硬件出現的問題,但是如果主服務器處于危險之中,那么任何在主機上運行的虛擬機也面臨同樣的問題,因此,虛擬化云環(huán)境的高可用性方案也會是未來的趨勢之一。

  3.影響分析模型

  業(yè)務監(jiān)控及虛擬化環(huán)境的基礎在于不同的設備間能夠建立清晰的管理,形成設備與設備的關系網,這就需要建立CMDB(配置管理數據庫),它清晰的描述了每一臺設備的信息屬性,以及設備之間的關系。通過建立CMDB信息庫,形成業(yè)務的影響模型,例如,以下是對一個在線交易系統進行影響建模:

  在這個交易系統的影響模型中,例如“存儲”發(fā)生故障,直接反應出的是服務不可用,同時“在線交易系統”、“數據庫服務器”、“在線交易系統”皆為不可用狀態(tài),根據被依賴關系進行分析,可以很直接的定位到故障原因,從而避免了逐個系統的進行故障分析。

來源:機房監(jiān)控 http://www.dr4xxf.cn

售前咨詢

專線:劉剛 13911133352

E-mail:112417434@qq.com

北京金恒智能系統工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.

法律聲明:未經許可,任何模仿本站模板、轉載本站內容等行為者,本站保留追究其法律責任的權利!

電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網站XML

智慧機房

在線體驗

CREATE·機房監(jiān)控 體驗端  用戶名:Admin    密碼:12345 點擊體驗
在線咨詢 電話咨詢