文章來源:IDCparadise
文章標簽:【DCIM】【機房環(huán)境監(jiān)控】【數(shù)據(jù)中心】【數(shù)據(jù)中心管理】【基礎設施管理】【基礎設施監(jiān)控】
停機時間仍然是現(xiàn)代數(shù)據(jù)中心專業(yè)人員面臨的最大數(shù)據(jù)中心管理難題之一。對于IDC運營商和托管業(yè)主而言,意外中斷可能會對業(yè)務關鍵型系統(tǒng)和應用程序造成嚴重破壞,從而導致客戶不滿意。此外,停機時間造成的損失可能非常昂貴。
避免意外停機始于解決其主要原因之一:人為錯誤。根據(jù)Ponemon Institute的數(shù)據(jù),人為錯誤占計劃外數(shù)據(jù)中心中斷的22%。雖然很多數(shù)據(jù)中心培訓和認證計劃可以幫助員工降低人為錯誤的風險,但您如何管理設施中的設備和環(huán)境同樣重要。
這就是數(shù)據(jù)中心監(jiān)控可以發(fā)揮作用的地方。數(shù)據(jù)中心基礎設施管理(DCIM)軟件可以幫助您跟蹤數(shù)據(jù)中心項目的電源、環(huán)境和安全狀態(tài),并提供信息以減少因人為錯誤導致的停機時間。
考慮這四種數(shù)據(jù)中心監(jiān)控的常見用例:
監(jiān)控健康狀況
確保數(shù)據(jù)中心內(nèi)的智能PDU、UPS和其他設備可通過網(wǎng)絡運行并可訪問,這對于維護數(shù)據(jù)中心的運行狀況至關重要。但是,通常情況下,PDU或其他設備可能會在您和您的團隊意識不到的情況下停機。技術人員或工程師可能會意外地將PDU置于維護模式,忘記打開新配置的資源,甚至使用錯誤的電纜或端口連接設備。
DCIM軟件和其他數(shù)據(jù)中心監(jiān)控工具可以通過健康狀況調(diào)查來限制由于硬件故障導致的中斷的可能性。數(shù)據(jù)中心軟件以用戶可配置的間隔輪詢智能PDU或其他設備,以確保連接正常。如果無法連通,則DCIM軟件立即發(fā)送提醒,以便您第一時間了解數(shù)據(jù)中心的潛在問題。
數(shù)據(jù)中心監(jiān)控閾值,警報和報告
如果您沒有密切關注數(shù)據(jù)中心電源管理和環(huán)境監(jiān)控,則可能會出現(xiàn)因過載或過熱而導致意外停機的情況。數(shù)據(jù)中心工作人員很容易錯誤地計算或錯誤設置預算功率或為機柜分配的最高溫度,從而導致冷卻不充分和數(shù)據(jù)中心容量管理不準確。
DCIM軟件提供閾值、警報和數(shù)據(jù)中心統(tǒng)計報表功能,以避免過度冷卻和產(chǎn)能過剩的情況。通過配置溫度和功率閾值,您可以為數(shù)據(jù)中心設置一個舒適的范圍,而如果您接近極限,警報和通知會立即發(fā)出警告。智能PDU的實時負載監(jiān)控還可以幫助您立即對產(chǎn)能過剩問題做出反應,從而幫助您提高數(shù)據(jù)中心團隊的工作效率。數(shù)據(jù)中心電源管理報告為您提供切片和切塊的數(shù)據(jù),以便更好地了解和可視化您的電源和溫度趨勢,從而實現(xiàn)萬無一失的數(shù)據(jù)中心容量規(guī)劃。
故障轉(zhuǎn)移情況下的電源冗余
當PDU發(fā)生故障或容量過剩時,數(shù)據(jù)中心會發(fā)生什么?許多數(shù)據(jù)中心團隊如此專注于充分利用現(xiàn)有資源并推遲資本支出,以至于他們可能沒有意識到他們已經(jīng)超載了他們的內(nèi)閣,直到為時已晚。
設備故障時的電源冗余是任何停機時間減少策略的簡單而有效的組件。通過故障轉(zhuǎn)移模擬報告,您可以識別存在風險的機柜,并確定在一個PDU發(fā)生故障時設備是否可以繼續(xù)運行,而不會影響設備。因此,您的團隊可以在這些有風險的機柜成為問題之前對其負載進行適當?shù)母摹?/span>
安全監(jiān)控
雖然數(shù)據(jù)中心電源監(jiān)控和環(huán)境管理是DCIM軟件最常見的使用場景,但隨著對設備的威脅普及,數(shù)據(jù)中心安全性變得越來越突出。未經(jīng)授權的訪問占據(jù)了數(shù)據(jù)中心違規(guī)的18%。無論此訪問是惡意還是偶然,了解誰有權訪問您的數(shù)據(jù)中心對于保護您的數(shù)據(jù)和物理資源至關重要。
DCIM軟件和其他數(shù)據(jù)中心工具可以幫助您跟蹤進出數(shù)據(jù)中心的人員。數(shù)據(jù)中心軟件可以監(jiān)控機柜上的觸點閉合傳感器和門鎖。它還可用于管理您的RFID卡以及為特定用戶分配特定門的權限。自動重新鎖定計時器可監(jiān)控門被鎖定的時間長度,并在一段時間后重新鎖定,因此您無需擔心技術人員忘記鎖門。安全和審計報告可以顯示您有權訪問數(shù)據(jù)中心的不同區(qū)域,以防您需要對事件進行取證分析。
降低停機風險是保持數(shù)據(jù)中心平穩(wěn)運行的關鍵。當與整個數(shù)據(jù)中心的智能PDU,環(huán)境傳感器和其他儀器配合使用時,數(shù)據(jù)中心監(jiān)控可以提供所需的檢查和平衡,以降低人為錯誤的風險并保持正常運行時間和可用性。
【深圳計通】深圳市計通智能技術有限公司成立于1998年,屬國家高新技術企業(yè)、廣東省專精特新企業(yè),是國內(nèi)領先的智能監(jiān)控數(shù)字化解決方案提供商。公司以“客戶安、員工安、企業(yè)安”的“計通三安文化”為基石,始終秉承“智能監(jiān)控 計通好用”的理念,致力為全球數(shù)智化建設提供優(yōu)質(zhì)的產(chǎn)品和服務。
公司充分融合物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等創(chuàng)新技術,打造出一系列具有行業(yè)特色的智能監(jiān)控數(shù)字化解決方案,廣泛應用于民航機場、金融系統(tǒng)、軌道交通、電力系統(tǒng)、工業(yè)互聯(lián)網(wǎng)、IDC數(shù)據(jù)中心等行業(yè)?,F(xiàn)已擁有3000+核心客戶,10000+精品案例,客戶遍布全國及海外。