數(shù)據(jù)中心電源是設(shè)計(jì)和運(yùn)行數(shù)據(jù)中心的基本要素。一次簡單的電源故障可能是一場大災(zāi)難,造成嚴(yán)重影響,尤其是隨著越來越多的公司轉(zhuǎn)向托管服務(wù)和云解決方案,數(shù)據(jù)中心的數(shù)量正在飆升。一個可靠的供配電系統(tǒng)是保持?jǐn)?shù)據(jù)中心的高效和安全,并將經(jīng)濟(jì)損失降到最低的必要條件。這篇文章是為那些想了解數(shù)據(jù)中心的電力系統(tǒng)、電力故障的原因以及應(yīng)對方法的你準(zhǔn)備的。
供配電系統(tǒng)是數(shù)據(jù)中心最多的子系統(tǒng)之一。通過不同的設(shè)備,系統(tǒng)可以根據(jù)數(shù)據(jù)中心的大小和規(guī)模而變化。
確定數(shù)據(jù)中心的可靠性有一個四級等級系統(tǒng),從一級到四級。Tier I 通常用于小型企業(yè),而 Tier IV 數(shù)據(jù)中心通常用于提供額外發(fā)電機(jī)組以實(shí)現(xiàn)冗余的企業(yè)。下圖將以Tier IV數(shù)據(jù)中心的簡化圖示為例,展示數(shù)據(jù)中心內(nèi)的電源系統(tǒng)。
圖 1:數(shù)據(jù)中心的電力系統(tǒng)
通常,來自電力設(shè)施的功率可能非常高。有一個變壓器通過自動轉(zhuǎn)換開關(guān) (ATS) 將高壓降低到安全水平。由于電力供應(yīng)商無法保證隨時(shí)隨地的完美供電,且無法冗余接入公用電網(wǎng),因此數(shù)據(jù)中心至少連接一臺柴油或燃?xì)鈧溆冒l(fā)電機(jī),為支持的服務(wù)器或服務(wù)器提供備用電源。其他數(shù)據(jù)中心設(shè)備。一旦電源中斷,轉(zhuǎn)換開關(guān)將向備用發(fā)電機(jī)發(fā)出信號以啟動,以便為數(shù)據(jù)中心設(shè)備提供發(fā)電。
但是,從啟動發(fā)電機(jī)到提供全功率需要一點(diǎn)時(shí)間。不間斷電源(UPS)作為備用電源起到彌合時(shí)間差距的作用。想了解更多關(guān)于UPS的詳細(xì)信息,可以參考什么是不間斷電源或UPS。通常有一個維護(hù)旁路面板 (MBP),使 UPS 可以運(yùn)行到維護(hù)旁路模式,并在系統(tǒng)斷電進(jìn)行維修時(shí)實(shí)現(xiàn)無負(fù)載中斷。最終,電源將連接到配電單元 (PDU),配電單元連接到一系列遠(yuǎn)程配電盤 (RPP)。然后將不同的機(jī)架 PDU 插入 RPP 的不同插座盒中,作為冗余電源鏈的一部分。這就是供電系統(tǒng)的工作原理。
數(shù)據(jù)中心的電力系統(tǒng)故障可能以系統(tǒng)停止、數(shù)據(jù)丟失、變壓器發(fā)熱、損壞停機(jī)或其他任何形式發(fā)生。這些現(xiàn)象會引發(fā)一系列前所未有的事件,從而導(dǎo)致數(shù)據(jù)中心的巨大損失。那么供配電系統(tǒng)怎么會出現(xiàn)停電呢?既有雷電天氣或硬件故障等自然因素,也有人為災(zāi)害,其中人為因素占停電原因的很大一部分。此處列出了導(dǎo)致數(shù)據(jù)中心電源故障的一些常見人為因素。
在設(shè)計(jì)數(shù)據(jù)中心的過程中,數(shù)據(jù)中心功率容量的估計(jì)不準(zhǔn)確。它可以走向兩個極端:電力容量未充分利用或需求超過電力供應(yīng)。高估容量可能會導(dǎo)致容量未被使用,這意味著數(shù)據(jù)中心將用其整個生命周期來支持設(shè)備的過高安裝成本和維護(hù)。而低估所需的電力容量可能會在耗電 IT 設(shè)備和電力消耗增長時(shí)導(dǎo)致電力中斷。
動力設(shè)備選擇不當(dāng)與上述估算因素有關(guān)。為了跟上不斷增長的業(yè)務(wù),許多數(shù)據(jù)中心正在部署越來越多的高密度服務(wù)器,這促使配電系統(tǒng)接近峰值容量。當(dāng)?shù)凸阑蚋吖离娏ω?fù)荷時(shí),電壓值不合適的電力設(shè)備將影響數(shù)據(jù)中心的正常運(yùn)行。例如,UPS 的電源電壓值與服務(wù)器的電源電壓值不匹配會導(dǎo)致過載并導(dǎo)致 UPS 剝離。另一方面,有時(shí)客戶會被一些電力設(shè)備廠商的廣告所誤導(dǎo),而忽略了對可靠性的實(shí)際檢驗(yàn)。質(zhì)量問題或最大性能指標(biāo)不準(zhǔn)確都會影響配電系統(tǒng)。
不合理的電力系統(tǒng)設(shè)計(jì)和建設(shè)有其隱患,可能引發(fā)隱患。如果設(shè)計(jì)將多個電源設(shè)備連接到電源線中的一個點(diǎn),則可能會因負(fù)載過大而導(dǎo)致電源故障。例如,如果只有單個 PDU 連接多個大功率組件,一旦單個 PDU 發(fā)生故障,數(shù)據(jù)中心電源系統(tǒng)將停止運(yùn)行。布線不良也可能使系統(tǒng)出現(xiàn)故障。如果電纜長度不符合保持設(shè)備正常性能的要求或布局混亂,則可能導(dǎo)致過熱導(dǎo)致系統(tǒng)關(guān)閉。
電力系統(tǒng)的可靠性對數(shù)據(jù)中心來說非常重要,那么如何保證優(yōu)質(zhì)的電力呢?以下是一些關(guān)于防止數(shù)據(jù)中心電力系統(tǒng)故障的建議。
這通常是設(shè)計(jì)數(shù)據(jù)中心時(shí)首先要問的問題之一:“數(shù)據(jù)中心在預(yù)期壽命期間的功率容量是多少?” 通常,典型數(shù)據(jù)中心設(shè)施的生命周期將跨越幾代 IT 設(shè)備。做好數(shù)據(jù)中心容量規(guī)劃,使IT設(shè)備的電力需求與電力設(shè)備的容量保持一致,對數(shù)據(jù)中心的有效性至關(guān)重要。評估當(dāng)前電力容量的第一步是了解 IT 設(shè)備、冷卻系統(tǒng)、照明和關(guān)鍵電力負(fù)載的電力需求。隨著大功率設(shè)備越來越多地被采用,平均功耗也在上升。管理人員應(yīng)該為 IT 設(shè)備機(jī)架提供越來越多的數(shù)據(jù)中心電源容量,這就是我們看到部署越來越多機(jī)架 PDU 的原因。
在準(zhǔn)確評估了數(shù)據(jù)中心的電力容量需求之后,就到了為數(shù)據(jù)中心配備合適設(shè)備的過程。合適的電源系統(tǒng)可以最大限度地降低電源故障的風(fēng)險(xiǎn)。雙電源組件,如雙PDU,建議支持冗余。此外,必須考慮 IT 設(shè)備產(chǎn)生的諧波電流。可以應(yīng)用隔離變壓器來減輕諧波電流的影響。
電力設(shè)備和IT設(shè)備的日常物理檢查是確保所有系統(tǒng)處于良好工作狀態(tài)的必要過程。例如,UPS 和電池的定期維護(hù)對于最大程度地減少停電問題的可能性至關(guān)重要。確定基礎(chǔ)設(shè)施的變化,以免遺漏一些對整個系統(tǒng)產(chǎn)生重大影響的細(xì)節(jié),減少電能使用量,延長設(shè)備壽命,從而避免人工成本和更換設(shè)備的成本。
確保您的數(shù)據(jù)中心擁有強(qiáng)大的電力系統(tǒng)對于促進(jìn)業(yè)務(wù)的平穩(wěn)運(yùn)行至關(guān)重要。一些數(shù)據(jù)中心電力系統(tǒng)的問題可以通過采取以上一些措施得到控制。因此,重要的是對電力系統(tǒng)進(jìn)行有效的準(zhǔn)備,盡可能降低風(fēng)險(xiǎn),從而提高競爭力并為企業(yè)獲得更多利潤。