近日,維諦(Vertiv,原艾默生網(wǎng)絡(luò)能源)主辦的“思無界·設(shè)享V來—2018設(shè)計院專家高端論壇”在北京隆重召開。論壇以“關(guān)鍵技術(shù)成就可靠與節(jié)能的完美平衡”為主題,來自權(quán)威設(shè)計院的技術(shù)大咖及維諦(Vertiv)的產(chǎn)品技術(shù)專家,針對數(shù)據(jù)中心的發(fā)展趨勢,從技術(shù)應(yīng)用、規(guī)劃設(shè)計以及供配電、熱管理關(guān)鍵系統(tǒng)的選擇等維度呈獻(xiàn)了多個精彩的技術(shù)報告,并分享了維諦(Vertiv)的科技創(chuàng)新成果及大量成功實踐。
一直以來供配電系統(tǒng)作為數(shù)據(jù)中心基礎(chǔ)設(shè)施主要組成部分,它的高可靠、高可用性、高節(jié)能性能高可維護(hù)性在數(shù)據(jù)中心行業(yè)備受關(guān)注,因此對于數(shù)據(jù)中心供配電技術(shù)的研究也從未中斷。當(dāng)前圍繞數(shù)據(jù)中心供配電技術(shù)、產(chǎn)品、應(yīng)用和整體解決方案也逐漸向標(biāo)準(zhǔn)化、系統(tǒng)化的方向發(fā)展,選擇綠色的、經(jīng)濟(jì)的、高效的、可用性高的供配電系統(tǒng)已經(jīng)成為數(shù)據(jù)中心建設(shè)和運維行業(yè)的共識。
中國科學(xué)院計算所高級工程師李成章先生
對此,中國科學(xué)院計算所高級工程師李成章在《數(shù)據(jù)中心供配電系統(tǒng)的可用性分級管理》的演講中,深入探討了高性價比的數(shù)據(jù)中心供配電解決方案追求的核心價值,并指出要根據(jù)數(shù)據(jù)中心的不同用戶對可靠性、效率、成本的不同業(yè)務(wù)需求來選擇最適合的UPS產(chǎn)品及其對應(yīng)的供配電系統(tǒng)的可用性級別和架構(gòu),從而獲得最佳的TCO。
誘發(fā)數(shù)據(jù)中心供配電系統(tǒng)故障的幾大因素
在造成數(shù)據(jù)中心癱瘓的原因中,以因供配電系統(tǒng)的產(chǎn)品選型和設(shè)計架構(gòu)的”考慮欠妥”所誘發(fā)的電氣癱瘓的危害性最大。相關(guān)的統(tǒng)計資料顯示,它存在如下幾種典型的故障隱患:
(1)因UPS供電系統(tǒng)的產(chǎn)品或可用性級別的”選配欠妥”所誘發(fā)的故障占29%;
(2)因人為操作“失誤”所誘發(fā)的故障占24%(例:2017年5月,因托管機(jī)房的工程師對UPS供配系統(tǒng)的輸入開關(guān)執(zhí)行”誤關(guān)斷”操作而致使某國外航空公司的幾乎所有的IT設(shè)備進(jìn)入”宕機(jī)癱瘓”的事故);
(3)因未考慮到發(fā)電機(jī)帶電容性負(fù)載的帶載能力會“變?nèi)酢耙约耙螂A躍性負(fù)載的“負(fù)載突增量過大”等原因所誘發(fā)的發(fā)電機(jī)“自動關(guān)機(jī)”的故障占10%;
(4)因氣候及自然災(zāi)害所誘發(fā)的故障占12%(例:2017年12月,國外某機(jī)場因電力電纜的火災(zāi)所造成的長達(dá)十余小時的大面積停電事故)。
顯而易見,能否消除掉上述的、足以對供配電系統(tǒng)的安全運行造成“致命危害”的故障隱患是能否確保該數(shù)據(jù)中心機(jī)房能長期可靠地運行的關(guān)鍵所在,以便為在后期的機(jī)房的日常運維操作過程中,能夠及時地發(fā)現(xiàn)和規(guī)避這些風(fēng)險、確保它能獲得令人滿意的可用性(99.99%∽99.999%)奠定下堅實的技術(shù)基礎(chǔ)。根據(jù)GB50174—2017數(shù)據(jù)中心設(shè)計規(guī)范的要求,對于負(fù)責(zé)向IT/網(wǎng)絡(luò)等關(guān)鍵設(shè)備供電的供配電系統(tǒng)而言,它所允許的瞬間供電中斷時間應(yīng)小于10ms。
通過對近年來發(fā)生在數(shù)據(jù)中心供配電系統(tǒng)中的多起事故的分析發(fā)現(xiàn):同工頻機(jī)UPS供配電系統(tǒng)相比,導(dǎo)致傳統(tǒng)高頻機(jī)UPS和模塊化UPS供配電系統(tǒng)的故障率增高的重要誘因是:因為它們的抗瞬態(tài)輸入過壓保護(hù)的能力“變差“所致。通過在用戶現(xiàn)場所捕捉到的輸入故障波形以及在所搭建的故障模擬平臺上所檢測到數(shù)據(jù)可見:因“輸入瞬態(tài)過壓”而致使傳統(tǒng)高頻機(jī)和模塊化UPS的典型故障類型有:因電池組異常放電所誘發(fā)的電池組使用壽命縮短;在UPS供配電系統(tǒng)的輸出端發(fā)生輸出閃斷或“被損環(huán)”的事故。其故障高發(fā)期是:
(a)當(dāng)10KV高壓因故發(fā)生停電/閃斷事故時或位于這些UPS供電系統(tǒng)上游側(cè)的大容量ATS開關(guān)因故需執(zhí)行切換操作的瞬間。在此期間,在UPS的輸入端出現(xiàn)“輸入瞬態(tài)過壓”故障的幾率很高;
(b)為降低生產(chǎn)成本和充分利用廉價電能(注:夜間谷期電價僅為白天峰期電價的1/3左右),高能耗企業(yè)可能會采用夜間生產(chǎn)、白天停工的生產(chǎn)管理體制。對于地處鄰近高能耗企業(yè)的數(shù)據(jù)中心而言,極易在高能耗企業(yè)“突然抽閘”的瞬間,在它的市電輸入電網(wǎng)上誘發(fā)出”瞬態(tài)輸入高壓”。在此條件下,易發(fā)生電池組異常放電故障,從而造成電池組使用壽命縮短,增加后期運維成本。
李成章在演講中以某數(shù)據(jù)中心的供配電系統(tǒng)故障為例,指出在該數(shù)據(jù)中心的運行中,因故遇到10KV高壓電網(wǎng)發(fā)生停電幾分鐘的電力事故,導(dǎo)致運行僅1年多的3*300KVA高頻UPS并機(jī)系統(tǒng)發(fā)生故障:UPS并機(jī)系統(tǒng)輸出“閃斷”,并長期停留在交流旁路上。與此同時,位于同一機(jī)房中的已運行十幾年的另外兩套3*800KVA工頻機(jī)UPS并機(jī)系統(tǒng)卻一直正常地運行著。由此不難看出:此次事故就是因傳統(tǒng)高頻機(jī)UPS抗“瞬態(tài)輸入過壓”的保護(hù)能力”變差”所誘發(fā)出的故障,給該數(shù)據(jù)中心所需的應(yīng)持續(xù)穩(wěn)定運行帶來負(fù)面影響。
“電池組異常放電”的故障案例:對于同時配置有工頻機(jī)UPS和傳統(tǒng)高頻機(jī)UPS的某數(shù)據(jù)中心而言,在其運行中,常發(fā)現(xiàn):對于它的4*500KVA高頻機(jī)UPS供電系統(tǒng)而言,在每天的早上的7∽8點期間,易發(fā)生”電池異常放電”現(xiàn)象。與此同時,對于位于同一10KV供電網(wǎng)下運行的4*400KVA工頻機(jī)UPS供電系統(tǒng),它卻繼續(xù)正常運行,從未發(fā)生過”電池組異常放電”的現(xiàn)象。
除此之外,李成章還舉例指出:隨著模塊化UPS內(nèi)部所并聯(lián)的電源模塊的數(shù)量的不斷地增多(例:從傳統(tǒng)高頻塔式機(jī)的內(nèi)置2-3個功率模塊增加到傳統(tǒng)模塊化UPS的內(nèi)置10-20個電源模塊),它的“內(nèi)部環(huán)流”必然會隨之而增大。由此所帶的新故障現(xiàn)象是:當(dāng)用戶在因故對這種模塊化UPS執(zhí)行停電維修操作之后(例:對機(jī)柜前面板上的“通風(fēng)過濾罩”執(zhí)行除塵清洗操作),再重新執(zhí)行開機(jī)操作時,易發(fā)生UPS輸出閃斷或電源模塊”被損壞”的事故。
高性價比的高頻UPS產(chǎn)品應(yīng)具備的運行特性
由于高頻UPS電源具有效率高、體積小、重量輕以及輸入功率因數(shù)達(dá)到0.99以上、輸入電流的諧波含量小于5%、對市電電網(wǎng)的污染小等優(yōu)點而日益受到用戶的青睞。近年來,隨著UPS制備技術(shù)的進(jìn)步和發(fā)展,為提高它的可維護(hù)性,高頻UPS逐步走向高智能模塊化,可通過增減UPS機(jī)柜內(nèi)的小功率電源模塊數(shù)量的多少來滿足用戶對其功率輸出及可維護(hù)性的要求。這樣一來,它不僅具有極大的彈性,而且只要冗余允許還可以在線進(jìn)行維護(hù),實現(xiàn)”零維修時間”的操作功能。然而,對于部分高頻UPS的生產(chǎn)和開發(fā)企業(yè)來說,由于存在只重視追求更高的效率和更低的制備成本的傾向,不夠重視應(yīng)采取必要的技術(shù)措施來消除傳統(tǒng)高頻機(jī)UPS和模塊化UPS因抗瞬態(tài)輸入過壓保護(hù)能力”變差”所帶來的故障率相對偏高的現(xiàn)象。
近年來,維諦(vertiv)公司遵循”不妥協(xié)的可靠性”的設(shè)計思念,通過在傳統(tǒng)高頻機(jī)UPS的整流器中增配”抗輸入過壓”保護(hù)部件的技術(shù)措施。這樣一來,在確保它能獲得”高效率”優(yōu)點的前提下,還收到能大幅度地提高UPS可靠性以及將高頻機(jī)UPS的輸入功率因數(shù)(PF)從傳統(tǒng)的電容性調(diào)控到所期望的電感性。在此基礎(chǔ)上,開發(fā)出創(chuàng)新型的高性價比的UPS產(chǎn)品。
李成章指出,高性價比的高頻機(jī)UPS應(yīng)該具有效率高(≧97%)、可靠性高(具有很強(qiáng)的抗輸入過壓保護(hù)能力,UPS單機(jī)內(nèi)部環(huán)流=0)、輸入PF呈現(xiàn)電感性、高可維護(hù)性(例:易于對機(jī)內(nèi)的”老化.濾波電容”執(zhí)行現(xiàn)場的更換操作)等特點。只有具備這些特性,才能更好的保障數(shù)據(jù)中心的安全高效運行。在此背景下,不僅能為數(shù)據(jù)中心的供配電系統(tǒng)獲得令人滿意的高可用性奠定下堅實的技術(shù)基礎(chǔ)。而且,還有十分利于降低它的Capex和Opex。
數(shù)據(jù)中心供配電系統(tǒng)的”可用性分級管理”
確保數(shù)據(jù)中心安全無疑是整個信息系統(tǒng)安全運行的前提保障,對此,李成章表示,電癱瘓、熱癱瘓、網(wǎng)絡(luò)安全已然成為當(dāng)今數(shù)據(jù)中心所面臨的三大故障隱患,如何避免及做好提前措施也成為備受關(guān)注的焦點。
同時,李成章基于全新的現(xiàn)場故障分析能力和實踐工作經(jīng)驗,重點闡釋了供配電系統(tǒng)的”分級可用性”的設(shè)計與規(guī)劃。在對金融、交通,BAT及教育、商業(yè)等具有代表性用戶的業(yè)務(wù)特點、允許業(yè)務(wù)中斷的容忍度、IT系統(tǒng)及空調(diào)系統(tǒng)對供電系統(tǒng)的可用性的不同級別需求、IT/網(wǎng)絡(luò)的機(jī)柜功率密度的高低對MDC(微模塊)的設(shè)計架構(gòu)的影響等進(jìn)行全面分析后,李成章指出,采用“可用性分級管理”的設(shè)計理念的最終目標(biāo)是:在充分滿足用戶的不同業(yè)務(wù)需求的前提下,制定和選用具有TCO最低運行特性的供配電系統(tǒng)的設(shè)計方案。
為進(jìn)一步闡釋供配電系統(tǒng)分級可用性理念的重要意義,李成章以金融用戶和BAT用戶的供配電系統(tǒng)需求為例進(jìn)行了說明。他表示,金融行業(yè)(集中處理)與BAT行業(yè)(分布式處理)對數(shù)據(jù)處理、存儲和分享性數(shù)據(jù)傳送的要求具有很大差異,前者要求數(shù)據(jù)應(yīng)具有極高的完整性、一致性和高時效性。為此,其供配電系統(tǒng)的建設(shè)標(biāo)準(zhǔn)應(yīng)采用帶物理隔離運行特性的A級標(biāo)準(zhǔn)。李成章同時指出,即使在金融行業(yè)用戶中,由于總行、省市分行及縣級支行等機(jī)構(gòu)級別的不同,其供配電系統(tǒng)的可用性級別也應(yīng)不相同,在建設(shè)上也有所區(qū)別。
李成章最后表示,只有“根據(jù)用戶對實際運行業(yè)務(wù)的不同需求來決定所選用的可用性級別的最適合的架構(gòu)+最適合的UPS產(chǎn)品”才是最能恰如所需地滿足用戶需求的完美設(shè)計方案。顯然,只有這樣才能更好地為數(shù)據(jù)中心的用戶提供最具有實用價值的服務(wù)和支持。