限電情況下的數(shù)據(jù)中心如何確保穩(wěn)定運(yùn)行
根據(jù)UptimeInstitute發(fā)布的2020年度數(shù)據(jù)中心掉線調(diào)查報(bào)告顯示,斷電在數(shù)據(jù)中心故障中的地位已經(jīng)超越人為失誤,成為第一大服務(wù)中斷原因。數(shù)據(jù)顯示,在2020年發(fā)生的數(shù)據(jù)中心故障中,大約有37%與電源有關(guān),22%與軟件、系統(tǒng)相關(guān),17%與網(wǎng)絡(luò)有關(guān),其次則為13%問(wèn)題來(lái)自制冷系統(tǒng)的故障。
應(yīng)對(duì)限電要做好哪些準(zhǔn)備
一、做好基礎(chǔ)設(shè)施準(zhǔn)備
做好基礎(chǔ)保障系統(tǒng)的冗余,依舊是建設(shè)、運(yùn)維數(shù)據(jù)中心的必要工作。
雙路以上的市電供電,可支持設(shè)備運(yùn)行一定時(shí)間的UPS和蓄電池,可連續(xù)供電十?dāng)?shù)個(gè)小時(shí)或者更長(zhǎng)時(shí)間的柴發(fā),或者龐大的儲(chǔ)能系統(tǒng),以及蓄冷裝置等……還有2N或者更多的冗余。
二、災(zāi)備演練加強(qiáng)業(yè)務(wù)存續(xù)能力
完備的硬件并不是萬(wàn)無(wú)一失的保證,在日常,應(yīng)該有規(guī)律的在不影響業(yè)務(wù)環(huán)境的情況下進(jìn)行斷電測(cè)試,并且進(jìn)行業(yè)務(wù)遷移等演練,以備不時(shí)之需。
同時(shí)要加強(qiáng)對(duì)當(dāng)前系統(tǒng)的了解,數(shù)據(jù)中心的運(yùn)維人員必須知道所有設(shè)備的資料,每一時(shí)刻的耗能情況。一旦斷電發(fā)生,哪些設(shè)備需要優(yōu)先供電,哪些設(shè)備應(yīng)該放棄等。每一次演練,都需要做完善的記錄,對(duì)于過(guò)程中產(chǎn)生的問(wèn)題、故障,要有完善的日志和解決方案。
在斷電恢復(fù)中,設(shè)備的啟動(dòng)順序,以及設(shè)備的依賴、連接情況。當(dāng)眾多設(shè)備重新加電啟動(dòng),對(duì)于供電系統(tǒng)穩(wěn)定性的影響等,都要有了解以及預(yù)案。
三、做好基礎(chǔ)設(shè)施日常維護(hù)
通過(guò)對(duì)設(shè)備的正確維護(hù)和保養(yǎng),保障機(jī)房設(shè)備穩(wěn)定、可靠、節(jié)能運(yùn)行,確保通信設(shè)備的運(yùn)行環(huán)境,延長(zhǎng)設(shè)備的生命周期,降低設(shè)備的故障率。
1、數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維的主要任務(wù):
(1)維護(hù)機(jī)房設(shè)施,延長(zhǎng)設(shè)備的使用周期。
(2)改造機(jī)房設(shè)施,適應(yīng)各種需求。
(3)合理運(yùn)行設(shè)施,降低運(yùn)營(yíng)成本。
(4)保證各類運(yùn)行設(shè)備設(shè)施的電氣性能、機(jī)械性能、維護(hù)技術(shù)指標(biāo)符合標(biāo)準(zhǔn)。
(5)加強(qiáng)運(yùn)行設(shè)備維護(hù)管理,做好預(yù)防性維護(hù),保證設(shè)備穩(wěn)定、可靠地運(yùn)行。
(6)及時(shí)排除安全隱患,防止重大安全事故的發(fā)生。
(7)完善應(yīng)急保障方案,減少故障率。
(8)積極采用新技術(shù),改進(jìn)維護(hù)方法,提高工作效率。
(9)合理調(diào)整系統(tǒng)配置,提高效率,延長(zhǎng)各類設(shè)備使用壽命。
(10)加強(qiáng)用電管理,降低能耗,節(jié)約運(yùn)行維護(hù)費(fèi)用。
(11)保持設(shè)備和環(huán)境整潔。
2、電氣配電系統(tǒng)維護(hù)
▲低壓配電系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)人工倒換備用電源設(shè)備時(shí),必須遵守有關(guān)技術(shù)規(guī)定,嚴(yán)防人為差錯(cuò)。
(2)要定期試驗(yàn)信號(hào)繼電器的動(dòng)作和指示燈是否正常。
(3)加強(qiáng)對(duì)配電設(shè)備的巡視、檢查。主要內(nèi)容如下:
●繼電器開(kāi)關(guān)的動(dòng)作是否正常,接觸是否良好。
●熔斷器的溫升應(yīng)低于80℃。
●螺絲有無(wú)松動(dòng)。
●智能儀表顯示是否正常。
▲發(fā)電機(jī)系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)機(jī)組應(yīng)保持清潔,無(wú)漏油、漏水、漏氣、漏電(簡(jiǎn)稱四漏)現(xiàn)象。機(jī)組上的部件應(yīng)完好無(wú)損,接線牢靠,儀表齊全、指示準(zhǔn)確,無(wú)螺絲松動(dòng)。
(2)根據(jù)各地區(qū)氣候及季節(jié)情況的變化,應(yīng)選用適當(dāng)標(biāo)號(hào)的燃油和機(jī)油。
(3)保持機(jī)油、燃油及其容器的清潔,定時(shí)清洗和更換(機(jī)油、燃油和空氣)濾清器。油機(jī)外部運(yùn)轉(zhuǎn)件,要定期補(bǔ)加潤(rùn)滑油。
(4)啟動(dòng)電池應(yīng)經(jīng)常處于穩(wěn)壓浮充狀態(tài),每月檢查一次充電電壓及電解液液位。
(5)市電停電后應(yīng)能在15分鐘內(nèi)正常啟動(dòng)并供電,需延時(shí)啟動(dòng)供電的,應(yīng)報(bào)上級(jí)主管部門審批。
3、UPS系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)各種自動(dòng)、告警和保護(hù)功能均應(yīng)正常。
(2)對(duì)于并聯(lián)冗余系統(tǒng)宜在穩(wěn)壓并機(jī)均分負(fù)荷的方式下運(yùn)行。
(3)各地根據(jù)當(dāng)?shù)厥须婎l率的變化情況,選擇合適的跟蹤速率。對(duì)于市電頻率變化過(guò)快的地區(qū),UPS的工作方式宜采用內(nèi)同步。
4、蓄電池系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)每組至少選2只標(biāo)示電池,作為了解全組工作情況的參考。
(2)不同規(guī)格、不同廠家的電池禁止在同一直流供電系統(tǒng)中使用;不同年限的電池不宜在同一直流供電系統(tǒng)中使用。
(3)密封電池在使用前不需進(jìn)行初充電,但應(yīng)進(jìn)行補(bǔ)充充電,補(bǔ)充充電方式應(yīng)按說(shuō)明書(shū)規(guī)定進(jìn)行。