編者按:在印度著名的軟件服務(wù)出口商Mphasis的IT部門,風(fēng)險主要集中在業(yè)務(wù)流程外包(BPO)操作上。為了緩和公司面臨的風(fēng)險,該公司與其客戶實(shí)行連續(xù)性的計劃。另外,該公司的IT部門使用了一個多層標(biāo)簽交換MPLS網(wǎng)絡(luò)來連接其國內(nèi)的其他分支機(jī)構(gòu)。在最后一公里接入方面,Mphasis采取了冗余保護(hù),采用兩種不同的傳輸媒體互為備份,在其中一條出問題的時候,另一個條線路還可以讓業(yè)務(wù)保持正常。這些應(yīng)對措施令其不僅能輕松應(yīng)對來自人為的風(fēng)險,即使發(fā)生了臺灣地震那樣的自然災(zāi)害,Mphasis的CIO也能高枕無憂,他就是這樣給我們講述了兩個應(yīng)對自然災(zāi)害的故事。
兩項改進(jìn)應(yīng)對資源危機(jī)
【IT168 專稿】盡管應(yīng)對措施非常完善,我們還是曾經(jīng)面臨過一次非常嚴(yán)重的網(wǎng)絡(luò)資源耗盡危機(jī),很多網(wǎng)站遭受著被中斷的危險。后來,我們發(fā)現(xiàn)我們的冗余設(shè)計在服務(wù)商接入點(diǎn)POP上存在問題,在其上聯(lián)處只有一個路由器。這意味著連接到這個特定MPLS服務(wù)商接入點(diǎn)POP的網(wǎng)站被影響了。
幸運(yùn)的是,我們在班加羅爾有一個24x7x365工作的全球網(wǎng)絡(luò)運(yùn)行中心,它可以全天24小時地監(jiān)視我們網(wǎng)絡(luò)的運(yùn)行情況。它發(fā)現(xiàn)了這個問題。而且由于我們及時采取措施,我們不用再去求助于我們的災(zāi)難恢復(fù)計劃了,該計劃將在災(zāi)難發(fā)生4小時后啟動。
根據(jù)這次事故的經(jīng)驗,我們采取了兩個改進(jìn)措施:首先,我們在服務(wù)商接口地方進(jìn)行了冗余設(shè)計;另外我們還將最后一公里接入的其中一條線路轉(zhuǎn)移到第二個服務(wù)商接入點(diǎn)上。這種級別的設(shè)計很容易,同時也讓我們的網(wǎng)絡(luò)可以一直保持不出問題。
雙層ATM環(huán)的保障
我們的系統(tǒng)經(jīng)常遭受到來自大自然的考驗。2004年發(fā)生的海嘯影響了其中一條線路,在另一條線路保持順暢通信的情況下,我們順利恢復(fù)了出故障的線路。另一次是最近臺灣的地震,這次地震對我們的網(wǎng)絡(luò)造成了一定威脅,但是我們把所有數(shù)據(jù)的路由從太平洋線路無縫地切換到了大西洋的線路上,因此這中間沒有一分鐘的斷線。
因此到現(xiàn)在為止,我們還沒有面臨任何真正的危機(jī)。
我們可以實(shí)現(xiàn)這些事情是因為我們的網(wǎng)絡(luò)是一個具有冗余線路的雙層ATM(異步傳輸模式)環(huán)。這意味著我們使用了不同的線纜系統(tǒng),可以在發(fā)生意外情況的時候可以自動切換系統(tǒng)到?jīng)]有故障的線路中。
我從風(fēng)險降低中所學(xué)到的最重要的東西是,IT危機(jī)需要從源頭上解決。CIO們不應(yīng)該在簽訂了一個合約后,整日擔(dān)心其風(fēng)險的發(fā)生,而應(yīng)該在危機(jī)發(fā)生后,甚至危機(jī)發(fā)生前就從源頭上將其徹底解決掉。
點(diǎn)評:從印度軟件服務(wù)出口商Mphasis的IT危機(jī)解決經(jīng)驗中,我們知道在面臨IT危機(jī)的時候,我們要透過危機(jī)的表面現(xiàn)象,查找到引起危機(jī)的真正根源,從根源上真正將危機(jī)解決。無論是技術(shù)性還是管理性問題,解決辦法莫不如此。