微信因光纜被挖斷導致宕機,通訊光纜再遇安全危機
發(fā)布時(shí)間:2013-08-09 新聞來(lái)源:中國電線(xiàn)電纜網(wǎng)
一次城建工人的失誤,造成了微信史上最大規模的一次宕機,也讓這個(gè)擁有4億用戶(hù)的超級即時(shí)通訊工具面對了自上線(xiàn)以來(lái)的最大危機。
從通訊中斷后的修護時(shí)間之長(cháng),到光纜被挖斷后的應急方案之弱,都讓外界注意到,微信乃至中國互聯(lián)網(wǎng)產(chǎn)業(yè)體系中曾被忽視的安全軟肋。
宕機之后,微信團隊恢復通訊的時(shí)間是6個(gè)小時(shí),這在互聯(lián)網(wǎng)乃至通信行業(yè)里都極為罕見(jiàn),尤其是曾被認為需要向互聯(lián)網(wǎng)學(xué)習的通信運營(yíng)商,重新成為騰訊需要學(xué)習的對象。
“網(wǎng)絡(luò )再爛的運營(yíng)商,也基本不會(huì )出現全網(wǎng)中斷;即使有局部地區短信中斷或話(huà)路中斷,基本也很少超過(guò)一個(gè)小時(shí)。甚至在雅安地震這樣的災難事件中,運營(yíng)商也做到了在一小時(shí)內恢復75%的通信。”一位運營(yíng)商人士告訴記者。
微信為何中斷
實(shí)際上,這并不是微信第一次發(fā)生宕機事故。4月10日,微信曾因機房故障發(fā)生10分鐘的中斷。
但與上一次的短暫中斷不同,此次長(cháng)達6小時(shí)的嚴重事故,具有更大的影響與意義,僅其引發(fā)的7月23日股價(jià)波動(dòng),就讓騰訊蒸發(fā)了近百億市值。
作為中國最大的互聯(lián)網(wǎng)公司之一,騰訊究竟為微信配置了怎樣的基礎架構,是如何保證機房數據安全、順暢的?為何因為2根光纜的中斷,就出現如此致命的網(wǎng)絡(luò )問(wèn)題?
實(shí)際上,微信在全國的機房架構均是遵循交互式的布局方式,因為不能將所有的雞蛋都放置到同一個(gè)籃子里。面對4億用戶(hù)群體,微信不可能、也不會(huì )將所有的用戶(hù)集中在一家服務(wù)器上。也就是說(shuō)北京的用戶(hù)數據不全存儲在北京的機房里上,有可能存儲在上海、廣東等地的機房。而上海的光纜斷了,會(huì )影響到存儲到本地的北京、上海、廣東、浙江等地的用戶(hù)。
一般來(lái)說(shuō),大型公司為保證機房數據安全會(huì )設置光纖通信雙保護,一旦其中一條光纜出現故障,可迅速切入另一條光纜,以保證數據傳輸!敦斀(jīng)國家周刊》記者了解到,此次,騰訊與上海運營(yíng)商合作,已明確要求使用雙光纜。
但從此次的宕機故障來(lái)看,這兩條光纜卻還是被放在了同一個(gè)管道中,變成了“雙光纜、單路由”。
這就好比為了防止堵車(chē),運營(yíng)商應該為騰訊提供兩條不同的路,一旦A車(chē)被堵在了A路上,任務(wù)可由B車(chē)通過(guò)B路完成。但現在,兩條路卻重疊在了一起,并且同時(shí)中斷。
據悉,之前因為雙光纜單路由的設置,曾導致QQ連接故障,所以騰訊一些重要的機房被改為雙光纜雙路由。但這個(gè)經(jīng)驗顯然未被復制到微信上。“同時(shí)受到光纜被砍斷影響的業(yè)務(wù)還有QQ的其他一些業(yè)務(wù)。”騰訊公關(guān)部總經(jīng)理助理張軍電話(huà)里對記者說(shuō)。
對于用戶(hù)規模越來(lái)越大的騰訊,其在基礎設施的花費也變得龐大起來(lái)。騰訊財報顯示,“移動(dòng)及電信收費以及頻寬及服務(wù)器托管費”位列開(kāi)支項目中前三。從2004年到2012年期間,增長(cháng)超過(guò)10倍,從3.16億元增至34.08億元。
宕機后遺癥
微信宕機事件,再一次為互聯(lián)網(wǎng)企業(yè)們拉響了警鐘。
當前,在信息化浪潮的沖擊下,每個(gè)國家的政治、軍事、經(jīng)濟、民生,乃至每個(gè)人的生活與娛樂(lè ),都越來(lái)越依賴(lài)互聯(lián)網(wǎng),一旦互聯(lián)網(wǎng)自身出現安全問(wèn)題,所造成的影響將在更大的領(lǐng)域擴散,甚至可能引發(fā)更大危機。
事實(shí)上,騰訊不是第一個(gè)、也絕不可能是最后一個(gè)出現宕機現象的互聯(lián)網(wǎng)公司。在此之前,新浪微博就曾兩度出現宕機現象,而Google、維基百科也曾因各種原因數度宕機。
對互聯(lián)網(wǎng)公司來(lái)說(shuō),每一次宕機,都有可能導致大量的用戶(hù)離開(kāi)。據IDC調查顯示,1990-2000年間,美國發(fā)生過(guò)數據災難的公司中,55%當時(shí)倒閉,29%在兩年內倒閉,生存下來(lái)的僅占16%。
調研機構Qualix Group的一組數字,更說(shuō)明了不同行業(yè)關(guān)鍵業(yè)務(wù)中斷帶來(lái)的金錢(qián)損失:服務(wù)器宕機1分鐘,平均會(huì )使運輸業(yè)損失15萬(wàn)美元,銀行業(yè)損失27萬(wàn)美元,通信業(yè)損失35萬(wàn)美元,制造業(yè)損失42萬(wàn)美元,證券業(yè)損失45萬(wàn)美元……
而涉及到政府、國防、安全、電信、金融、交通和醫療等關(guān)系到國計民生的行業(yè)的關(guān)鍵業(yè)務(wù),需要遵循“5個(gè)9(99.999%)”、“6個(gè)9”、甚至是“7個(gè)9”的標準。這意味著(zhù)一臺服務(wù)器每年的非計劃停機時(shí)間分別只有5分鐘、30秒和3秒鐘。
綜合來(lái)看,目前出現的各類(lèi)宕機,可以歸結為六大類(lèi):網(wǎng)絡(luò )故障、應用系統本身產(chǎn)生的問(wèn)題、基礎設施問(wèn)題、系統部署方案不合理,人為原因(如黑客攻擊)以及硬件故障。
【打印】 【關(guān)閉】
分享到: | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |