服務(wù)器宕機對互聯(lián)網(wǎng)及傳統(tǒng)行業(yè)的影響及應(yīng)對策略
宕機是一件讓開發(fā)和運維人員都感到恐懼的事情。如果服務(wù)器宕機了,服務(wù)商和訪客都會受到難以估量的影響,訪客對網(wǎng)站品牌的信任度會大幅降低。在互聯(lián)網(wǎng)企業(yè)中,超過 80%的工程師的工作會受到影響,大量技術(shù)人員無法正常工作,因此,服務(wù)穩(wěn)定性的重要性是非常明顯的。
什么是宕機的影響
宕機帶來的影響較為深遠。例如,對于一個電商平臺而言,在像雙 11 這樣的購物高峰時段,若某地的數(shù)據(jù)中心 24 小時出現(xiàn)故障,那么該地區(qū)的顧客就無法進行下單付款操作。這會導(dǎo)致服務(wù)商的聲譽受到損害,有可能會使大量顧客流失。在傳統(tǒng)行業(yè)中,像銀行系統(tǒng)宕機的情況,儲戶在一段時間內(nèi)無法進行交易,從而引發(fā)了大眾的恐慌情緒。
宕機會引發(fā)多方面的問題。其一,訪客無法正常使用服務(wù)。其二,會對后續(xù)的業(yè)務(wù)發(fā)展產(chǎn)生影響。畢竟在當(dāng)今社會,人們對各類服務(wù)已經(jīng)有了很高的依賴度。
多活架構(gòu)的必要性
宕機難以完全避免。在這種情況下,多活架構(gòu)應(yīng)運而生。它的目的在于增強系統(tǒng)的可靠性,提升業(yè)務(wù)的連續(xù)性。如果沒有多活架構(gòu),一旦某個機房出現(xiàn)問題,整個業(yè)務(wù)就會癱瘓,這對企業(yè)而言是致命的。比如某些社交平臺的服務(wù)器,它們承載著大量的用戶數(shù)據(jù)交互,宕機一刻會造成巨大的損失,而多活架構(gòu)是防止這種情況發(fā)生的重要手段。
多活架構(gòu)具備這樣的能力,能使業(yè)務(wù)在多個數(shù)據(jù)中心開展運行。倘若其中一個數(shù)據(jù)中心遭遇故障,那么其他的中心依然能夠保障業(yè)務(wù)持續(xù)正常地運轉(zhuǎn)。通過這種方式,極大地降低了因宕機而引發(fā)的風(fēng)險。
多活架構(gòu)的成本問題
多活架構(gòu)有其優(yōu)勢,然而其成本令人困擾。首先是場地成本方面,例如銀行采用兩地三中心模式,就需要在兩個不同的城市找到三個機房。并且,機房之間必須要有網(wǎng)絡(luò)連接,每一個機房都需要投入大量的硬件設(shè)備。接著是人員成本,在業(yè)務(wù)上線之后,還需要有能夠維護這復(fù)雜多活系統(tǒng)的人員,這樣的人力開銷可不是一個小的數(shù)目。
小型互聯(lián)網(wǎng)企業(yè)面臨這樣的成本時可能難以承受。像那些新興的創(chuàng)業(yè)公司,它們自身的資金狀況比較緊張。要是這些公司要構(gòu)建多活架構(gòu),僅前期投入這一項就會使它們的資金鏈變得十分緊張。
多活基礎(chǔ)架構(gòu)構(gòu)建思路
怎樣的多活基礎(chǔ)架構(gòu)能夠讓客戶以低成本、低門檻進行部署?青云運營副總裁林源提出從以下三個層面來考慮:一是基礎(chǔ)設(shè)施層面,二是基礎(chǔ)架構(gòu)層面,三是分布式應(yīng)用層面。其中,負載均衡器進行多機房部署是一個方向,例如在北京的三個數(shù)據(jù)中心都部署負載均衡器,即便其中某個數(shù)據(jù)中心出現(xiàn)宕機的情況,負載均衡服務(wù)依然能夠正常提供。
網(wǎng)絡(luò)連通是構(gòu)建中面臨的難題。若要進行多中心部署業(yè)務(wù),就需要解決網(wǎng)絡(luò)互聯(lián)的問題,這可以通過多種方式,像 VPC 等去解決。并且數(shù)據(jù)庫也極為關(guān)鍵,青云的多活數(shù)據(jù)庫,即便中心出現(xiàn)宕機情況,也不會影響數(shù)據(jù)庫的運行。如此一來,用戶只需去解決應(yīng)用層和中間件部分的問題,就能讓多活業(yè)務(wù)的部署變得簡單且廉價。
混合云下的多活架構(gòu)
如果用戶采用的是混合云架構(gòu),那么能否運用多活架構(gòu)?這對于有著混合云需求的企業(yè)而言是一個重要的問題。有些企業(yè)的業(yè)務(wù)部分處于公有云,部分處于自身的私有云環(huán)境之中。倘若能夠在混合云的情況下實現(xiàn)多活,那么對于提升業(yè)務(wù)的穩(wěn)定性將會有很大的幫助。
企業(yè)的一些核心敏感數(shù)據(jù)存放在私有云,而對外服務(wù)相關(guān)的業(yè)務(wù)在公有云。倘若能夠構(gòu)建多活架構(gòu),那么就能夠確保整體業(yè)務(wù)不會受到過多的宕機影響。
多活架構(gòu)的可靠性和全面性
多活架構(gòu)的可靠性是極為重要的。在從數(shù)據(jù)中心的選擇開始,一直到帶寬連接,以及各個組件,都需要經(jīng)受住考驗。如果不靠譜的組件或者連接出現(xiàn)了問題,那么多活架構(gòu)就失去了其原本的意義。
全面性是一個方面。青云的多活架構(gòu)不僅可在公有云使用,在混合云、私有云也具備全面交付能力。這種情況能滿足不同企業(yè)的各種需求。這使得企業(yè)在進行選擇時更有信心,無需擔(dān)心自身的業(yè)務(wù)架構(gòu)不兼容。
大家對于多活架構(gòu)現(xiàn)在還有哪些憂慮?希望大家能在評論區(qū)踴躍地分享自身的看法,同時也請大家給本文點贊并且進行轉(zhuǎn)發(fā),以使更多的人知曉多活架構(gòu)。
作者:小藍
鏈接:http://www.tymcc.com.cn/content/6108.html
本站部分內(nèi)容和圖片來源網(wǎng)絡(luò),不代表本站觀點,如有侵權(quán),可聯(lián)系我方刪除。