(本文編譯自electronicdesign)
在工業(yè)環(huán)境中,網(wǎng)絡(luò)停機常常會導(dǎo)致代價高昂的延誤、生產(chǎn)損失,甚至可能對員工生命構(gòu)成潛在危險。這就是為什么彈性在工業(yè)以太網(wǎng)交換中至關(guān)重要。它使網(wǎng)絡(luò)能夠抵御導(dǎo)致停機的故障、錯誤和干擾。
本文將探討一些工業(yè)以太網(wǎng)交換中網(wǎng)絡(luò)彈性相關(guān)的基礎(chǔ)知識,以及實現(xiàn)這一目標(biāo)的一些關(guān)鍵策略和技術(shù),包括如何實施網(wǎng)絡(luò)冗余機制以及生成樹協(xié)議(STP)。
什么是網(wǎng)絡(luò)彈性?
彈性是指網(wǎng)絡(luò)抵御干擾的能力,以便能夠持續(xù)在可接受的水平上提供服務(wù)。具有彈性的網(wǎng)絡(luò)可確保工廠基礎(chǔ)設(shè)施和關(guān)鍵流程得到高效管理、監(jiān)控和運行。
即使在最佳運行條件下,要維持一個具有高可用性的彈性網(wǎng)絡(luò)也并非易事,而在工業(yè)環(huán)境中還會出現(xiàn)更多其它的挑戰(zhàn)??赡苡绊懢W(wǎng)絡(luò)可靠性和性能的風(fēng)險包括極高的溫度、電氣干擾、意外的網(wǎng)絡(luò)中斷以及惡劣的環(huán)境條件等。
根據(jù)Gartner的估計,制造企業(yè)平均每停機一小時就會損失超過30萬美元。其他研究表明,這一估計可能過于保守,實際數(shù)字可能是該預(yù)估值的兩到三倍。通過在網(wǎng)絡(luò)功能中斷時恢復(fù)其功能,具有彈性的工業(yè)網(wǎng)絡(luò)有助于避免停機以及相關(guān)的成本損失。
一個具有彈性的網(wǎng)絡(luò)基礎(chǔ)設(shè)施力求在其運行中實現(xiàn)99.999%的正常運行時間。這也被稱為網(wǎng)絡(luò)可用性的“五個九”,這意味著每年大約只有六分鐘的停機時間。只有高度具有彈性的網(wǎng)絡(luò)基礎(chǔ)設(shè)施才能滿足這樣的要求。
網(wǎng)絡(luò)冗余與網(wǎng)絡(luò)彈性
網(wǎng)絡(luò)冗余和網(wǎng)絡(luò)彈性這兩個概念常被交替使用。然而,網(wǎng)絡(luò)冗余只是網(wǎng)絡(luò)彈性的一個方面。它是所謂網(wǎng)絡(luò)彈性“四個R” 的一部分,即冗余(Redundancy)、穩(wěn)健性(Robustness)、足智多謀(Resourcefulness)和快速性(Rapidity)。
網(wǎng)絡(luò)冗余是指以額外的物理或虛擬硬件、連接的形式保留一份備份的做法。當(dāng)某個設(shè)備或連接出現(xiàn)故障時,另一個設(shè)備或連接就會接手其工作,網(wǎng)絡(luò)也就能恢復(fù)正常運行。如果沒有備份災(zāi)難恢復(fù)計劃或有效的二層冗余機制,要讓系統(tǒng)重新啟動并運行將會困難重重。
一個常被提及的冗余示例是具備主動模式和待機模式的冗余防火墻。這種配置由一個主單元和一個從單元組成。從單元處于待機模式,處于閑置狀態(tài),同時監(jiān)控著處于活動狀態(tài)的主單元的健康狀況。如果從單元檢測到主單元出現(xiàn)故障,它就會從待機模式切換到活動模式。
這種配置的一種變體是將兩個防火墻都設(shè)置為活動模式,平均分擔(dān)路由和安全策略執(zhí)行的任務(wù)。如果其中一個防火墻出現(xiàn)故障,另一個就能無縫接管其工作,并繼續(xù)履行自身的職責(zé)。
以太網(wǎng)交換冗余協(xié)議
這就引出了工業(yè)以太網(wǎng)交換網(wǎng)絡(luò)冗余的概念。對于這種類型的冗余,冗余網(wǎng)絡(luò)能夠在交換機到交換機的鏈路出現(xiàn)故障時,通過提供一條替代的數(shù)據(jù)路徑來保證網(wǎng)絡(luò)繼續(xù)運行。
為了說明這一點,我們來看一個基本的星型拓撲結(jié)構(gòu)。假設(shè)在一個星型網(wǎng)絡(luò)中(如圖1所示),一個設(shè)備想要向另一個設(shè)備發(fā)送數(shù)據(jù)。在這種情況下,它首先會將信息發(fā)送到位于星型結(jié)構(gòu)中心的連接網(wǎng)絡(luò)設(shè)備,即網(wǎng)絡(luò)交換機,然后由該交換機將數(shù)據(jù)傳輸?shù)街付ǖ脑O(shè)備。
提供多條路徑存在一個明顯的缺點,那就是如果位于中心的網(wǎng)絡(luò)交換機出現(xiàn)故障,所有與之相連的節(jié)點都會失效,并且多個數(shù)據(jù)中心的用戶都無法參與網(wǎng)絡(luò)通信。實際上,單路徑設(shè)計導(dǎo)致的一個嚴重后果是,發(fā)生任何硬件故障、停電或電纜斷開等情況都會中斷所有類型的網(wǎng)絡(luò)通信。
為了克服這些限制并提高冗余性,網(wǎng)絡(luò)管理員可以添加網(wǎng)段或額外的工業(yè)交換機,或者他們也可以采用另一種拓撲結(jié)構(gòu),比如網(wǎng)狀拓撲、鏈路聚合和冗余環(huán)網(wǎng)等。這里需要特別注意的是,只要計算機通過具有冗余路徑的局域網(wǎng)共享信息,就可能會出現(xiàn)環(huán)路問題,并引發(fā)廣播風(fēng)暴。
廣播風(fēng)暴
廣播幀可能會因虛假幀充斥網(wǎng)絡(luò)而受阻,從而導(dǎo)致重要的幀無法進入網(wǎng)絡(luò)或到達目的地。這類幀的兩個主要來源(但并非僅有這兩個來源)包括,一是惡意的拒絕服務(wù)攻擊,二是出現(xiàn)故障的以太網(wǎng)設(shè)備。由于以太網(wǎng)設(shè)備質(zhì)量的提升,近年來后一種情況發(fā)生得越來越少了。錯誤的配置也可能導(dǎo)致這個問題。
一般來說,廣播幀會通過交換機傳送到所有端口。正如其名,它是一種廣播,會發(fā)送給網(wǎng)絡(luò)中的所有設(shè)備。然而,開啟了廣播風(fēng)暴防護功能的交換機,在檢測到過多的廣播幀時,會抑制這些幀,阻止它們在整個網(wǎng)絡(luò)中傳播。
一旦廣播流量減弱,交換機就會再次允許數(shù)據(jù)流量通過,它會自行重置。在大多數(shù)交換機中,這個功能通常是默認開啟的。有些應(yīng)用程序可能會因為需要有意進行流量廣播而要求關(guān)閉該功能,但這種情況非常罕見。
生成樹協(xié)議
為了打破環(huán)路循環(huán)并避免廣播風(fēng)暴,網(wǎng)絡(luò)管理員長期以來一直在使用生成樹協(xié)議(STP),這是一種常用的二層協(xié)議。生成樹協(xié)議通過阻塞所有冗余網(wǎng)絡(luò)端口來防止網(wǎng)絡(luò)環(huán)路的出現(xiàn)。在無環(huán)路的網(wǎng)絡(luò)中,一個端口被阻塞的設(shè)備仍然可以接收數(shù)據(jù),但它不會將接收到的數(shù)據(jù)發(fā)送給網(wǎng)絡(luò)上的其它設(shè)備。
生成樹協(xié)議會禁用那些不屬于生成樹上的鏈路,這樣在任意兩個網(wǎng)絡(luò)節(jié)點之間就只留下一條主路徑和一條活動通道。不過,當(dāng)網(wǎng)絡(luò)確實發(fā)生故障時,設(shè)備仍能夠在網(wǎng)絡(luò)中繼續(xù)通信,因為數(shù)據(jù)可以繞開故障重新進行路由。被選中的端口取決于配置的拓撲結(jié)構(gòu)。
生成樹協(xié)議的三個版本:STP,RSTP,MSTP
生成樹協(xié)議有三個版本:STP(802.1d)、快速生成樹協(xié)議(RSTP,802.1w),以及多生成樹協(xié)議(MSTP,802.1s)。與STP相比,RSTP的主要優(yōu)勢在于其收斂時間更短。當(dāng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)發(fā)生變化時,RSTP通常能夠在5到10秒內(nèi)做出反應(yīng),而STP則可能需要長達50秒的時間。
MSTP是將STP應(yīng)用于虛擬局域網(wǎng)(VLAN)的協(xié)議。MSTP將一組VLAN映射到一個單一的多生成樹實例中。通過確保在一個MST實例中的任意兩個節(jié)點之間僅存在一條活動路徑,從而提高了網(wǎng)絡(luò)性能和穩(wěn)定性。MSTP將一個交換網(wǎng)絡(luò)劃分為多個區(qū)域,并且每個區(qū)域都有多個獨立的生成樹。MSTP不僅有助于網(wǎng)絡(luò)的快速收斂,還能讓來自不同VLAN的數(shù)據(jù)流被分別路由。
以太網(wǎng)網(wǎng)絡(luò)中不能存在環(huán)路。生成樹協(xié)議(如圖2所示)通過禁用其中一條連接來防止環(huán)路的產(chǎn)生。如果其中一條正在工作的連接出現(xiàn)故障,生成樹協(xié)議將會啟用原本被禁用的鏈路,以便重新恢復(fù)網(wǎng)絡(luò)連接。
RSTP與STP的不同之處在于,RSTP使用了更快的算法來對鏈路進行阻塞和解除。MSTP作用于VLAN連接而非物理接口連接,這使得它能夠阻塞來自某個已產(chǎn)生環(huán)路的單個VLAN的數(shù)據(jù),同時讓其它沒有產(chǎn)生環(huán)路的VLAN能夠繼續(xù)使用該鏈路。
其他彈性策略和協(xié)議
除了生成樹協(xié)議(STP)、快速生成樹協(xié)議(RSTP)和多生成樹協(xié)議(MSTP)之外,還有其他一些彈性協(xié)議和技術(shù)。其中值得關(guān)注的三種技術(shù)是以太網(wǎng)環(huán)網(wǎng)保護切換(ERPS)、鏈路聚合以及虛擬路由器冗余協(xié)議(VRRP)。
以太網(wǎng)環(huán)網(wǎng)保護切換(ERPS)
國際電信聯(lián)盟(ITU-T)的開放標(biāo)準G.8032以太網(wǎng)環(huán)網(wǎng)保護切換(ERPS)協(xié)議具有小于50毫秒的網(wǎng)絡(luò)恢復(fù)時間標(biāo)準,用于創(chuàng)建一個經(jīng)過配置以防止環(huán)路問題的節(jié)點環(huán)。當(dāng)節(jié)點排列成環(huán)形時,總有一條連接會被阻塞,以防止形成環(huán)路。這樣一來,流量可以在環(huán)網(wǎng)的兩個方向上流動,但總會在被阻塞的鏈路處停止。
如果環(huán)網(wǎng)中的另一條鏈路出現(xiàn)故障,它就會成為被阻塞的鏈路,而之前被阻塞的鏈路則會被開啟。因此,數(shù)據(jù)傳輸速率可以保持不變,幾乎不會有速度損失。
ERPS環(huán)網(wǎng)也可以進行多層連接,以構(gòu)建更大的網(wǎng)絡(luò)架構(gòu)。即使是在數(shù)百英里長的光纖連接中,ERPS的受保護環(huán)形結(jié)構(gòu)意味著ping測試不會失敗,連接也將保持穩(wěn)定。如果你正在構(gòu)建一個優(yōu)先考慮快速恢復(fù)的新網(wǎng)絡(luò)冗余架構(gòu),ERPS可能是一個最佳選擇。
同樣,以太網(wǎng)網(wǎng)絡(luò)中不能存在環(huán)路。ERPS(如圖3所示)和STP一樣,會禁用一條鏈路以消除網(wǎng)絡(luò)中的環(huán)路。與生成樹協(xié)議類似,如果一條正在工作的鏈路出現(xiàn)故障,之前被禁用的鏈路將被重新啟用,從而構(gòu)建出一個更具彈性的網(wǎng)絡(luò)。
雖然STP可以用于類似網(wǎng)狀拓撲的網(wǎng)絡(luò)中,通過禁用多條鏈路來防止環(huán)路,但ERPS只能在環(huán)形拓撲中實施。通過將設(shè)計限制為環(huán)形,ERPS能夠為網(wǎng)絡(luò)提供更快的自愈時間。
鏈路聚合
鏈路聚合將來自兩個或更多設(shè)備的多個獨立以太網(wǎng)鏈路捆綁在一起,使這些鏈路作為一條單一的邏輯鏈路運行。這樣做無需使用生成樹協(xié)議(STP)來關(guān)閉冗余鏈路。最常見的設(shè)備組合是將一臺交換機連接到另一臺交換機、一臺服務(wù)器、一個網(wǎng)絡(luò)附加存儲設(shè)備或一個多端口接入點。
除了優(yōu)化負載均衡之外,使用鏈路聚合的一個重要原因是為了實現(xiàn)快速且無感知的恢復(fù)。一組聚合的端口被稱為鏈路聚合組(LAG)。這些鏈路中的每一條都必須是相同類型的以太網(wǎng)(10/200/1000/10G等),并且配置也必須相同。物理鏈路以雙活或主備模式運行,這意味著如果一條物理鏈路出現(xiàn)故障,另一條鏈路可以接管并恢復(fù)之前通過故障鏈路發(fā)送的流量轉(zhuǎn)發(fā)任務(wù)。
鏈路聚合控制協(xié)議(LACP)是一種點對點協(xié)議,它在設(shè)備(通常是工業(yè)交換機)之間創(chuàng)建冗余并增加帶寬。例如,通過兩條鏈路將兩臺以太網(wǎng)交換機連接在一起就會形成一個環(huán)路(如圖4所示)。
LACP通過將這兩條鏈路組合成一條邏輯鏈路來避免出現(xiàn)問題,并消除了由環(huán)路引起的各種問題。兩條鏈路能夠同時傳輸不同的數(shù)據(jù),從而使帶寬翻倍。如果一條鏈路出現(xiàn)故障,另一條鏈路仍然可以傳輸數(shù)據(jù)。最多可以將八條鏈路捆綁在一起,形成一個單一的LACP連接。
虛擬路由器冗余協(xié)議
虛擬路由器冗余協(xié)議(VRRP)是一種開放標(biāo)準協(xié)議,它通過為網(wǎng)絡(luò)服務(wù)提供路由器冗余來增強網(wǎng)絡(luò)的可靠性。VRRP通過使用物理硬件并創(chuàng)建一個由多個物理路由器組成的虛擬路由器來實現(xiàn)這一點。當(dāng)數(shù)據(jù)包從一臺服務(wù)器的IP地址發(fā)送到虛擬路由器時,優(yōu)先級最高的工業(yè)路由器將充當(dāng)主路由器。該組中的其他路由器則處于備用模式,隨時準備在主路由器出現(xiàn)故障時接管其工作。
結(jié)語
在一個互聯(lián)互通的工業(yè)世界中,網(wǎng)絡(luò)中斷可能會帶來災(zāi)難性的后果。然而,許多機構(gòu)仍在使用過時的技術(shù),這可能會阻礙技術(shù)發(fā)展、增加網(wǎng)絡(luò)安全威脅并降低生產(chǎn)效率。對工業(yè)網(wǎng)絡(luò)進行現(xiàn)代化改造不僅僅是升級過時的技術(shù),還包括提高網(wǎng)絡(luò)的彈性。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.