發(fā)布時間:2016-03-22 09:51:29 來源: 作者:
上一篇我們談了很多大二層網絡的技術和流派,但是細心的讀者可能已經發(fā)現(xiàn),我們談這些方案和技術,實際上都是講的同一個數據中心內的大二層網絡技術,未考慮跨數據中心的情況。
跨數據中心情況下,那么如果要實現(xiàn)跨數據中心的VM動態(tài)遷移,就要保證不同數據中心的服務器也都在同一個二層域內。也就是說要構建一個覆蓋所有數據中心的大二層網絡。
在討論跨數據中心的大二層網絡時,我們可以從數據中心內的情況往跨數據中心的情況進行延伸??纯磳τ诟壮樾脚伞⒁苹ń幽九?、瞞天過海派的技術來說,一旦要跨數據中心構建大二層網絡時,又會遇到什么?該如何解決?
釜底抽薪派通過網絡設備虛擬化來消除二層網絡環(huán)路,從而實現(xiàn)大二層網絡。比如通過CSS/iStack技術,把接入、匯聚、核心層的交換機都虛擬成單節(jié)點設備。
當釜底抽薪派遇到跨數據中心的情況時,有兩種方式可以實現(xiàn)跨數據中心的大二層網絡:
這種方式就是把網絡設備虛擬化的范圍擴大到所有數據中心,把不同數據中心里的交換機堆疊成單臺交換機,這種方式就把所有數據中心都當成一體來處理。
但是這種方式要求數據中心之間可以實現(xiàn)堆疊線纜和光纖線路的直連,所以數據中心之間距離一般不能太遠,通常不超過10km。而且最重要的一點,很多企業(yè)是不具備自己鋪設長距離光纖或者傳輸設備的條件的。所以,這種方式局限性非常大,一般很少采用。
如果不具備跨數據中心堆疊的條件,那么想通過純二層的方式實現(xiàn)跨數據中心的互聯(lián)就不太現(xiàn)實了。而在一般情況下,多數據中心之間是通過三層路由互通的,那么就只能把每個數據中心內的二層網絡作為大二層網絡的一個局部,再把這些局部網絡通過L2 over L3的方式進行互聯(lián),進而構建一個全局范圍的大二層網絡。
所謂L2 over L3,是指借助隧道的方式,將二層數據報文封裝在三層報文中,跨越中間的三層網絡,實現(xiàn)兩地二層數據的互通。這種隧道如前面所說的,像“光纖”,將多個數據中心的二層網絡貫穿在一起。
L2 over L3的技術有很多種,有傳統(tǒng)的VPN技術VPLS/VLL以及增強版的VPLS/VLL over GRE。也有新興的專門為數據中心二層互聯(lián)開發(fā)的VPN技術,例如華為的EVN(Ethernet Virtual Network)技術、CISCO的OTV(Overlay Transport Virtualization)等等。
新興的這些技術主要是為了解決VPLS的一些固有缺陷,例如多歸屬接入時無法負載分擔、網絡部署和配置復雜、網絡資源消耗高等等。
以EVN為例:
關于EVN的詳細技術原理,后面會有專題詳細介紹,本文不詳述。
移花接木派的思想是借用三層路由的方式來進行二層報文的轉發(fā),比如TRILL協(xié)議。而當TRILL等協(xié)議遭遇跨數據中心互聯(lián)時,又會發(fā)生什么呢?
最理想的狀況,當然是把所有數據中心的網絡(包括互聯(lián)的網絡)都納入同一個TRILL網絡,這樣什么麻煩都沒有了。
如果企業(yè)可以構建跨數據中心的二層鏈路,構建一個大范圍的純TRILL網絡理論上是可行的。這種方案簡單的說,就是沒有什么數據中心內部網絡、互聯(lián)網絡的區(qū)分,所有網絡設備統(tǒng)一運行TRILL來轉發(fā)二層數據。
簡單是簡單的,但是這種方案的物理條件要求似乎也太高了些,也非常不經濟。想象一下,對于一個全國性的企業(yè),多地數據中心的互聯(lián)網絡全部運行TRILL來轉發(fā)二層數據,想想就覺得冷的不行啊。
如果是一個城域內的兩個主備數據中心來說,這種方案倒是勉強可以考慮一下的。
所以,對于TRILL來說,最經濟的方案,其實就和釜底抽薪派的解決方案一樣,也采用L2 over L3的方式來實現(xiàn)互聯(lián)。這種情況下,可以稱之為TRILL over L3。
說到這里就基本殊途同歸了,L2 over L3的技術也是前面提到過的VPLS/VLL(VPLS/VLL over GRE)、EVN和OTV這么幾種。都可以用來實現(xiàn)TRILL網絡之間的互聯(lián)。
唯一需要說明的是,對于釜底抽薪派來說,它的L2 over L3封裝的就是普通的二層以太網報文。而對于TRILL來說,如果要實現(xiàn)跨數據中心的大二層網絡,那么要保證兩個數據中心的TRILL網絡是在同一個TRILL域,所以在L2 over L3時,需要把完整的TRILL報文(包括外層二層頭)一起封裝之后傳輸到對端。
以VPLS為例,在傳輸TRILL報文的時候,整個封裝結構就會是這個樣子:
(對于TRILL來說,還有另外一種互聯(lián)方式,就是在數據中心的出口處先終結掉TRILL報文,只取出用戶原始二層報文再進行隧道封裝和傳輸,但是這樣的話,實際上兩側的TRILL網絡是相互獨立的,因而就不是大二層網絡,VM也無法在兩個TRILL網絡之間進行遷移)
瞞天過海派面對跨數據中心的情況時,情不自禁的要樂出聲來。
“哈哈哈,為了跨數據中心的大二層,你們都累死了吧?看哥哥的!”
然后……
瞞天過海派就去睡覺了!
為啥他們這么悠閑?
還記得瞞天過海派(VXLAN/NVGRE等)的核心思想不?
瞞天過海派通過把原始二層報文進行隧道協(xié)議封裝后,在承載網絡中透明傳輸,完全忽略中間網絡的結構和細節(jié),把整個承載網絡虛擬成一臺“巨大無比的二層交換機”, 每一臺主機都是直接連在這臺“巨大交換機”的一個端口上。而承載網絡之內如何轉發(fā)都是這臺“巨大交換機”內部的事情,主機完全無需關心。
所以,無論是在數據中心內的網絡,還是跨數據中心的互聯(lián)網絡,對于瞞天過海派來說,統(tǒng)統(tǒng)是承載網絡(“交換機”)的一部分,壓根就不需要關心細節(jié)。
就以VXLAN為例,VTEP把VM A的原始數據報文進行VXLAN封裝后(MAC in UDP),它就是一個普通的IP報文而已(源地址是本VTEP的地址,目的IP地址是VM B所在的VTEP),中間網絡無論用什么技術,只要能把報文轉發(fā)到目的地的VTEP就可以了。
所以說,瞞天過海派是天然可以支持跨數據中心的大二層網絡的。在這種架構下,無論VM是在本數據中心內遷移,還是跨數據中心遷移,都無需變更IP地址。
公司簡介
company profile
解決方案
solution
客戶案例
Customer case
官方微信