發(fā)布時(shí)間:2016-03-22 09:51:29 來(lái)源: 作者:
上一篇我們談了很多大二層網(wǎng)絡(luò)的技術(shù)和流派,但是細(xì)心的讀者可能已經(jīng)發(fā)現(xiàn),我們談這些方案和技術(shù),實(shí)際上都是講的同一個(gè)數(shù)據(jù)中心內(nèi)的大二層網(wǎng)絡(luò)技術(shù),未考慮跨數(shù)據(jù)中心的情況。
跨數(shù)據(jù)中心情況下,那么如果要實(shí)現(xiàn)跨數(shù)據(jù)中心的VM動(dòng)態(tài)遷移,就要保證不同數(shù)據(jù)中心的服務(wù)器也都在同一個(gè)二層域內(nèi)。也就是說(shuō)要構(gòu)建一個(gè)覆蓋所有數(shù)據(jù)中心的大二層網(wǎng)絡(luò)。
在討論跨數(shù)據(jù)中心的大二層網(wǎng)絡(luò)時(shí),我們可以從數(shù)據(jù)中心內(nèi)的情況往跨數(shù)據(jù)中心的情況進(jìn)行延伸??纯磳?duì)于釜底抽薪派、移花接木派、瞞天過(guò)海派的技術(shù)來(lái)說(shuō),一旦要跨數(shù)據(jù)中心構(gòu)建大二層網(wǎng)絡(luò)時(shí),又會(huì)遇到什么?該如何解決?
釜底抽薪派通過(guò)網(wǎng)絡(luò)設(shè)備虛擬化來(lái)消除二層網(wǎng)絡(luò)環(huán)路,從而實(shí)現(xiàn)大二層網(wǎng)絡(luò)。比如通過(guò)CSS/iStack技術(shù),把接入、匯聚、核心層的交換機(jī)都虛擬成單節(jié)點(diǎn)設(shè)備。
當(dāng)釜底抽薪派遇到跨數(shù)據(jù)中心的情況時(shí),有兩種方式可以實(shí)現(xiàn)跨數(shù)據(jù)中心的大二層網(wǎng)絡(luò):
這種方式就是把網(wǎng)絡(luò)設(shè)備虛擬化的范圍擴(kuò)大到所有數(shù)據(jù)中心,把不同數(shù)據(jù)中心里的交換機(jī)堆疊成單臺(tái)交換機(jī),這種方式就把所有數(shù)據(jù)中心都當(dāng)成一體來(lái)處理。
但是這種方式要求數(shù)據(jù)中心之間可以實(shí)現(xiàn)堆疊線纜和光纖線路的直連,所以數(shù)據(jù)中心之間距離一般不能太遠(yuǎn),通常不超過(guò)10km。而且最重要的一點(diǎn),很多企業(yè)是不具備自己鋪設(shè)長(zhǎng)距離光纖或者傳輸設(shè)備的條件的。所以,這種方式局限性非常大,一般很少采用。
如果不具備跨數(shù)據(jù)中心堆疊的條件,那么想通過(guò)純二層的方式實(shí)現(xiàn)跨數(shù)據(jù)中心的互聯(lián)就不太現(xiàn)實(shí)了。而在一般情況下,多數(shù)據(jù)中心之間是通過(guò)三層路由互通的,那么就只能把每個(gè)數(shù)據(jù)中心內(nèi)的二層網(wǎng)絡(luò)作為大二層網(wǎng)絡(luò)的一個(gè)局部,再把這些局部網(wǎng)絡(luò)通過(guò)L2 over L3的方式進(jìn)行互聯(lián),進(jìn)而構(gòu)建一個(gè)全局范圍的大二層網(wǎng)絡(luò)。
所謂L2 over L3,是指借助隧道的方式,將二層數(shù)據(jù)報(bào)文封裝在三層報(bào)文中,跨越中間的三層網(wǎng)絡(luò),實(shí)現(xiàn)兩地二層數(shù)據(jù)的互通。這種隧道如前面所說(shuō)的,像“光纖”,將多個(gè)數(shù)據(jù)中心的二層網(wǎng)絡(luò)貫穿在一起。
L2 over L3的技術(shù)有很多種,有傳統(tǒng)的VPN技術(shù)VPLS/VLL以及增強(qiáng)版的VPLS/VLL over GRE。也有新興的專門(mén)為數(shù)據(jù)中心二層互聯(lián)開(kāi)發(fā)的VPN技術(shù),例如華為的EVN(Ethernet Virtual Network)技術(shù)、CISCO的OTV(Overlay Transport Virtualization)等等。
新興的這些技術(shù)主要是為了解決VPLS的一些固有缺陷,例如多歸屬接入時(shí)無(wú)法負(fù)載分擔(dān)、網(wǎng)絡(luò)部署和配置復(fù)雜、網(wǎng)絡(luò)資源消耗高等等。
以EVN為例:
關(guān)于EVN的詳細(xì)技術(shù)原理,后面會(huì)有專題詳細(xì)介紹,本文不詳述。
移花接木派的思想是借用三層路由的方式來(lái)進(jìn)行二層報(bào)文的轉(zhuǎn)發(fā),比如TRILL協(xié)議。而當(dāng)TRILL等協(xié)議遭遇跨數(shù)據(jù)中心互聯(lián)時(shí),又會(huì)發(fā)生什么呢?
最理想的狀況,當(dāng)然是把所有數(shù)據(jù)中心的網(wǎng)絡(luò)(包括互聯(lián)的網(wǎng)絡(luò))都納入同一個(gè)TRILL網(wǎng)絡(luò),這樣什么麻煩都沒(méi)有了。
如果企業(yè)可以構(gòu)建跨數(shù)據(jù)中心的二層鏈路,構(gòu)建一個(gè)大范圍的純TRILL網(wǎng)絡(luò)理論上是可行的。這種方案簡(jiǎn)單的說(shuō),就是沒(méi)有什么數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)、互聯(lián)網(wǎng)絡(luò)的區(qū)分,所有網(wǎng)絡(luò)設(shè)備統(tǒng)一運(yùn)行TRILL來(lái)轉(zhuǎn)發(fā)二層數(shù)據(jù)。
簡(jiǎn)單是簡(jiǎn)單的,但是這種方案的物理?xiàng)l件要求似乎也太高了些,也非常不經(jīng)濟(jì)。想象一下,對(duì)于一個(gè)全國(guó)性的企業(yè),多地?cái)?shù)據(jù)中心的互聯(lián)網(wǎng)絡(luò)全部運(yùn)行TRILL來(lái)轉(zhuǎn)發(fā)二層數(shù)據(jù),想想就覺(jué)得冷的不行啊。
如果是一個(gè)城域內(nèi)的兩個(gè)主備數(shù)據(jù)中心來(lái)說(shuō),這種方案倒是勉強(qiáng)可以考慮一下的。
所以,對(duì)于TRILL來(lái)說(shuō),最經(jīng)濟(jì)的方案,其實(shí)就和釜底抽薪派的解決方案一樣,也采用L2 over L3的方式來(lái)實(shí)現(xiàn)互聯(lián)。這種情況下,可以稱之為TRILL over L3。
說(shuō)到這里就基本殊途同歸了,L2 over L3的技術(shù)也是前面提到過(guò)的VPLS/VLL(VPLS/VLL over GRE)、EVN和OTV這么幾種。都可以用來(lái)實(shí)現(xiàn)TRILL網(wǎng)絡(luò)之間的互聯(lián)。
唯一需要說(shuō)明的是,對(duì)于釜底抽薪派來(lái)說(shuō),它的L2 over L3封裝的就是普通的二層以太網(wǎng)報(bào)文。而對(duì)于TRILL來(lái)說(shuō),如果要實(shí)現(xiàn)跨數(shù)據(jù)中心的大二層網(wǎng)絡(luò),那么要保證兩個(gè)數(shù)據(jù)中心的TRILL網(wǎng)絡(luò)是在同一個(gè)TRILL域,所以在L2 over L3時(shí),需要把完整的TRILL報(bào)文(包括外層二層頭)一起封裝之后傳輸?shù)綄?duì)端。
以VPLS為例,在傳輸TRILL報(bào)文的時(shí)候,整個(gè)封裝結(jié)構(gòu)就會(huì)是這個(gè)樣子:
(對(duì)于TRILL來(lái)說(shuō),還有另外一種互聯(lián)方式,就是在數(shù)據(jù)中心的出口處先終結(jié)掉TRILL報(bào)文,只取出用戶原始二層報(bào)文再進(jìn)行隧道封裝和傳輸,但是這樣的話,實(shí)際上兩側(cè)的TRILL網(wǎng)絡(luò)是相互獨(dú)立的,因而就不是大二層網(wǎng)絡(luò),VM也無(wú)法在兩個(gè)TRILL網(wǎng)絡(luò)之間進(jìn)行遷移)
瞞天過(guò)海派面對(duì)跨數(shù)據(jù)中心的情況時(shí),情不自禁的要樂(lè)出聲來(lái)。
“哈哈哈,為了跨數(shù)據(jù)中心的大二層,你們都累死了吧?看哥哥的!”
然后……
瞞天過(guò)海派就去睡覺(jué)了!
為啥他們這么悠閑?
還記得瞞天過(guò)海派(VXLAN/NVGRE等)的核心思想不?
瞞天過(guò)海派通過(guò)把原始二層報(bào)文進(jìn)行隧道協(xié)議封裝后,在承載網(wǎng)絡(luò)中透明傳輸,完全忽略中間網(wǎng)絡(luò)的結(jié)構(gòu)和細(xì)節(jié),把整個(gè)承載網(wǎng)絡(luò)虛擬成一臺(tái)“巨大無(wú)比的二層交換機(jī)”, 每一臺(tái)主機(jī)都是直接連在這臺(tái)“巨大交換機(jī)”的一個(gè)端口上。而承載網(wǎng)絡(luò)之內(nèi)如何轉(zhuǎn)發(fā)都是這臺(tái)“巨大交換機(jī)”內(nèi)部的事情,主機(jī)完全無(wú)需關(guān)心。
所以,無(wú)論是在數(shù)據(jù)中心內(nèi)的網(wǎng)絡(luò),還是跨數(shù)據(jù)中心的互聯(lián)網(wǎng)絡(luò),對(duì)于瞞天過(guò)海派來(lái)說(shuō),統(tǒng)統(tǒng)是承載網(wǎng)絡(luò)(“交換機(jī)”)的一部分,壓根就不需要關(guān)心細(xì)節(jié)。
就以VXLAN為例,VTEP把VM A的原始數(shù)據(jù)報(bào)文進(jìn)行VXLAN封裝后(MAC in UDP),它就是一個(gè)普通的IP報(bào)文而已(源地址是本VTEP的地址,目的IP地址是VM B所在的VTEP),中間網(wǎng)絡(luò)無(wú)論用什么技術(shù),只要能把報(bào)文轉(zhuǎn)發(fā)到目的地的VTEP就可以了。
所以說(shuō),瞞天過(guò)海派是天然可以支持跨數(shù)據(jù)中心的大二層網(wǎng)絡(luò)的。在這種架構(gòu)下,無(wú)論VM是在本數(shù)據(jù)中心內(nèi)遷移,還是跨數(shù)據(jù)中心遷移,都無(wú)需變更IP地址。
公司簡(jiǎn)介
company profile
解決方案
solution
客戶案例
Customer case
官方微信