中文版 | English
欄目列表
100G之云間交換篇--運營商網絡的新路由平臺
2011-11-17

一、運營級網絡面臨來自新業務的壓力

  移動互聯及新媒體

  當前終端用戶的多樣性和數量爆發式增長已經成為趨勢。在移動互聯網時代,用戶使用的不再僅僅是固定終端,還包括各種各樣的移動智能終端,預計在2012年,中國的移動互聯網用戶數將首次超過傳統互聯網用戶數(易觀國際數據)。移動互聯網的發展改變了互聯網流量在時間軸上的分布,填補了用戶的片段時間,使得互聯網始終處于高流量狀態;同時,微博等新媒體的出現加快了信息的傳播速度,以類似病毒擴散的模式在前所未有地消耗互聯網帶寬;此外,高清視頻業務的迅速發展也在大量消耗著互聯網的帶寬,用戶側的視頻流量帶寬可以高達到10Mbps,一個百萬級用戶的城域網視頻流量在高峰會達到數十Tbps。這些變化讓互聯網骨干路由器面臨著巨大的性能壓力,要求其向著具備更高密度的高速/超高速端口、更為強大的組播能力去發展。

  云服務的新模式

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖1新的信息服務模式


  如圖1示,隨著用戶數量和數據傳輸量的爆發式增長,計算服務也從獨立系統、獨立通道、獨立流量的傳統模式向統一資源管理的云計算模式轉變。當前信息系統正處于大規模信息集中的階段,運營商開始大規模涉足三網融合、互聯網、ICT等綜合信息服務領域;領先的互聯網公司轉向SNS,提供涵蓋IM、電子商務、游戲、搜索、視頻、移動互聯網的融合業務;政府、企業信息系統已經逐步實現數據集中,大量云正在形成。據最近TelecomTrendsInternational的研究報告表明,2015年前云計算服務帶來的營收將達到455億美元。

 

  隨著云計算業務的發展,云內交換和云間交換的數據量越來越大。據統計,在運營商的某些大型城域網,云間交換的數據量已經超過整體流量的40%,并且有進一步擴大的趨勢,云間交換數據量的爆發式增長給現有IP城域網和IP骨干網帶來巨大的壓力。為解決這一矛盾,運營商正在構思一張新型的IP網絡,即IDC骨干網。主要功能是把云間交換的流量從現有的IP城域網分離出來,為云間交換提供獨立的互聯網絡,實現云間的高速交換。因此,新型的IDC骨干網將是以100G、40G和高密10G作為主要的互連端口,如圖3所示。

 

100G之云間交換篇--運營商網絡的新路由平臺

 

圖2新型的IDC骨干網


  綜上所述,新一代核心路由器必須重點解決兩個問題:

 

  1.大容量/高性能,支持100G、40G、集群等技術,滿足互連網帶寬增長的需求;

  2.高性能組播,支持大規格組播組和線速組播復制能力,滿足IPTV視頻業務發展的需求。

  本文重點描述核心路由器對上述關鍵問題的實現方法。

  二、實現核心路由器大容量/高性能的兩個步驟

  大容量/高性能是核心路由器最關鍵的技術,實現方法包括兩個步驟:第一步是提高路由器單框的交換容量,滿足100G端口的線速交換能力;第二步是通過多框集群的方法提高單節點的端口密度。

  1.單框交換容量

  路由器單框交換容量主要以采用高性能交換架構(CLOS架構)來實現T級交換容量和對100G端口線速的支持能力。

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖3CLOS多級交換矩陣


  CLOS是多級交換,典型為三級交換架構,通過使用較小交換結構作為基礎組件來構建大型交換結構,從而簡化大型交換結構的構建。如圖3所示,第1和第3級交換網片分布在業務板上,第2級交換網片分布在交換網板上,三級交換網構成核心路由器的交換矩陣。該交換矩陣具有如下的特點:

 

  無阻塞、高可靠

  在每一級,每個交換單元的輸出都與下一級的所有單元的輸入相連,大幅度減少構建無阻塞交換結構所需要的交叉點,從而減少故障點,增強交換結構的可靠性。如圖3所示,第1和第3級交換網片分別和第2級交換網片全連接,交叉點只有N個(其中N是交換網板數量)。

  智能調度模式,交換路徑負載分擔,實現了交換系統嚴格意義上的無阻塞。如圖3所示,第1和第3級到第2級的流量按照1/N負荷分擔。

  到指定目的地,第2級交換單元都只存在1條路由。交換單元的交換路徑完全獨立,不會彼此干擾,不需要復雜的集中控制器來協調各交換單元的交換,進一步增強可靠性和可擴展性。

  支持遞歸擴展,CLOS網絡中間級的交換也可以是一個完整的三級CLOS網絡。這可支持構建具有五級、七級或九級的巨大交換結構,在極大數量的輸入和輸出之間建立嚴格的無阻塞連接。由于CLOS網絡的遞歸特性,理論上它具有無限的可擴展性。

  到指定目的地,在第1級交換單元存在多條路由,當其中一塊網板發生故障時,自動隔離故障網片,通過冗余路徑繞過第2級交換單元的故障,實現強大的故障抵御能力。如圖4所示,當其中一塊網片發生故障,交換矩陣能夠實現動態路由,自動隔離故障網片,倒換過程業務,由剩余網片分擔轉發。

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖4交換網冗余保護


  大容量

 

  采用CLOS多級交換網架構的核心路由器,業務板卡和每塊交換網板都物理相連,通過多網板負荷分擔擴展系統的交換能力,交換容量達到T級。

  設計良好的核心路由器,其單框交換容量能夠達到或超過部分傳統路由器的集群能力,以H3C公司的100G核心路由器CR16000系列為例,其交換容量足以支持每槽位2個100G端口,性能超過部分傳統核心路由器的集群能力,其交換容量和100G接口支持能力。


  2.多框集群

 

  對于運營商IP骨干網的超級節點,如大型城域網核心路由器、IDC骨干路由器,面臨兩個重大的技術問題:第一,單框路由器容量逐步發展到極限,端口密度無法滿足骨干節點需求;第二,多臺路由器通過路由互聯方式組成的超級核心節點使得網絡結構越趨復雜,運維管理難度加大。如圖5所示:

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖5核心節點路由互聯


  這種通過多臺核心路由器來共同分擔流量的方式,在一定程度上緩解了流量增長的壓力,但也帶來了新的問題:

 

  額外消耗多個高速接口,增加了互連鏈路開銷;

  每增加一臺核心路由器,IP地址、路由協議鄰居數量、路由表條目及路由收斂時間等相應的增加問題隨之而來;

  網絡變得更復雜,維護壓力越來越大;

  多臺設備之間流量如何均衡,一直都是業界的難題。

  路由器集群技術能夠很好地解決上述問題。路由器集群(Multi-Chassis)就是將多臺路由器互聯起來形成一套邏輯上一體的路由器系統。集群是一種最有效的解決擴展性問題的技術,它可在方便維護、不增加網絡復雜度的前提下,用更低的網絡的建設成本和維護成本來滿足業務高速增長、網絡性能及容量提升的需求(如圖6所示)。

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖6集群技術


  集群技術通過集中化、一體化的控制管理,使集群系統各臺路由器單機之間能夠很好地協同工作,擴展路由器的容量,突破單機在開發技術上的限制。在成本方面,由于集群系統中各臺路由器通過高速光背板互連,節省了額外的內部互聯端口,且不再需要昂貴的路由器接口卡實現復雜的QoS、路由轉發等特性,使機箱之間的互連成本遠低于普通端口互連方式,大大減少了投資;同時,還克服了采用普通端口互連方式帶來的帶寬瓶頸問題。更為重要的是,由于集群路由器具有統一的管理和路由控制引擎,對外僅體現為一臺邏輯路由器,使得網絡拓撲和路由策略變得簡單和清晰,維護也更加方便快捷。

 

  集群路由器已經大量應用在運營商的核心骨干網,甚至是超大型城域網的出口位置。但即便是采用集群,在某些大流量的骨干網節點和城域網出口,網絡流量的增長已經遠遠超過了原有的設計,現有核心路由器的端口數和整體轉發能力已現捉衿見肘之勢。考慮到技術成熟度和設備穩定性,現網最常見的核心路由器集群采用4臺集群,單臺核心路由器的容量約在1~2T,集群后的整體性能至多達到10T。未來5年互聯網流量與現在相比將有4倍的增長,因此為了滿足至少未來5年的互聯網容量增長,新一代100G平臺核心路由器整體硬件容量能力應該瞄準單框10T,集群后整體性能40T的目標設計。

  針對網絡建設來講,通過路由器集群,將核心設備容量升級到原來的2倍、4倍、6倍、8倍或以上都能采取平滑擴充的方式,而且不會增加路由的跳數和復雜度。因此,集群技術完美地實現了核心路由器容量從Tbit/s級到數十Tbit/s級的擴展,很好地解決了核心層大容量的問題。

  三、多級組播

  視頻業務的迅速發展對路由器的組播能力提出了更高的要求,包括組播規格和組播復制能力,其中組播復制能力是關鍵技術。為了提高組播復制能力,同時減少組播業務在路由器內部的資源消耗,我們提出了“交換網組播”和“三級組播復制”的技術實現方法。

  1.交換網組播

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖7組播表項


  傳統核心路由器在組播功能上最重大的缺陷之一就是交換網不支持組播,組播報文在單板和交換網之間是廣播轉發,導致的嚴重后果是組播流量越大,路由器內部的廣播流量就越大,交換網帶寬資源浪費就越嚴重。

 

  針對上述問題,在交換網上增加組播表項存儲空間并同步學習組播表項。如圖7所示,交換網板同步學習組播表項,按需復制,可以最大限度的節省交換網帶寬資源。但是,交換網上的組播表項和業務板上的組播表項有區別。業務板上的組播表項為:源IP+組播IP+出接口列表,交換網板上的組播表項為:源IP+組播IP+出接口板列表,即:交換網板上的組播表項的下一跳為出接口板列表而不是出接口列表,交換網板根據出接口板列表來復制和轉發報文到目標接口板,組播轉發不再造成帶寬浪費。

  2.三級組播復制

  為提升組播轉發效率,在芯片級和交換網級采用了三級組播復制的設計,第一級組播復制在入接口板內完成,第二級組播復制在交換網完成,第三級組播復制在出接口板完成,不浪費任何帶寬。

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖8一級組播復制


  如圖8所示,一級組播復制發生在組播出接口和入接口在同一個PP(PacketProcessor)中,當PP收到組播流的時候,查詢TCAM中的組播轉發表(源IP+組播IP+出接口列表),發現其中有一個或多個組播出接口在本PP中,PP為每一個在本PP的組播出接口復制一份報文,同時,如果存在出接口不在本PP的情況,則往交換網發送一份組播報文。

 

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖9二級組播復制


  如圖9所示,二級組播復制發生在交換網板上,當交換網收到組播流的時候,查詢MC組播轉發表(源IP+組播IP+出接口板列表),根據“出接口板列表”向下一跳出接口板復制一份組播報文。

 

 

 

 
100G之云間交換篇--運營商網絡的新路由平臺

 

圖10三級組播復制


  如圖10所示,三級組播復制發生在出接口板中,當PP收到組播流的時候,查詢TCAM中的組播轉發表(源IP+組播IP+出接口列表),發現其中有一個或多個組播出接口在本PP中,PP為每一個在本PP的組

<< 返回
聯系我們 | English

甘公網安備 62010202000429號

Copyright ©2010-2012 甘肅萃英信息科技有限公司 版權所有 隴ICP備17005464號-1
麻豆网站-麻豆网络传媒网页入口-麻豆是传媒官方网站-麻豆视频传媒入口