為超大規模資料中心打造高效率100G/400G光收發機

2018-08-15
作者 Rang-Chen (Ryan) Yu,Molex業務發展副總裁、Molex旗下Oplink公司光電解決方案業務總經理兼100G Lambda MSA聯合主席

100G和400G光學技術的最新發展可以促成廣泛而又高效的超大規模資料中心連接解決方案,為內容日益豐富的資料密集型應用提供大力支援...

全球網路資料中心的流量在十年來一直保持高速成長,在可預見的未來尚無任何減弱的跡象。智慧型手機及其他行動裝置、社交媒體與應用程式(app)、串流媒體視訊、擴增實境(AR)與虛擬實境(VR)日益普及,吸引了越來越多新使用者;此外,每位使用者持有的裝置數量保持成長,而且每台裝置使用的資料量也在不斷攀升,從而使得資料中心的流量出現了顯著的提升。

據分析師預測,截至2020年,全球連接到網際網路的裝置數量將達到2,000億台。近期的證據表明,逐步走向成熟的消費性電子產品市場可能只是冰山的一角。雲端運算和機器間(machine-to-machine;M2M)的資料頻寬成長速度甚至超過了消費者的資料傳輸速率,並推動著對於大容量資料中心基礎設施的巨大需求。

資料中心和光學互連成長趨勢

在過去的十年間,包括AWS、微軟(Microsoft)、Google和Facebook等網際網路巨擘紛紛部署規模越來越大的資料中心以滿足客戶的需求,一些企業在一座建築物中使用的電腦伺服器數量甚至已經超過了十萬台。在土地及電能供應充足而成本較低的地區,這類超大規模資料中心的供應商將鄰近擴張的資料中心之處理能力合併起來,從而充份地發揮了規模經濟的效益。根據思科(Cisco)預計,截至2020年,全部資料中心中近一半裝機的伺服器都將位於這些超大規模資料中心之內。這些伺服器將佔據資料中心多達68%的處理能力,以及超過全部資料中心流量的一半(53%)。

隨著雲端需要為越來越多的關鍵任務型商業應用及高時效性的消費者應用提供支援,在全球範圍內,資料中心的部署必須更靠近人口稠密的中心地區。越來越多的網路公司在打造資料中心時採用緊密相鄰的多座建築物,並利用極大的頻寬使其互連在一起。在人口較為稠密的地區,跨越各個相互獨立的電網來建立資料中心,可以進一步的降低延遲、改善消費者體驗。這一策略還可以為僅依靠單一電網的更大規模資料中心帶來降低風險和克服局限的好處。

在每一座超大規模資料中心建築物內部,都可能有數萬台至數十萬台的電腦伺服器利用不同級別的乙太網路(Ethernet)交換機互連,形成一股集體的運算能力,用於網路公司自身的服務(例如Google或Facebook),或者出租給企業客戶(例如,亞馬遜的AWS或微軟的Azur)。儘管可以利用多種不同方案來實現電腦伺服器的互連,在2018年,典型的超大規模資料中心網路連接大多採用直連銅纜(Direct-Attached Copper;DAC),以25或2x25Gbps的速度在幾公尺(m)的距離內將伺服器連接到架頂((ToR)伺服器,然後再採用大量的100Gbps光學鏈路,利用規模龐大的交換結構——通常稱為葉脊(leaf-spine)架構?-——實現ToR交換機的互連。根據這類資料中心的具體數量,典型的光學互連覆蓋範圍最大可到500公尺(DR),但是大型資料中心所需的距離則要長達2公里(FR)。

目前一代的100G光纖收發模組以4通道的光發射機和光接收機為基礎,分別在25Gbps的速度下平行執行,從而達到100Gbps的聚合頻寬。目前共有兩種類型的100G光收發機:對於希望部署更多光纖並且降低每台收發機成本的使用者,適合使用平行單模4(PSM-4)的收發機。對於期望部署較少光纖的使用者,則更加適用粗放型WDM-4 (CWDM4)型的光收發機。這兩種類型的100G光收發機在當今都已大行其道。

100G/400G過渡及100G PAM-4技術即將到來

目前超大規模資料中心網路的特點在於互連速度的進步很快,往往每三年便會有所改進。極具創新性的100G互連系統正成為主流,過去兩年間已經得到廣泛部署,而下一次的速度過渡也正在逼近中。儘管目前有人認為下一代將會是200Gbps的天下,但業界的一致觀點則認為400Gbps理所當然將成為下一速率主流。

目前採用4x25G的100G技術在封裝方面過於複雜,而且無法擴展到400G。為了降低100G的成本,並且利用經濟的方式來支援400G的光學元件,業界正在轉向採用一項新的技術——利用在50GBaud下使用4級脈衝幅度調變(PAM-4)編碼的光學元件,從而實現每通道100G的速度,然後再透過4x100G的聚合達到400G的速度。成立100G Lambda多源協議(MSA)組織的目的是定義這一新的產業標準,並已獲得了23家企業的推廣支援,從而代表著一個廣泛的產業生態系統,其中包含了生產半導體晶片、光收發機模組和網路系統的企業,以及作為最終使用者的網路公司。

採用單通道100G光學元件的巨大優勢包括顯著減少了光學元件的數量從而降低成本,為經濟型的400G速度構建起堅實的基礎,並且,當電氣介面在未來遷移到100G的序列介面時,無需再逆向操作。據估計,PAM-4 100G可減少60%的元件數量上,功率要求則可降低33%。

100G Lambda MSA最近還公佈了一份規範的初稿,其中定義了100G FR (2公里)、100G LR (10公里)及400G FR4 (2公里),並且還潛在地定義了400G LR4 (10公里)。隨著數位訊號處理以及高速矽光子等高速光電子裝置技術的進步,我們預計業界將會很快的採納並實施此類技術,最早可能從2019年開始進行現場部署。

資料中心間(DCI)解決方案

在世界各地,超大規模資料中心都靠近人口稠密的中心進行部署,並且利用超高的頻寬互連起來。儘管各大洲和各大洋之間部署了許多的超高速光纖鏈路,其中的大部份鏈路都連接在資料中心園區內的各個資料中心大樓之間,或者連接在同一都會區的各個資料中心之間。這些資料中心建築物之間利用極高的頻寬互連在一起,可達到每秒數十terabit級的速度。

對於在幾公里範圍內互連在一起的資料中心,營運商可以選取部署簡單的100G CWDM4 (2公里)或100G LR4 (10公里)型的光收發機,然後再利用數百對光纖移植到100G FR/LR (使用PAM-4技術)。如果光纖數量不足,而且新增更多的光纖成本過於高昂,那麼營運商就可能選取部署密集波分多工(DWDM)光收發機解決方案,從而達到每對光纖40x100G的聚合頻寬。對於這類園區內的短距離互連來說,與複雜性更高的同調傳輸技術相較,採用直接偵測的單通道100G PAM-4更經濟得多,是一種更具吸引力的解決方案,需要具有偏振多工/解多工功能的振幅與相位調變/解碼功能,以及配有精密控制光學本機振盪器的同調偵測功能。

對於80公里距離內的資料中心互連,可以採用先進數位訊號處理技術100G PAM-4 DWDM,在成本上仍然具有優勢,由於在全部DWDM通道上可以共用補償,因此在可調諧色散補償要求提高的情況下優勢依然明顯。同調偵測將用於覆蓋超出80公里的傳輸距離。在資料中心過渡到400G後,DCI解決方案將相應地擴展,而4x100G PAM-4則仍可用於傳輸距離相對較短的DCI應用,而同調的400G則可為其他資料中心間的連接延展覆蓋範圍。

光收發機的外形設計

對於100G的資料中心應用來說,業界壓倒性地採用了四分之一小形狀係數可插拔(QSFP28)收發模組。由於業界正準備從100G過渡到400G,多種新興的MSA外形因子都在參與競爭,希望爭得一席之地。其中一個領先的選項就是四分之一小形狀係數可插拔雙密度(QSFP-DD),這一選項衍生自QSFP28,資料的電氣連線效能高出2倍,而機械長度稍長一些,保留了與QSFP28的相容性。QSFP-DD的收發模組與線纜籠配置改進了熱設計,可支援12瓦(W)以上的功率耗散。

20180815_Molex_TA31

另一個競爭對手是八進制小型可插拔(OSFP)光收發機,比起QSFP-DD介面的尺寸稍大且稍長一些。OSFP模組的主要優勢在於體積較大,這樣可實現更高的功率耗散,達到16W;不利之處則是缺少與QSFP28的後向相容性,而且尺寸稍大,降低了面板資訊點的密度。

第三種MSA規範由板載光學元件聯盟(Consortium of On-Board Optics;COBO)制訂,它定義了一種脫離系統面板資訊點而直接配置在系統印刷電路板(PCB)上的電氣介面。這種配置的優勢在於可以靈活地放置收發模組,使其更接近速度更高的開關IC介面,便於處理訊號完整性的問題。由於COBO收發模組安裝在2D PCB表面,還可以為散熱器提供更多空間,從而有助提高功率耗散的額定值。

對於以快速的步伐大力投入以跟上技術發展與服務創新潮流的主要網路公司來說,超大規模資料中心正迅速地發展成為關鍵的基礎設施。在世界各地的超大規模資料中心,開發速度更快的電氣與光學訊號技術,將繼續加速大規模的資料聚合。100G和400G光學技術的最新發展可以促成廣泛而又高效的超大規模資料中心連接解決方案,為內容日益豐富的資料密集型應用提供大力支援。

活動簡介
未來寬能隙半導體元件會在哪些應用成為主流?元件供應商又會開發出哪些新的應用寬能隙元件的電路架構,以協助電力系統開發商進一步簡化設計複雜度、提升系統整體效率?TechTaipei「寬能隙元件市場與技術發展研討會」將邀請寬能隙半導體的關鍵供應商一一為與會者解惑。
贊助廠商
訂閱EETT電子報