IT服務器運維 | 服務器網卡Team聚合技術
2020-04-20 20:50 作者:admin
IT服務器運維 | 服務器網卡Team聚合技術
數據中心服務器接入大量采用了服務器網卡(Team)技術。Team技術不完全屬于網絡系統,也不完全屬于主機系統負責,而是介于兩者的中間地帶,因此極易出現問題。最常見的錯誤就是服務器端選擇了交換機相關的team模式,但交換機端網絡人員卻沒有做任何設置。在一定條件觸發下,會引起交換機報主機物理地址flapping錯誤,繼而導致整個交換機CPU利用率居高不下。本文通過對兩種常見服務器網卡的Team技術原理的探討,分析了各種Team模式的實現方式和配置方式。
IT系統運維人員熟練掌握這些知識和技巧后,可根據自身系統的需要,選擇合適的Team模式,有效避免后期的運行風險。數據中心對可用性要求極高。為保證業務系統
高可用性和連續性,從網絡層面講,整個通道的網絡設備和通信線路,全部是
冗余設計:
即從客戶機到服務器之間的網絡通道,任一物理設備宕機,或任一通信線路中斷,都不會影響到業務的連續。 然而,服務器和客戶機,特別是服務器單線路接入網絡時,存在以下
單點故障:
·
接入物理設備(通常是交換機)宕機;
·
接入設備的網口損壞;
·
使用的網線損壞;
·
服務器、客戶機的網卡故障。
解決這種單點故障只能使用服務器網卡組(Team)技術。本質上說,網卡team技術是將同一主機上的兩塊或兩塊以上的網卡,通過軟件控制,虛擬出一個邏輯網卡。實際工作時多塊網卡可以是一主一備模式,或者是
雙活模式。這種技術的初衷是為了解決服務器的帶寬瓶頸,隨著近年來千兆和萬兆級的服務器網卡的出現,服務器帶寬瓶頸得以緩解。因而現在實施服務器網卡組,主要是為服務器網絡接入提供冗余,提高服務器可用性。這種技術的出現很好地解決了行業數據中心服務器接入的單點故障問題,因此在行業內被大量使用。目前市場上流行的可以實施網卡組技術的網卡有intel和broadcom服務器網卡,本文也將重點介紹intel和broadcom服務器網卡組技術。
網卡組技術架構
網卡組技術的實質是對多個物理網絡接口進行統一管理,將多個物理接口虛擬成一個邏輯網絡接口。具體到服務器網卡上,可以看作將多塊網卡虛擬為一塊邏輯網卡。從屬性上看,虛擬邏輯網卡和物理網卡無任何不同,也有自己的物理地址和網絡地址。服務器使用邏輯網卡與外部的主機通信。外部主機只能看到服務器的邏輯網卡,至于服務器具體的物理網卡個數、物理地址等細節,外部主機是不清楚的。
網卡組邏輯結構如圖1所示
無論是intel還是broadcom,一般都是在原有網卡驅動程序基礎上,增加一個網卡組驅動程序,由該驅動程序完成網卡組功能。網絡協議直接訪問網卡組驅動程序,網卡組驅動程序負責完成負載均衡等功能。一般地,網卡組驅動負責對組成網卡組的各個物理網卡進行管理,例如,活動探測,流量探測等,并根據實際情況,實現
負載均衡和網卡容錯功能。
總結
下面是一些關于網卡組技術的總結,可以幫助讀者更深刻地理解網卡組的實現技術。
1、網卡組技術是提高終端(不僅僅是服務器)接入網絡帶寬和可用性的一種技術。因此,它只涉及終端和網絡接入設備(交換機、HUB和路由器),參與的雙方必須直接連接,中間不能跨接其他設備。關于網卡組,目前都是各廠商自行實現,尚無統一的國際標準。
2、提高帶寬是通過多塊網卡的
負載均衡手段,所有的交換機相關網卡組模式(靜態或動態)、ALB和RLB,都提供負載均衡模式。負載均衡參與者必須是同一局域網的設備,即,客戶端與服務器必須是同一IP網段,且處于同一廣播域。
3、負載均衡不是基于單個數據包的,而是基于客戶端或網絡應用的。也就是說,某個網絡應用的所有數據流,自始至終,只使用組中的某一特定網卡,除非該網卡故障而發生切換;另外,由于發送和接收數據均衡由不同的設備實現,因此同一網絡應用的收、發數據流可能會經過不同的網卡。
4、HUB屬于物理層設備,處于同一沖突域,不能增加接入帶寬;路由器屬于網絡層設備,HUB和路由器都不能象交換機那樣處理設備物理地址,因此,網卡組技術不能在HUB或路由器上實現。
5、無論AFT、SFT、ALB還是其他交換機無關網卡組技術,在交換機轉發表中,組中每塊網卡的物理地址都正常出現,需要調整時,由網卡組驅動程序控制網卡發送特定的數據包,改變交換機中的MAC表,以實現冗余互備。基于這個原理,雖然intel網卡支持的AFT,ALB等模式要求接入同一臺交換機,但經過測試(在組中只有兩塊網卡的情況下,多塊網卡的情況未測試)在分接兩臺不同的交換機時,效果基本上是相同的。
6、Intel的技術資料說明,在做SFT模式時,啟用STP協議,但網卡連接接口應啟用STP速端口(portfast),其余模式的網卡組也應該如此。其給出的理由是啟用STP協議的交換機端口狀態轉變時候大約有40秒的延遲,會增加網卡切換時的時間,增加網絡應用中斷的時間。
事實上,無論何種模式,只要在STP協議穩定后,參與網卡組的交換機全部處于正常轉發狀態,此時如果僅僅是發生網卡故障,故障網卡上的數據流切換到正常網卡上,只要交換機上的端口物理狀態沒有改變,STP協議也不會發生狀態轉換,整個切換時間取決于交換機中轉發表的修改時間。
7、關于交換機相關網卡組模式。這種模式實際上是一種“分流、互備”方式,配置時選擇余地大,技術成熟,唯一的缺點是,所有與交換機相關的網卡組模式,不能跨接交換機,必須接入同一臺交換機上,即,這種模式只能提供帶寬擴展和網卡容錯,無法提供交換機容錯。
在可用性要求較高的場合,交換機容錯是必須的。如何解決這個問題呢?最理想的方式是借助
交換機堆疊技術。就CISCO交換機來說,兩臺堆疊的交換機邏輯上可以看做是一臺交換機。但配置FEC或GEC時,要求成員接口必須位于同一臺物理交換機上。CISCO 3750在堆疊時沒有這個限制,即,兩臺3750交換機堆疊后,可以將不同物理交換機上的交換機端口捆綁在一起。網卡組技術結合CISCO 3750堆疊技術,就可以采用交換機相關模式,同時提供交換機容錯功能。
以上內容由北京艾銻無限科技發展有限公司整理