0731-84728105
15116127200
二層交換機(jī)原型設計與實現(三)
發布時間:2021-05-10
     二層交換機(jī)的主要功能(néng)就(jiù)是在端口之間搬移分組,當然是要根據正确的目标地址來搬移,涉及到(dào)以太網幀格式的解析、源和目的MAC地址的提取,MAC表的設計、查找和老化等等一(yī)系列的系統功能(néng)實現。我們開(kāi)始設計交換機(jī)并不考慮那麽多(duō),從(cóng)簡單入手,輕裝上(shàng)陣,你也許會(huì)走得更好。
     上(shàng)一(yī)篇文章我們學會(huì)了打印分組的基本信息和将分組發送到(dào)指定端口輸出。今天我們就(jiù)可以來實現一(yī)個(gè)簡單的交換功能(néng),完成兩台主機(jī)之間的正常通(tōng)信了。
     1)端口交換
     顧名思義,就(jiù)是隻識别判斷端口号就(jiù)将分組進行交換轉發,先實現一(yī)個(gè)基于端口的交換功能(néng)。固定邏輯隻能(néng)實現固定的兩個(gè)端口交換,我們可以将要交換的兩個(gè)端口從(cóng)程序啓動時作為(wèi)參數輸入,這樣就(jiù)可以在啓動命令時按需要指定要交換的兩個(gè)端口參數了。
     增加兩個(gè)端口變量的全局定義,并在main函數的參數輸入中獲取輸入的值,如:

/*端口交換要使用的兩個(gè)全局端口号變量*/
int port1 = 0,port2 = 0;

/*main函數中添加如下(xià)代碼*/
else if(argc == 5)
{
debug = atoi(argv[1]);
mid = atoi(argv[2]);
port1 = atoi(argv[3]);
port2 = atoi(argv[4]);
}

/*callback函數中添加如下(xià)代碼*/
if(pkt->um.inport == port1)
pkt->um.outport = port2;
else
pkt->um.outport = port1;

      2)驗證
     編譯代碼并執行生(shēng)成文件(jiàn)命令,觀察打印消息。

root@HNXS:/home/hnxs/l2switch# make
gcc -o ul2switch main_ul2switch.c -lua -lreg -lpthread
root@HNXS:/home/hnxs/l2switch# ./ul2switch 1 130 0 2
fastU->REG Version:20180827,OpenBox HW Version:2020210329
fastU->Register UA to FAST Kernel! Wait Reply......
fastU->UA->pid:2132,mid:130,Register OK!
fastU->libua version:20180827
fastU->fast_ua_recv......
inport:2,dstmid:130,len:92,dmac:FF:FF:FF:FF:FF:FF,smac:B8:27:EB:C1:D1:39
pkt_send_normal->0xb5500470,outport:0,len:92
inport:0,dstmid:130,len:92,dmac:B8:27:EB:C1:D1:39,smac:B8:27:EB:D8:83:20
pkt_send_normal->0xb5500470,outport:2,len:92
inport:2,dstmid:130,len:130,dmac:B8:27:EB:D8:83:20,smac:B8:27:EB:C1:D1:39
pkt_send_normal->0xb5500470,outport:0,len:130
inport:2,dstmid:130,len:130,dmac:B8:27:EB:D8:83:20,smac:B8:27:EB:C1:D1:39
pkt_send_normal->0xb5500470,outport:0,len:130

     同時,在一(yī)個(gè)測試主機(jī)上(shàng)ping另一(yī)台測試主機(jī)的IP,發現已經ping通(tōng)了。

64 bytes from 192.168.2.117: icmp_seq=10 ttl=64 time=2.02 ms
64 bytes from 192.168.2.117: icmp_seq=11 ttl=64 time=0.742 ms
64 bytes from 192.168.2.117: icmp_seq=12 ttl=64 time=0.597 ms

     3)思考
     從(cóng)上(shàng)述交換打印分析,前兩個(gè)報(bào)文應該是ARP分組,32字節metadata加60字節以太幀數據。第1個(gè)是廣播請求,第2個(gè)是單播應答。第3和第4個(gè)報(bào)文就(jiù)是第1組ping的交互數據了,标準ping的98字節(130-32=98)。
     先不往大了說,至少我們前面添加了幾行代碼就(jiù)實現了我們的一(yī)個(gè)最基本的原型交換了,如果要換端口測試,隻需要在啓動命令時更改相(xiàng)應的端口号參數就(jiù)行了。那交換機(jī)端口多(duō)了,用戶多(duō)了之後呢(ne)?我們豈不是要不斷回來的啓動程序和設置端口來保證他們通(tōng)信呢(ne)?這是不是跟解放(fàng)前的電(diàn)話接線員(yuán)工(gōng)作有點類似?接線員(yuán)接到(dào)電(diàn)話後,先要詢問打電(diàn)話的人要打給誰,然後再把線給連過去。當然,原來的電(diàn)話通(tōng)信與分組交換還(hái)是有些較大區别,隻是類比一(yī)下(xià),不擴展細說。
      在分組交換的頭部攜帶有該分組要去往的目的地址,我們管他叫目的MAC地址。在以太網網絡中,任意一(yī)個(gè)通(tōng)信終端都必須具備一(yī)個(gè)唯一(yī)的MAC地址,用作通(tōng)信内容标識。在基于端口交換的基礎上(shàng),我們也可以很容易的實現一(yī)個(gè)基于MAC地址的簡單交換功能(néng)。至于為(wèi)什麽選目的MAC作為(wèi)交換判斷參數,大家細想肯定能(néng)明白(bái)。
      1)MAC交換
     根據以太網幀格式定義,從(cóng)分組頭部位置提取目的MAC作為(wèi)判斷參數,實現一(yī)個(gè)基于MAC地址的交換功能(néng)。既然要根據目的MAC地址來做轉發,我們需要知道哪一(yī)個(gè)MAC地址的主機(jī)連接在交換機(jī)的哪一(yī)個(gè)端口上(shàng)面,假設我們已經獲取了這些信息如下(xià):

主機(jī)MAC地址:B8:27:EB:D8:83:20,交換機(jī)端口:0
主機(jī)MAC地址:B8:27:EB:C1:D1:39,交換機(jī)端口:2

替換原來端口交換的邏輯代碼,替換代碼如下(xià):

/*新增兩個(gè)MAC的内存格式定義,與S4平台(ARM)相(xiàng)關哦*/
u64 mac1 = 0x2083D8EB27B8,mac2 = 0x39D1C1EB27B8;

/*注釋原來端口轉發邏輯,添加MAC轉發邏輯*/
if(!ether_addr_equal(pkt->data,(u8 *)&mac1))
pkt->um.outport = 0;
else if(!ether_addr_equal(pkt->data,(u8 *)&mac2))
pkt->um.outport = 2;

     ether_addr_equal函數是判斷兩個(gè)MAC地址是否相(xiàng)等,詳情參閱代碼。
     兩個(gè)MAC地址的定義準确來說要根據MAC的順序方式表示後再做網絡序轉換,為(wèi)簡化邏輯和方便驗證,直接定義成了小(xiǎo)端平台下(xià)反序方式,這樣正好跟網絡序的MAC地址對比相(xiàng)等。關于平台數據的大小(xiǎo)端的問題或主機(jī)序與網絡序問題,請網上(shàng)搜索學習。
     2)驗證
編譯代碼并執行生(shēng)成文件(jiàn)命令,觀察打印消息。

root@HNXS:/home/hnxs/l2switch# make
gcc -o ul2switch main_ul2switch.c -lua -lreg -lpthread
root@HNXS:/home/hnxs/l2switch# ./ul2switch
fastU->REG Version:20180827,OpenBox HW Version:2020210329
fastU->Register UA to FAST Kernel! Wait Reply......
fastU->UA->pid:2255,mid:129,Register OK!
fastU->libua version:20180827
fastU->fast_ua_recv......
inport:0,dstmid:129,len:92,dmac:FF:FF:FF:FF:FF:FF,smac:B8:27:EB:D8:83:20
pkt_send_normal->0xb5400470,outport:0,len:92
inport:0,dstmid:129,len:92,dmac:FF:FF:FF:FF:FF:FF,smac:B8:27:EB:D8:83:20
pkt_send_normal->0xb5400470,outport:0,len:92
inport:0,dstmid:129,len:92,dmac:FF:FF:FF:FF:FF:FF,smac:B8:27:EB:D8:83:20
pkt_send_normal->0xb5400470,outport:0,len:92

     同時,在2端口測試主機(jī)上(shàng)ping另一(yī)台測試主機(jī)的IP,發現ping不通(tōng)哦。這是因為(wèi)我們現在的邏輯沒有考慮ARP廣播MAC地址的處理邏輯,導緻其無法正常轉發。本節暫不處理廣播的泛洪轉發功能(néng),後續文章中與組播一(yī)起讨論。
     那如何讓兩邊主機(jī)不發ARP廣播直接發ping的分組呢(ne)?了解網絡通(tōng)信原理的人都知道,這個(gè)廣播是在ping之前發出的MAC地址學習分組,如果沒有學習到(dào)對端的MAC地址,則ping的分組無法完成二層協議的封裝,無法從(cóng)協議棧發出。使用如下(xià)命令分别在兩台主機(jī)上(shàng)進行對端IP與對端MAC的靜(jìng)态綁定設置,ping的分組便能(néng)正常發出了。

/*192.168.2.115主機(jī)執行*/
#arp –s 192.168.2.117 b8:27:eb:d8:83:20
/*192.168.2.117主機(jī)執行*/
#arp –s 192.168.2.115 b8:27:eb:c1:d1:39

     現在,在任意一(yī)台主機(jī)上(shàng)執行ping均能(néng)可以看(kàn)到(dào)ping通(tōng)了。
     3)思考
     我們現在終于可以根據主機(jī)的MAC地址來進行分組交換轉發了,但這隻是兩台主機(jī)的固定交換轉發,如果機(jī)器(qì)MAC多(duō)了怎麽辦?如果機(jī)器(qì)連接交換機(jī)的端口變了怎麽辦?我們需要有一(yī)張記錄表,能(néng)夠記錄哪個(gè)MAC地址在哪個(gè)端口就(jiù)好了,通(tōng)過每個(gè)分組的目的MAC來查找其對應的輸出端口,這樣就(jiù)很容易實現分組交換了。
     1)交換過程的核心數據字段
     從(cóng)上(shàng)述實驗可以看(kàn)出,目前交換裡(lǐ)面用到(dào)的就(jiù)兩個(gè)字段,一(yī)個(gè)是端口号,另一(yī)個(gè)是MAC地址。那目的MAC地址與輸出端口号從(cóng)哪獲得?其實就(jiù)是從(cóng)分組頭的源MAC地址和輸入端口轉換變成目的MAC和輸出端口。故在交換過程中,其核心數據就(jiù)2個(gè):端口号和MAC地址。
     2)MAC轉發表設計與驗證
     MAC轉發表就(jiù)是我們前面提到(dào)的記錄表,這張表記錄了一(yī)個(gè)MAC地址與其對應端口号的綁定關系,這一(yī)關系要從(cóng)輸入分組數據中提取而來,由分組的輸入端口與源MAC地址組成這一(yī)綁定關系,在查表中便可通(tōng)過目的MAC來獲取其正确的輸出端口了。下(xià)一(yī)篇文章我們聊一(yī)下(xià)MAC轉發表的設計。
      歡迎您和學生(shēng)們加入FAST開(kāi)源項目群溝通(tōng)與探讨,一(yī)起體驗不一(yī)樣的系統設計過程。請先加微信号15116127200後邀請入群。

關注FAST開(kāi)源社區
FAST一(yī)一(yī)開(kāi)源、開(kāi)放(fàng)、高(gāo)速、高(gāo)效、可編程、可定義!軟硬件(jiàn)協同并行處理。