說明如何使用Linux 的 Equal-Cost MultiPath Routing (ECMP)
功能來實現兩條線路頻寬合用的功能
(cont)
Linux ADSL Multipath Routing Solution
By Tommy Wu
由於前些日子, 我所服務的單位, 決定將原本使用的專線退租, 改用 ADSL 來提供
上網的服務, 為了降低 ADSL 斷線無法連線的情形, 所以由 SeedNet, Hinet 各申
請了一條單機型的 T1/384 ADSL 來使用.
但是一般 ISP 業者似乎沒有提供兩條線路頻寬合用的服務, 更何況是使用兩家不同
ISP 的線路, 所以決定自己利用 Linux 的 Equal-Cost MultiPath Routing (ECMP)
功能來解決這個問題.
關於 ECMP 的設定說明, 可以參考
http://www.study-area.org/tips/m_routing.htm
初期, 我利用上述的功能來處理, 但是發現效率不怎麼好, 由於路由的決定, 並不
是依據 packet 來傳送, 所以出去的時候, 同一個 session 只會使用一條線路,
仍然會常常造成, 明明另一條線路沒有什麼流量, 但是大家都擠在同一條線路的情
形發生.
在 iproute2 的說明中有提到 equalize 參數, 會將 packet 分散到不同的線路上
面, 但是 kernel 需要另外的 patch 才能運作, 上網查了一下, 有找到下面這個
patch:
http://www.van-dijk.net/linuxkernel/200212/att-0980/01-equalize_2.4.18.patch
測試後發現的確可以同時使用不同的線路傳送 packet. 現在說明一下, 如何做到這
個功能:
1. 你必須要有 iproute2 套件. 另外由於要對 kernel 加上另外的 patch, 所以相關
的工具也是必要的.
2. 由 www.kernel.org 抓下 linux-2.4.18.tar.bz2 與上述的 patch.
上述的 patch, 我在 2.4.18 之後的版本都裝過, 都可以正常使用, 之前的 kernel
沒有試過, 並不清楚… 不過 2.4.18 應該算是 2.4 版本中最穩定的一個版本, 如
果你還在用舊的 kernel, 建議升級到這個版本.
tommywu@fw:/usr/src$ tar jxvf linux-2.4.18.tar.bz2
..
..
tommywu@fw:/usr/src$ cd linux
tommywu@fw:/usr/src/linux$ patch -p1 < ../01-equalize_2.4.18.patch
patching file Documentation/networking/load-balancing.txt
patching file include/linux/in_route.h
patching file net/ipv4/fib_semantics.c
patching file net/ipv4/ip_output.c
patching file net/ipv4/route.c
patching file net/ipv4/udp.c
這個 patch 並不會新增任何的設定, 所以你可以參考上述 ECMP 文件中的設定選
項來設定你的 kernel. 然後重新 make 一個新的 kernel 來使用. 我通常會選取
下面這幾個功能:
CONFIG_IP_MULTICAST=y
CONFIG_IP_ADVANCED_ROUTER=y
CONFIG_IP_MULTIPLE_TABLES=y
CONFIG_IP_ROUTE_FWMARK=y
CONFIG_IP_ROUTE_NAT=y
CONFIG_IP_ROUTE_MULTIPATH=y
CONFIG_IP_ROUTE_TOS=y
CONFIG_IP_ROUTE_VERBOSE=y
CONFIG_IP_ROUTE_LARGE_TABLES=y
3. 利用上面的 kernel 重新開機之後, 就應該可以使用 equalize 參數了. 多數的設
定都與上述的 ECMP 文件相同, 只是多了一個 equalize 參數. 舉例來說:
# 對外網卡
EXT_IF=”eth0″
# HiNet IP
EXT_IP1=”111.111.111.111″
EXT_MASK1=”24″
GW1=”111.111.111.1″
# SeedNet IP
EXT_IP2=”222.222.222.222″
EXT_MASK2=”24″
GW2=”222.222.222.1″
# 設定 ip
ip addr add $EXT_IP1/$EXT_MASK1 dev $EXT_IF
ip addr add $EXT_IP2/$EXT_MASK2 dev $EXT_IF
# 設定 HiNet routing
ip rule add from $EXT_IP1 lookup 201
ip route add default via $GW1 dev $EXT_IF table 201
# 設定 SeedNet routing
ip rule add from $EXT_IP2 lookup 202
ip route add default via $GW2 dev $EXT_IF table 202
# 設定 Default route
ip route replace default equalize \
nexthop via $GW1 dev $EXT_IF \
nexthop via $GW2 dev $EXT_IF
# 清除 route cache
ip route flush cache
利用上面的設定, 我們就可以將兩條線路合併使用. 以 T1/384 的 ADSL 來說, 一般
上傳的頻寬約可到 40KB 上下, 現在利用這個 patch, 我們上傳一個檔案試看看:
tommywu@hisstby:/usr/src$ ftp ftp.teatime.com.tw
Connected to www.teatime.com.tw.
220 ProFTPD 1.2.5rc1 Server (Debian) [211.23.144.122]
Name (ftp.teatime.com.tw:tommywu): tommy
331 Password required for tommy.
Password:
230 User tommy logged in.
Remote system type is UNIX.
Using binary mode to transfer files.
ftp> bin
200 Type set to I.
ftp> put patch-2.4.19-pre6.bz2
local: patch-2.4.19-pre6.bz2 remote: patch-2.4.19-pre6.bz2
200 PORT command successful.
150 Opening BINARY mode data connection for patch-2.4.19-pre6.bz2.
226 Transfer complete.
3858685 bytes sent in 49.92 secs (75.5 kB/s)
ftp> quit
221 Goodbye.
tommywu@hisstby:/usr/src$
可以超過 40KB, 也就是的確會同時使用到兩條線路來傳送.
如果有興趣, 可以到下列的網址查看流量:
http://fw1.tahsda.org.tw/stats/mrtg/
http://fw2.tahsda.org.tw/stats/mrtg/
要注意這只有出去的 packet 是我們這端所能控制的, 回來的 packet 就不是我們
可以控制了, 所以出去的流量在不同的線路上看起來是類似的, 但是回來的流量就
不一定了. 如果要控制進來的流量, 可能要利用 DNS 的方式來控制了.
接下來, 要考慮一條線路斷線時, 要改變 routing table 的設定. 由於 ADSL router
應該都有支援 SNMP 的功能, 所以我們可以利用 SNMP 來判斷是否斷線. 你要先確定你
的 linux 中有 snmpd, snmp 套件.
我們有兩種方式來處理, 第一種是利用 snmp traps.
以 arcatel 340 來說, 內定的 password 應該是 12345.
telnet 192.168.1.1 之後, 打入密碼, 在 > 符號打入 snmp, 就會進入 snmp> 設定
目錄, 打入 snmp trap help 有說明如下:
snmp trap add
– add a trap destination
snmp trap delete
– delete a trap destination
snmp trap flush – delete all trap destinations
snmp trap list – list trap destinations
假定你要收 trap 的 ip 是 192.168.1.254, 就打入
snmp trap add public 192.168.1.254
就可以了. 這樣就應該在該機器可以收到相對的 snmp traps.
以上面 Hinet/SeedNet 兩個線路來說, 如果要在同一網段上, 要先改變其中一個 ATU-R
的 ip 才可以, 內定都是 192.168.1.1, 我們把其中一個改成 192.168.1.2
然後在 192.168.1.254 機器上安裝 snmptrapd, 修改 /etc/snmp/snmptrapd.conf
加上下面兩行:
traphandle .1.3.6.1.6.3.1.1.5.2 /usr/local/bin/adsl_up
traphandle .1.3.6.1.6.3.1.1.5.3 /usr/local/bin/adsl_down
然後寫 adsl_up, adsl_down 兩個 script 來更改 route table.
內容大約是:
#!/bin/bash
read DUMMY_HOST
read ROUTE_IP
case “$ROUTE_IP” in
192.168.1.1)
ip route replace default ….
;;
*)
echo “snmp traps from unknown ip?”
esac
這樣子就會在每次斷線或恢復連線時收到 ATU-R 的通知了.
另外, 如果不想使用 snmp trap, 要使用 polling 的方式, 主動去查詢線路情形,
可以使用 snmpwalk 來處理, 用上面的例子, 可以先執行
snmpwalk 192.168.1.1 public interfaces.ifTable.ifEntry
會出現一堆資料, 看一下 adsl 在的 index 是 20.
interfaces.ifTable.ifEntry.ifDescr.20 = ADSL physical interface
interfaces.ifTable.ifEntry.ifType.20 = adsl(94)
線路狀態在
interfaces.ifTable.ifEntry.ifOperStatus.20 = up(1)
up(1) 表示連線中, 所以執行
snmpwalk 192.168.1.1 public interfaces.ifTable.ifEntry.ifOperStatus.20
會得到
interfaces.ifTable.ifEntry.ifOperStatus.20 = up(1)
當斷線時, 上面就不會在 up(1) 的狀態.
所以可以寫個 adsl_test 的 script
snmpwalk 192.168.1.1 public interfaces.ifTable.ifEntry.ifOperStatus.20 |
grep “up(1)” | wc -l
如果得到 0 就是斷線.
上面就是使用 snmpwalk 來查詢線路的方法. 這個我在 arcatel 340 上面使用,
可以正確得知線路的情形. 另外, 在我家的 cisco 677 上, 在 bridge mode 下,
使用 snmpwalk 查詢線路都是 up(1), 無法知道線路情形… 不過如有異動, 仍可
以收到對應的 snmp traps.
這兩種方式各有利弊, 第一種方式無法得知一開始的狀態, 第二種方式無法即時
得知狀態的改變, 所以通常會同時利用兩種方式來處理, 以上述的例子來說, 我
們可以使用下列的 script 來處理:
#!/bin/bash
# chk_adsl: check the status of ADSL and change routing table
# SNMP tree
SNMP_KEY=”interfaces.ifTable.ifEntry.ifOperStatus.20″
# 對外網卡
EXT_IF=”eth0″
# HiNet IP
EXT_ATUR1=”192.168.1.1″
EXT_IP1=”111.111.111.111″
EXT_MASK1=”24″
GW1=”111.111.111.1″
# SeedNet IP
EXT_ATUR2=”192.168.1.2″
EXT_IP2=”222.222.222.222″
EXT_MASK2=”24″
GW2=”222.222.222.1″
STATUS1=`snmpwalk $EXT_ATUR1 public $SNMP_KEY | grep “up(1)” | wc -l`
STATUS2=`snmpwalk $EXT_ATUR2 public $SNMP_KEY | grep “up(1)” | wc -l`
if [ “$STATUS1” = “0” ]; then
if [ “$STATUS2” = “0” ]; then
# ALL line down
echo -e “\n\
ALL ADSL DOWN!\n\
Date: $(date)\n\
Host: $(hostname)\n\
” | /bin/mail -s “$(date) ALL ADSL DOWN!” root
else
# ATUR1 down, ATUR2 up
echo -e “\n\
ADSL $EXT_ATUR1 DOWN!\n\
Date: $(date)\n\
Host: $(hostname)\n\
” | /bin/mail -s “$(date) ADSL $EXT_ATUR1 DOWN!” root
ip route relpace default via $GW2 dev $EXT_IF
ip route flush cache
fi
else
if [ “$STATUS2” = “0” ]; then
# ATUR1 up, ATUR2 down
echo -e “\n\
ADSL $EXT_ATUR2 DOWN!\n\
Date: $(date)\n\
Host: $(hostname)\n\
” | /bin/mail -s “$(date) ADSL $EXT_ATUR2 DOWN!” root
ip route relpace default via $GW1 dev $EXT_IF
ip route flush cache
else
# All line up
echo -e “\n\
ALL ADSL UP!\n\
Date: $(date)\n\
Host: $(hostname)\n\
” | /bin/mail -s “$(date) ALL ADSL UP!” root
ip route replace default equalize \
nexthop via $GW1 dev $EXT_IF \
nexthop via $GW2 dev $EXT_IF
ip route flush cache
fi
fi
利用上面的 script, 我們只要在 snmptrapd.conf 中將相關的 traphandle
指到這一個 script, 就可以依照線路的狀態來做對應的處理. 當然, 如果你
的線路不只兩條, 我想應該也可以照上面的作法自己試試看.
本文的最新版本可以由下列的網頁取得:
http://www.teatime.com.tw/~tommy/doc/multipath.txt