從網(wǎng)絡(luò)發(fā)展看無(wú)線網(wǎng)絡(luò)故障排查需求

2016-11-29 09:07:18 來(lái)源:三聯(lián)教程作者:佚名 人氣: 次閱讀 563 條評(píng)論

  一、當(dāng)最后100米無(wú)線化  所有對(duì)網(wǎng)絡(luò)故障維護(hù)有較長(zhǎng)期經(jīng)驗(yàn)的人都清楚,早期網(wǎng)絡(luò)大概75%左右的故障來(lái)自于物理連接故障,也就是來(lái)自于網(wǎng)線或物理接口。后期伴隨綜合布線理念的貫徹與執(zhí)行,制造工藝的提升,線纜與接口質(zhì)...

  一、當(dāng)最后100米無(wú)線化

  所有對(duì)網(wǎng)絡(luò)故障維護(hù)有較長(zhǎng)期經(jīng)驗(yàn)的人都清楚,早期網(wǎng)絡(luò)大概75%左右的故障來(lái)自于物理連接故障,也就是來(lái)自于網(wǎng)線或物理接口。后期伴隨綜合布線理念的貫徹與執(zhí)行,制造工藝的提升,線纜與接口質(zhì)量的提升,這一故障的比例大幅度降低了。那么當(dāng)我們的最后100米無(wú)線化之后,網(wǎng)線和物理接口會(huì)出現(xiàn)什么樣的情況呢?

  1.1 靈活性的大躍進(jìn)與技術(shù)本身的退步

  首先我們應(yīng)該有一個(gè)明確的認(rèn)識(shí),無(wú)線WLAN網(wǎng)絡(luò)事實(shí)上是網(wǎng)絡(luò)靈活性的提升和網(wǎng)絡(luò)技術(shù)的倒退。從技術(shù)角度講,WLAN本身將網(wǎng)絡(luò)技術(shù)倒退了至少5-10年,即從交換式以太網(wǎng)年代退回到共享式以太網(wǎng)年代。這種倒退從物理介質(zhì)角度而言尤甚,因?yàn)樵诋?dāng)前的交換式以太網(wǎng)技術(shù)中,每個(gè)用戶是獨(dú)享傳輸介質(zhì)的,但是在無(wú)線技術(shù)中,所有的用戶共享物理信道,只要用戶間相互可見,無(wú)論有多少個(gè)AP,所有工作在同一頻點(diǎn)的用戶共享相同的物理介質(zhì)。這就是典型的同軸共享式以太網(wǎng)或基于HUB的共享式以太網(wǎng)的特征。

  那么在共享式以太網(wǎng)里需要考慮的物理數(shù)據(jù)碰撞、網(wǎng)絡(luò)用戶量與數(shù)據(jù)量規(guī)模無(wú)法無(wú)限擴(kuò)展等問(wèn)題重新歸來(lái),因此網(wǎng)絡(luò)排錯(cuò)時(shí)需要考慮的因素增加了。

  1.2 便捷性與管理復(fù)雜度的雙重提升

  相較以太網(wǎng),WLAN在提升便捷性的同時(shí),其傳輸介質(zhì)發(fā)生了明顯的變化,從現(xiàn)在幾乎絕對(duì)可信的銅纜和光纖變?yōu)榻^對(duì)不可信的頻譜資源,因此,管理無(wú)線網(wǎng)絡(luò)的網(wǎng)管人員除必須擁有管理以太網(wǎng)絡(luò)必備的充足TCP/IP知識(shí)外,還必須理解無(wú)線網(wǎng)絡(luò)中的射頻知識(shí),例如對(duì)信噪比、信號(hào)強(qiáng)度、發(fā)射功率、天線增益、干擾等概念的真正理解,以及對(duì)802.11協(xié)議的獨(dú)特特性,例如重傳的概念的真正理解。管理無(wú)線網(wǎng)絡(luò)對(duì)網(wǎng)管員的知識(shí)體系提出了新的挑戰(zhàn),并且對(duì)接入介質(zhì)的管理復(fù)雜度呈幾何級(jí)提升。

  1.3 從管理“有”到管理“無(wú)”

  傳統(tǒng)以太網(wǎng)是有線網(wǎng)絡(luò),所有的連接是可見的,某個(gè)終端連接到具體哪個(gè)設(shè)備是明確的。而無(wú)線網(wǎng)絡(luò)的連接是不可見的,某個(gè)終端在整個(gè)的接入過(guò)程中會(huì)不斷的發(fā)生切換,從一個(gè)接入設(shè)備切換到另外一個(gè)接入設(shè)備。在某些極端情況下,設(shè)備會(huì)在兩個(gè)不同的接入AP之間一分鐘之內(nèi)切換幾十甚至上百次,并且這種切換完全由客戶端決定,傳統(tǒng)網(wǎng)管軟件的刷新速率已經(jīng)完全無(wú)法把握這種情況,這無(wú)疑成為如何進(jìn)行無(wú)線網(wǎng)絡(luò)管理所需解決的又一個(gè)重點(diǎn)問(wèn)題。

  二、摩托羅拉系統(tǒng)將無(wú)線故障排查可視化

  2.1 無(wú)線網(wǎng)絡(luò)拓?fù)涞目梢暬?/p>

  不一樣的無(wú)線網(wǎng)絡(luò)拓?fù)洹.?dāng)討論有線網(wǎng)絡(luò)拓?fù)鋱D時(shí),我們只需將客戶端簡(jiǎn)單地連接到接入交換機(jī)的物理接口即可。但是在無(wú)線里同一個(gè)AP還需要討論其ESS/BSS的問(wèn)題,因此拓?fù)鋱D應(yīng)該是客戶端接入了哪一個(gè)BSS,然后這個(gè)BSS接入到哪一個(gè)ESS。所以,無(wú)線網(wǎng)絡(luò)的拓?fù)鋱D與有線網(wǎng)絡(luò)的拓?fù)鋱D是完全不同的。

從網(wǎng)絡(luò)發(fā)展看無(wú)線網(wǎng)絡(luò)故障排查需求三聯(lián)

  2.2 不同的物理狀態(tài)

  在無(wú)線領(lǐng)域中,沒(méi)有明確的線纜連接,只有無(wú)線區(qū)域的覆蓋好壞,而且無(wú)線網(wǎng)絡(luò)的動(dòng)態(tài)特征導(dǎo)致這種覆蓋好壞是變化的。因此,我們需要實(shí)時(shí)熱圖來(lái)監(jiān)控整個(gè)無(wú)線網(wǎng)絡(luò),使其真正的可視起來(lái)。

無(wú)線網(wǎng)絡(luò)

  2.3 物理層排錯(cuò)

  在物理層排錯(cuò)時(shí),大家普遍認(rèn)為無(wú)線的干擾是網(wǎng)絡(luò)質(zhì)量的罪魁禍?zhǔn)?。但是事?shí)上,無(wú)線網(wǎng)絡(luò)中的資源利用率和干擾強(qiáng)度的組合才是真正的問(wèn)題所在,而且干擾不僅僅是WLAN對(duì)WLAN的干擾,還包括其它同頻干擾,例如微波、2.4GHz無(wú)線電遙控射頻信號(hào)或者藍(lán)牙信號(hào)。因此,在物理層排錯(cuò)中,我們必須對(duì)所有的干擾源進(jìn)行分析,同時(shí)對(duì)其資源利用率進(jìn)行監(jiān)控。僅僅通過(guò)網(wǎng)上某些免費(fèi)的工具是不能夠真正定位問(wèn)題所在的。

  舉一個(gè)簡(jiǎn)單的例子,大家隨便找兩個(gè)AP,將其設(shè)定在同一個(gè)信道上,然后把它們的發(fā)射功率調(diào)到最大,物理間隔僅10厘米。用傳統(tǒng)軟件看,這種干擾是極強(qiáng)的。但是如果有一個(gè)AP上有用戶,另外一個(gè)AP上一個(gè)用戶都沒(méi)有,或者即使兩個(gè)AP都有用戶,在AP的競(jìng)爭(zhēng)策略設(shè)定合理、用戶流量不大的情況下,我們的上網(wǎng)感知仍然會(huì)相當(dāng)好。

  相反,如果我們將兩個(gè)AP之間的距離拉遠(yuǎn)到30米,每個(gè)AP上都接入用戶,并且采用大流量,此時(shí),用傳統(tǒng)軟件看到的干擾會(huì)較小,但是實(shí)際的使用感知卻非常差。

  還有一種情況,如果我們只使用一個(gè)AP,并讓幾個(gè)用戶同時(shí)接入,在用戶處在互相不可見的位置同時(shí)觀看高質(zhì)量視頻時(shí),所有用戶的感知都會(huì)很差。但在這種情況下,傳統(tǒng)軟件會(huì)認(rèn)為這是沒(méi)有干擾的。

  摩托羅拉系統(tǒng)選擇對(duì)整個(gè)無(wú)線網(wǎng)絡(luò)的整個(gè)物理層實(shí)現(xiàn)完整的呈現(xiàn),包括各個(gè)信道的干擾強(qiáng)度、信道使用率以及是否有非WLAN的干擾。在下圖的示例中,信道11的干擾高達(dá)-25dBm,但是利用率只有5%,而信道1的干擾在-40到-50dBm之間,接口利用率卻高達(dá)100%,而且是持續(xù)的微波干擾。在這種情況下,信道1干擾小,但基本是不可使用的。信道11干擾極強(qiáng),卻一定是客戶體驗(yàn)最好的。因此,物理層可視化在無(wú)線網(wǎng)絡(luò)中是非常重要的。

無(wú)線網(wǎng)絡(luò)

  2.3 您真的知道網(wǎng)絡(luò)的情況嗎?

  在傳統(tǒng)以太網(wǎng)中,如果用戶出現(xiàn)玩游戲頻繁“卡”的情況,那么,查看一下互聯(lián)網(wǎng)出口的擁塞程度和用戶Ping DHCP服務(wù)器的響應(yīng)時(shí)間,就基本可以定位問(wèn)題所在了。但是對(duì)于無(wú)線網(wǎng)絡(luò)而言,頻繁“卡”很有可能是無(wú)線和有線雙重因素導(dǎo)致。

  如果是響應(yīng)較慢,需要定位是無(wú)線慢還是有線慢;如果是無(wú)線慢,還要確認(rèn)是哪種無(wú)線因素導(dǎo)致了緩慢。那么,到底是由于干擾、沖突、,無(wú)線網(wǎng)絡(luò)整體性能不足還是覆蓋不合理的頻繁漫游切換導(dǎo)致了這個(gè)問(wèn)題呢?

  有些時(shí)候,由于無(wú)線網(wǎng)絡(luò)是共享式的,我們?cè)跓o(wú)線中只要有一個(gè)或幾個(gè)用戶是低速率用戶,整體網(wǎng)絡(luò)性能就會(huì)大幅度的下降。在20個(gè)終端中部分是802.11n AP的網(wǎng)絡(luò)(如18個(gè)802.11n加2個(gè)802.11b),其整體網(wǎng)絡(luò)性能可能遠(yuǎn)遠(yuǎn)低于20個(gè)均是802.11g的網(wǎng)卡。因此,如果一個(gè)用戶玩游戲卡,很有可能是另外一個(gè)用戶的網(wǎng)卡速率低造成的。

  另外,如何排查用戶在兩個(gè)AP間頻繁切換的問(wèn)題呢?如何排查用戶的性能是由于干擾造成的呢?對(duì)于無(wú)線網(wǎng)絡(luò)的排錯(cuò)需要看一個(gè)信道、一個(gè)用戶、一個(gè)BSS的整體情況,而不是僅僅排查某個(gè)用戶。

  摩托羅拉系統(tǒng)通過(guò)一個(gè)界面可以遠(yuǎn)程的了解數(shù)據(jù)的信號(hào)噪聲比(干擾)、用戶的重傳(空口負(fù)載情況)、數(shù)據(jù)傳輸速率(是否有低速率用戶影響了整個(gè)網(wǎng)絡(luò)性能)、用戶的傳輸信道分配(是否用戶短時(shí)間內(nèi)在兩個(gè)不同信道內(nèi)發(fā)射,也就是在頻繁漫游),完全可視化地監(jiān)控全部可能存在的故障。

無(wú)線網(wǎng)絡(luò)

  如果網(wǎng)管人員不足、無(wú)法實(shí)時(shí)監(jiān)控時(shí),摩托羅拉系統(tǒng)可以定義網(wǎng)絡(luò)質(zhì)量劣化的兩大重要指標(biāo)——傳輸速率和重傳率的門限,對(duì)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)監(jiān)控,一旦指標(biāo)超越門限值即可通過(guò)告警了解到這一情況,并且通過(guò)對(duì)歷史數(shù)據(jù)的詳細(xì)分析確認(rèn)網(wǎng)絡(luò)故障的具體原因。

  例如從附圖中網(wǎng)管員了解過(guò)去24小時(shí)中的不同類型報(bào)文比例,如果將這一趨勢(shì)分析放大到季度或者年度,我們又可以分析網(wǎng)絡(luò)趨勢(shì),及時(shí)調(diào)整網(wǎng)絡(luò)以避免問(wèn)題的大規(guī)模爆發(fā)。

無(wú)線網(wǎng)絡(luò)
無(wú)線網(wǎng)絡(luò)
無(wú)線網(wǎng)絡(luò)

  三、通過(guò)故障排查可視化確保網(wǎng)絡(luò)的真正可用性

  網(wǎng)絡(luò)最后100米由WLAN接管是大勢(shì)所趨,應(yīng)用的多終端協(xié)同化是大勢(shì)所趨,關(guān)鍵應(yīng)用效率提升通過(guò)移動(dòng)應(yīng)用方式實(shí)現(xiàn)也是大勢(shì)所趨。無(wú)線網(wǎng)絡(luò)技術(shù)倒退是實(shí)際情況,無(wú)線網(wǎng)絡(luò)的物理介質(zhì)脆弱是實(shí)際情況,無(wú)線網(wǎng)絡(luò)不可視也是實(shí)際情況。

  要求無(wú)線網(wǎng)絡(luò)完全無(wú)故障是不現(xiàn)實(shí)的,在這樣的實(shí)際要求下,無(wú)線網(wǎng)絡(luò)故障排查的高效率是我們必須提供的,尤其是將關(guān)鍵應(yīng)用部署于無(wú)線之上的機(jī)構(gòu)。