發(fā)布時(shí)間:2022-05-26 文章來(lái)源:深度系統(tǒng)下載 瀏覽:
網(wǎng)絡(luò)技術(shù)是從1990年代中期發(fā)展起來(lái)的新技術(shù),它把互聯(lián)網(wǎng)上分散的資源融為有機(jī)整體,實(shí)現(xiàn)資源的全面共享和有機(jī)協(xié)作,使人們能夠透明地使用資源的整體能力并按需獲取信息。資源包括高性能計(jì)算機(jī)、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資源、專家資源、大型數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、傳感器等。 當(dāng)前的互聯(lián)網(wǎng)只限于信息共享,網(wǎng)絡(luò)則被認(rèn)為是互聯(lián)網(wǎng)發(fā)展的第三階段。 癥狀 某著名系統(tǒng)集成商專門負(fù)責(zé)政府網(wǎng)建設(shè)的項(xiàng)目經(jīng)理羅先生今天十萬(wàn)火急地到網(wǎng)絡(luò)醫(yī)院電話急診,請(qǐng)求緊急支援。 羅先生反映的網(wǎng)絡(luò)故障表現(xiàn)很簡(jiǎn)單:基本上所有的網(wǎng)絡(luò)成員訪問(wèn)網(wǎng)絡(luò)資源的速度都非常緩慢,Ping測(cè)試聯(lián)通性表現(xiàn)良好,均在2ms以內(nèi),從服務(wù)器上拷貝一個(gè)20Mbytes的文件竟需要5分鐘。 調(diào)試人員曾試著從相鄰的工作站上拷貝一個(gè)20Mbytes,對(duì)比結(jié)果顯示同樣也需要5分多鐘的時(shí)間。懷疑是操作系統(tǒng)和系統(tǒng)軟件平臺(tái)安裝上的問(wèn)題,特別是服務(wù)器安裝上的問(wèn)題。調(diào)試人員已經(jīng)將所有用戶重新安裝過(guò)兩遍,憑借以往安裝系統(tǒng)的豐富經(jīng)驗(yàn),他們十分有把握地保證操作系統(tǒng)和軟件平臺(tái)安裝設(shè)置沒(méi)有問(wèn)題。 為了了解數(shù)據(jù)包在網(wǎng)絡(luò)中傳輸?shù)膶?duì)話情況,又從朋友哪里借了一臺(tái)協(xié)議分析儀對(duì)收發(fā)包進(jìn)行測(cè)試,結(jié)果顯示包的收發(fā)反應(yīng)時(shí)間基本正常,只是包的轉(zhuǎn)發(fā)時(shí)間間隔很長(zhǎng),無(wú)法進(jìn)一步確定是哪個(gè)環(huán)節(jié)的問(wèn)題所至。網(wǎng)絡(luò)的公共部分是一臺(tái)10/100核心交換機(jī)和三臺(tái)服務(wù)器,服務(wù)器直接與核心交換機(jī)相連,其它工作站則通過(guò)下屬的工作組交換機(jī)和集線器等與之相連。起初懷疑是交換機(jī)的問(wèn)題,試著更換了一臺(tái)同型號(hào)的交換機(jī),故障依舊。從另一家主代理商哪里借來(lái)一臺(tái)服務(wù)器作替換試驗(yàn)也無(wú)效。 診斷過(guò)程 首先從一臺(tái)工作站上Ping服務(wù)器和任意選定的位子網(wǎng)內(nèi)的其它5臺(tái)工作站,響應(yīng)時(shí)間均小于1ms,說(shuō)明聯(lián)通性尚可。調(diào)試人員懷疑是交換機(jī)問(wèn)題的可能性是存在的,但我們認(rèn)為證據(jù)不足。這是因?yàn)閺泥徑墓ぷ髡局苯涌截愇募埠苈@時(shí)數(shù)據(jù)包不經(jīng)過(guò)核心交換機(jī),有的雖通過(guò)工作組或桌面交換機(jī),但有的則直接通過(guò)集線器。所以故障的公共部位比較可能的是新的布線系統(tǒng)、操作系統(tǒng)和系統(tǒng)軟件平臺(tái)、關(guān)鍵網(wǎng)絡(luò)設(shè)備本身的故障或錯(cuò)誤、網(wǎng)卡驅(qū)動(dòng)程序錯(cuò)誤等等。 用網(wǎng)絡(luò)測(cè)試儀實(shí)施流量貫通測(cè)試,選擇從任意一臺(tái)工作站到服務(wù)器為一條通道,再任意選擇該工作站到其它5臺(tái)工作站直接的通道,共6條測(cè)試通道作試驗(yàn)樣本。從測(cè)試儀上分別發(fā)送正常的IP包流量到上述6個(gè)對(duì)象,流量選定為健康指標(biāo)的上限值,即40%。用網(wǎng)絡(luò)一點(diǎn)通在被測(cè)試的站點(diǎn)模擬網(wǎng)絡(luò)設(shè)備配合接收流量,結(jié)果發(fā)現(xiàn)收到的流量都不足1%,且廣播包占20%以上。 縮短流量貫通路徑,直接向鄰近的工作站發(fā)送流量,結(jié)果收到的流量有兩種明顯的結(jié)果。一是流量大量增加,達(dá)28%左右,其路徑是通過(guò)集線器連接的通道,屬于正常表現(xiàn)。另一種結(jié)果同前面觀察到的現(xiàn)象一致,收到約1%左右流量幀。觀察收到的28%幀流量的結(jié)構(gòu),其中92%~98%為碰撞幀,少量FCS幀。由于鄰近的工作站是用集線器連接的,發(fā)生如此高的碰撞最大的可能性是電纜系統(tǒng)的問(wèn)題。 我們隨即測(cè)試該六類鏈路,并任意抽查了其它5條六類線鏈路,測(cè)試全部合格。說(shuō)明鏈路的物理聯(lián)通性是合格的。但因?yàn)榧器、交換機(jī)等的物理接口是超五類的元件,六類線鏈路從理論上和廠家的承諾上講應(yīng)該與其能兼容。觀察用于發(fā)送40%流量的網(wǎng)絡(luò)測(cè)試儀自身的流量記錄,其監(jiān)測(cè)到的碰撞率與上面的結(jié)果一致,也是92%~98%左右。這提示該六類線鏈路可能與10/100M的網(wǎng)絡(luò)設(shè)備阻抗不匹配。 為了慎重起見,我們用兩條超五類線纜連接兩臺(tái)相鄰的工作站,再次試驗(yàn)拷貝文件,結(jié)果故障依舊。這說(shuō)明六類線系統(tǒng)不是真正的故障原因。剩下的問(wèn)題就是需要確認(rèn)端口匹配性、工作站工作協(xié)議、配置、驅(qū)動(dòng)程序、物理參數(shù)是否與網(wǎng)絡(luò)匹配了。方法很簡(jiǎn)單,將在線型網(wǎng)絡(luò)萬(wàn)用表串入工作站和網(wǎng)絡(luò)端口。結(jié)果顯示如下:一臺(tái)工作站的工作速度為100M,端口設(shè)置為全雙工,而對(duì)應(yīng)的集線器設(shè)置為100M半雙工;另一臺(tái)工作站工作速度為100M,端口設(shè)置為半雙工,對(duì)應(yīng)的交換機(jī)設(shè)置為半雙工。羅先生告知,網(wǎng)絡(luò)中的網(wǎng)卡使用了三家公司的產(chǎn)品,都是非常知名的廠商。A公司的產(chǎn)品占90%,其余則為B公司的產(chǎn)品,另外,服務(wù)器使用的是服務(wù)器廠商C公司自己的網(wǎng)卡。 我們抽測(cè)了A公司的10個(gè)網(wǎng)卡,用網(wǎng)絡(luò)萬(wàn)用表測(cè)試,顯示設(shè)置全部是全雙工;而抽測(cè)的5個(gè)B公司的網(wǎng)卡則全部是半雙工設(shè)置。我們選擇相鄰的兩臺(tái)安裝了B公司網(wǎng)卡的工作站拷貝文件,結(jié)果發(fā)現(xiàn)拷貝速度非常快,約3秒鐘。 接下來(lái)我們把兩臺(tái)安裝有A公司網(wǎng)卡的相鄰工作站用A公司隨配的軟件將網(wǎng)卡強(qiáng)制改為半雙工狀態(tài),20Mbytes文件拷貝時(shí)間也是3秒鐘。 選擇被試工作站到服務(wù)器的通道,它們通過(guò)一臺(tái)集線器,兩臺(tái)交換機(jī)后到達(dá)服務(wù)器。依次測(cè)試鏈路中的速度和工作狀態(tài),結(jié)果發(fā)現(xiàn)服務(wù)器網(wǎng)卡也是全雙工設(shè)置狀態(tài)。更改后試驗(yàn)從服務(wù)器上拷貝一個(gè)100Mbytes的文件,耗時(shí)約13秒。說(shuō)明性能比較優(yōu)良。 診斷評(píng)點(diǎn) 故障的原因已經(jīng)很清楚,該系統(tǒng)集成商選用了三家公司的網(wǎng)卡,而其中的A公司網(wǎng)卡被全部被默認(rèn)設(shè)置為全雙工狀態(tài)(原因不詳,但可以調(diào)整),服務(wù)器也被偶然地設(shè)置為全雙工狀態(tài)。但系統(tǒng)中的交換機(jī)、集線器等都工作在半雙工狀態(tài),所以,凡事先安裝有A公司網(wǎng)卡的工作站工作速度都很長(zhǎng)慢。其它安裝了B公司網(wǎng)卡的工作站,雖然自身設(shè)置是正確的,但由于數(shù)量少,只站不足10%,加之服務(wù)器也被設(shè)置為全雙工狀態(tài),所以調(diào)試時(shí)很可能與A公司或C公司的網(wǎng)卡進(jìn)行數(shù)據(jù)對(duì)接,這樣速度就無(wú)法正常。 如果偶然地與同類B公司網(wǎng)卡進(jìn)行數(shù)據(jù)交換,則調(diào)試人員應(yīng)該會(huì)有機(jī)會(huì)發(fā)現(xiàn)雖然所有的工作站與服務(wù)器連接速度慢,但并不是所有的工作站之間直接聯(lián)絡(luò)時(shí)的速度都慢這一現(xiàn)象。不過(guò),因?yàn)锳公司產(chǎn)品數(shù)量居多,服務(wù)器設(shè)置又不正常,所以這樣的機(jī)會(huì)不多。 網(wǎng)卡的協(xié)議設(shè)置和工作設(shè)置會(huì)直接影響工作站的速度。一般來(lái)講,工作站的協(xié)議設(shè)置多數(shù)時(shí)候不容易出錯(cuò),但是否與網(wǎng)絡(luò)的工作協(xié)議一致則有時(shí)會(huì)弄混。比較容易出錯(cuò)的是10/100M設(shè)置狀態(tài)、全雙工半雙工設(shè)置狀態(tài)、鏈路數(shù)字脈沖極性選擇等,這些方面的錯(cuò)誤由于網(wǎng)絡(luò)維護(hù)人員和安裝調(diào)試人員的有意無(wú)意地疏忽,加上沒(méi)有合適的檢測(cè)方法和工具,往往會(huì)給系統(tǒng)集成商造成很大的麻煩,而故障原因卻是如此地簡(jiǎn)單。 很多時(shí)候調(diào)試人員使用網(wǎng)卡和交換機(jī)的自適應(yīng)功能,這是比較好的原始狀態(tài),缺點(diǎn)是個(gè)別端口可能適應(yīng)不良或不能按需要達(dá)到適應(yīng)的結(jié)果。比如,用戶需要自適應(yīng)狀態(tài)最終為100M全雙工,但自適應(yīng)的結(jié)果可能是100M半雙工或10M全雙工狀態(tài)。因此部分用戶使用軟件進(jìn)行人工設(shè)置,這樣可以達(dá)到需要的狀態(tài)。缺點(diǎn)是人工強(qiáng)行設(shè)置的狀態(tài)不一定與網(wǎng)絡(luò)實(shí)際能達(dá)到的狀態(tài)一致,且經(jīng)常的情況是無(wú)法對(duì)設(shè)置的結(jié)果進(jìn)行驗(yàn)證或檢測(cè)。本例故障應(yīng)該就屬于這一類。 網(wǎng)絡(luò)的神奇作用吸引著越來(lái)越多的用戶加入其中,正因如此,網(wǎng)絡(luò)的承受能力也面臨著越來(lái)越嚴(yán)峻的考驗(yàn)―從硬件上、軟件上、所用標(biāo)準(zhǔn)上......,各項(xiàng)技術(shù)都需要適時(shí)應(yīng)勢(shì),對(duì)應(yīng)發(fā)展,這正是網(wǎng)絡(luò)迅速走向進(jìn)步的催化劑。 |