網(wǎng)絡(luò)技術(shù)是從1990年代中期發(fā)展起來的新技術(shù),它把互聯(lián)網(wǎng)上分散的資源融為有機(jī)整體,實(shí)現(xiàn)資源的全面共享和有機(jī)協(xié)作,使人們能夠透明地使用資源的整體能力并按需獲取信息。資源包括高性能計(jì)算機(jī)、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資源、專家資源、大型數(shù)據(jù)庫、網(wǎng)絡(luò)、傳感器等。 當(dāng)前的互聯(lián)網(wǎng)只限于信息共享,網(wǎng)絡(luò)則被認(rèn)為是互聯(lián)網(wǎng)發(fā)展的第三階段。 服務(wù)器是網(wǎng)絡(luò)中最為關(guān)鍵的一個(gè)部分,對(duì)于網(wǎng)絡(luò)的正常運(yùn)行起著至關(guān)重要的保障作用。對(duì)服務(wù)器的管理,也成為IT部分最為重要的日常工作之一。為了節(jié)省工作時(shí)間,提高工作效率,減輕IT部門運(yùn)維人員的工作效率,IT部門逐漸開始引進(jìn)自動(dòng)化、智能化的系統(tǒng)管理軟件。
下面,我們就通過介紹現(xiàn)在流行的SiteView系統(tǒng)管理軟件對(duì)服務(wù)器的管理,向大家展示系統(tǒng)管理軟件的強(qiáng)大功能和作用。在對(duì)服務(wù)器的管理中,SiteView主要從服務(wù)器監(jiān)測(cè)原理和服務(wù)器管理方案兩個(gè)角度展開。其中,服務(wù)器管理方案主要從主機(jī)運(yùn)行狀況監(jiān)測(cè)、服務(wù)與進(jìn)程管理、網(wǎng)絡(luò)狀況管理、系統(tǒng)端口、日志管理和故障自動(dòng)恢復(fù)等六個(gè)方面進(jìn)行。
為確保服務(wù)器高速、穩(wěn)定運(yùn)轉(zhuǎn),SiteView從多個(gè)方面對(duì)主機(jī)服務(wù)器的硬件設(shè)備及操作系統(tǒng)進(jìn)行監(jiān)控管理和性能管理。它通過采集服務(wù)器的CPU、內(nèi)存、硬盤、網(wǎng)卡等硬件的關(guān)鍵運(yùn)行參數(shù),以及軟件和應(yīng)用程序的進(jìn)程、服務(wù)、端口等的運(yùn)行狀況,對(duì)系統(tǒng)日志進(jìn)行分類掃描查詢。通過數(shù)據(jù)采集和分析,SiteView能夠及時(shí)對(duì)影響服務(wù)器運(yùn)行性能的故障事件發(fā)送報(bào)警,并采取相應(yīng)的故障處理措施,保證服務(wù)器的正常安全運(yùn)行。
SiteView與服務(wù)器相關(guān)的監(jiān)測(cè)器有30多種,其中主要包括采集服務(wù)器CPU、內(nèi)存、磁盤空間、服務(wù)、進(jìn)程、網(wǎng)卡、錯(cuò)誤日志、Windows事件日志、UNIX LOG文件、文件和目錄等數(shù)據(jù)的監(jiān)測(cè)器。
服務(wù)器監(jiān)測(cè)原理
SiteView的服務(wù)器監(jiān)測(cè)模塊支持多種協(xié)議對(duì)服務(wù)器系統(tǒng)進(jìn)行監(jiān)測(cè),運(yùn)行在Windows平臺(tái),不需要在被監(jiān)測(cè)的服務(wù)器上安裝任何代理軟件(Agent)即可跨平臺(tái)的監(jiān)測(cè)Linux、Solaris、AIX、FreeBSD、UnixWare、HP-UNIX、OpenServer、DigitalUnix、Cobalt、True64、Slackware 和Windows系統(tǒng),對(duì)于客戶特殊的操作系統(tǒng)還可根據(jù)客戶的需求動(dòng)態(tài)定制我們的監(jiān)測(cè)系統(tǒng),用戶只需按照規(guī)定接口生成監(jiān)測(cè)模塊,SiteView監(jiān)測(cè)系統(tǒng)會(huì)自動(dòng)識(shí)別并裝載該模塊。SiteView的服務(wù)器監(jiān)測(cè)模塊不依賴于硬件系統(tǒng),被監(jiān)測(cè)的服務(wù)器系統(tǒng)按照操作系統(tǒng)的類型分為Windows和UNIX兩大類:對(duì)于Windows系統(tǒng)的監(jiān)測(cè)主要基于WMI技術(shù)和RPC協(xié)議,此外也提供了基于SNMP協(xié)議的監(jiān)測(cè)模塊;對(duì)于UNIX系統(tǒng)基于TELNET、SSH、HTTP協(xié)議。服務(wù)器的監(jiān)測(cè)使用模擬用戶登陸的原理實(shí)現(xiàn),通常需要用戶提供被監(jiān)測(cè)的遠(yuǎn)程服務(wù)器的一個(gè)登錄賬號(hào)和密碼,用戶可以通過SiteView的配置子系統(tǒng)完成登錄賬號(hào)的添加。下圖為工作原理圖。
跨平臺(tái)監(jiān)測(cè)使網(wǎng)管人員通過一套系統(tǒng)就可以管理多種操作系統(tǒng)服務(wù)器,使管理異構(gòu)網(wǎng)絡(luò)環(huán)境的管理員非常方便。
主機(jī)的CPU、內(nèi)存、磁盤的使用情況對(duì)主機(jī)的性能影響很大,如果出現(xiàn)問題,將直接影響到主機(jī)的正常運(yùn)行,進(jìn)而對(duì)服務(wù)器上正在運(yùn)行的重要的應(yīng)用系統(tǒng)帶來不可預(yù)料的后果。所以,對(duì)主機(jī)的CPU、內(nèi)存、磁盤資源使用情況進(jìn)行監(jiān)測(cè)是主機(jī)管理的首要任務(wù),SiteView的服務(wù)器監(jiān)測(cè)模塊不但可以監(jiān)測(cè)到Windows系統(tǒng)的相關(guān)性能,還可以監(jiān)測(cè)到幾乎所有主流的UNIX平臺(tái)(例如Linux、Solaris、AIX等)的相關(guān)性能,對(duì)于比較少見的UNIX系統(tǒng),SiteView提供了易于擴(kuò)展的監(jiān)測(cè)接口,只需要根據(jù)接口的定義添加監(jiān)測(cè)模塊即可監(jiān)測(cè)SiteView中暫不支持的UNIX系統(tǒng)。SiteView提供的跨平臺(tái)的服務(wù)器運(yùn)行狀況監(jiān)測(cè)模塊可以幫助管理員在第一時(shí)間發(fā)現(xiàn)主機(jī)基本性能的狀態(tài)異常,并協(xié)助管理員對(duì)異常做出處理。
服務(wù)、進(jìn)程管理
主機(jī)上往往運(yùn)行著非常重要的應(yīng)用系統(tǒng),例如大型的數(shù)據(jù)庫系統(tǒng)、Mail系統(tǒng)、Web Server或特殊業(yè)務(wù)的應(yīng)用系統(tǒng)等。應(yīng)用系統(tǒng)的進(jìn)程和服務(wù)是否正常運(yùn)行是判斷應(yīng)用系統(tǒng)是否正常的關(guān)鍵,如果這些關(guān)鍵的進(jìn)程和服務(wù)已經(jīng)停止,則應(yīng)用系統(tǒng)肯定無法正常工作。所以監(jiān)測(cè)主機(jī)上的進(jìn)程和服務(wù)是主機(jī)管理的另一個(gè)重點(diǎn)。SiteView的服務(wù)器監(jiān)測(cè)模塊能夠監(jiān)測(cè)Windows平臺(tái)和UNIX平臺(tái)上運(yùn)行的進(jìn)程、服務(wù)的運(yùn)行狀況,例如指定進(jìn)程的運(yùn)行實(shí)例總數(shù),對(duì)于Windows平臺(tái),不但能監(jiān)測(cè)指定進(jìn)程的實(shí)例總數(shù),還能監(jiān)測(cè)線程總數(shù)及內(nèi)存總占用量。通過對(duì)進(jìn)程和服務(wù)的運(yùn)行狀況的監(jiān)測(cè),SiteView可以對(duì)重要的應(yīng)用系統(tǒng)的正常運(yùn)行提供有力的保障。
網(wǎng)絡(luò)狀況管理
SiteView的服務(wù)器監(jiān)測(cè)模塊還包括對(duì)服務(wù)器的網(wǎng)卡的運(yùn)行狀況的監(jiān)測(cè)。SiteView對(duì)服務(wù)器的網(wǎng)絡(luò)狀況的監(jiān)測(cè)是基于SNMP協(xié)議實(shí)現(xiàn)的,SiteView可以監(jiān)測(cè)服務(wù)器的網(wǎng)卡的流量(接收速率和發(fā)送速率)、狀態(tài)和丟包率等。通過對(duì)服務(wù)器網(wǎng)絡(luò)狀況的監(jiān)測(cè),SiteView可以使網(wǎng)絡(luò)中的服務(wù)器系統(tǒng)維持正常的網(wǎng)絡(luò)訪問和提供正常的網(wǎng)絡(luò)服務(wù)。
系統(tǒng)端口
網(wǎng)絡(luò)中的服務(wù)器系統(tǒng)通常會(huì)提供一系列的服務(wù)給網(wǎng)絡(luò)中的其他主機(jī)進(jìn)行訪問和使用,例如Web Server服務(wù)等,這些服務(wù)都是通過一些指定的端口進(jìn)行通訊的,所以系統(tǒng)業(yè)務(wù)端口的正常與否對(duì)于系統(tǒng)業(yè)務(wù)有直接的影響。SiteView的服務(wù)器監(jiān)測(cè)模塊提供了對(duì)服務(wù)器的系統(tǒng)業(yè)務(wù)端口的監(jiān)測(cè)模塊,通過Connect系統(tǒng)業(yè)務(wù)端口,發(fā)送請(qǐng)求,以監(jiān)測(cè)端口是否能夠響應(yīng)。
日志管理
服務(wù)器上的應(yīng)用系統(tǒng)或重要進(jìn)程運(yùn)行時(shí)會(huì)產(chǎn)生大量的日志文件,這些日志文件對(duì)于檢查程序運(yùn)行狀態(tài)、查找程序出錯(cuò)原因很有幫助。SiteView的服務(wù)器監(jiān)測(cè)模塊提供了相應(yīng)的監(jiān)測(cè)功能對(duì)這些日志進(jìn)行監(jiān)測(cè)。SiteView不僅可以監(jiān)測(cè)Windows平臺(tái)和UNIX平臺(tái)的日志變化情況,而且對(duì)監(jiān)測(cè)結(jié)果支持匹配查詢、設(shè)置過濾條件等方式進(jìn)行更深層次的分析,通過應(yīng)用SiteView的服務(wù)器日志監(jiān)測(cè)功能,可以幫助管理員更為準(zhǔn)確的掌握重要進(jìn)程或應(yīng)用系統(tǒng)的運(yùn)行狀況,以保證關(guān)鍵業(yè)務(wù)的正常運(yùn)行。
故障自動(dòng)恢復(fù)功能
SiteView的故障自動(dòng)恢復(fù)功能對(duì)網(wǎng)絡(luò)管理人員具有非常重要的意義。當(dāng)出現(xiàn)一個(gè)臨時(shí)性的標(biāo)準(zhǔn)故障時(shí),自動(dòng)恢復(fù)功能就會(huì)自動(dòng)執(zhí)行指定腳本或POST數(shù)據(jù)到指定的CGI程序,使服務(wù)恢復(fù)正常。比如,把一個(gè)掛起的服務(wù)器操作通過自動(dòng)啟動(dòng)功能而使它重新運(yùn)行;把一個(gè)耗費(fèi)系統(tǒng)過多資源的進(jìn)程停止或者重新啟動(dòng)設(shè)備。
SiteView分別針對(duì)Windows平臺(tái)和UNIX平臺(tái)提供了不同的故障自動(dòng)處理的解決方案。對(duì)于Windows平臺(tái),SiteView提供了重啟指定服務(wù)、重啟Web服務(wù)、重啟主機(jī)、關(guān)機(jī)等故障自動(dòng)處理功能,這些功能是通過SiteView中提供的控制腳本實(shí)現(xiàn)的,管理員還可以根據(jù)管理的不同需要定制這些腳本,腳本的內(nèi)容是使用了WMI技術(shù)規(guī)范進(jìn)行編寫的,通過定制不同的腳本可以實(shí)現(xiàn)對(duì)Windows平臺(tái)的故障處理功能的擴(kuò)展。對(duì)于UNIX平臺(tái),SiteView提供了易于擴(kuò)展的接口實(shí)現(xiàn)其故障處理功能,管理員可以自己定制用于對(duì)故障進(jìn)行處理的UNIX腳本,通過SiteView提供的接口程序,監(jiān)測(cè)系統(tǒng)即可在出現(xiàn)故障時(shí)自動(dòng)調(diào)用管理員編寫的UNIX腳本對(duì)故障進(jìn)行處理。
【相關(guān)文章】
- SiteView綜合網(wǎng)管系統(tǒng)
網(wǎng)絡(luò)的神奇作用吸引著越來越多的用戶加入其中,正因如此,網(wǎng)絡(luò)的承受能力也面臨著越來越嚴(yán)峻的考驗(yàn)―從硬件上、軟件上、所用標(biāo)準(zhǔn)上......,各項(xiàng)技術(shù)都需要適時(shí)應(yīng)勢(shì),對(duì)應(yīng)發(fā)展,這正是網(wǎng)絡(luò)迅速走向進(jìn)步的催化劑。
|