問題描述:
同行介紹一個(gè)客戶,是網(wǎng)站服務(wù)器忽然重啟后無法正常啟動(dòng)。請(qǐng)我們幫忙處理,重裝系統(tǒng)。
我們先電話聯(lián)系客戶。了解初步情況如下
隔天下班前還是好的,監(jiān)控屏幕看是半夜機(jī)器出現(xiàn)重啟,然后就再也無法進(jìn)入系統(tǒng)。
客戶IT準(zhǔn)備嘗試重裝系統(tǒng),但是提示空間不足。說是可以找到硬盤。
為了了解進(jìn)一步信息,我們請(qǐng)客戶拍照發(fā)給我們。
服務(wù)器屏幕顯示如下:
錯(cuò)誤信息:Error 1962: No operating system found. Boot sequence wil automatically repeat.
這個(gè)錯(cuò)誤表示沒有發(fā)現(xiàn)操作系統(tǒng),自動(dòng)按照啟動(dòng)設(shè)備的順序逐個(gè)嘗試引導(dǎo)啟動(dòng)。
而可引導(dǎo)啟動(dòng)的設(shè)備里,只有光驅(qū)和網(wǎng)卡。沒有任何硬盤。
最壞的情況是,系統(tǒng)提示有兩塊1.8TB的硬盤,但是它們都處于Offline(離線) 狀態(tài)。
如下圖所示范,初步估計(jì)應(yīng)該是兩塊磁盤組成了RAID1磁盤陣列。但是兩塊硬盤都發(fā)生故障了。
為了進(jìn)一步確認(rèn)狀況,按“Ctrl+L”進(jìn)入磁盤陣列配置。
情況還是一樣,只有兩塊物理硬盤,而且都是離線狀態(tài)。這樣就可以肯定物理硬盤有問題了。
這臺(tái)機(jī)器的陣列配置非常簡(jiǎn)單,沒有其他特別功能。通常兩塊一樣容量的硬盤,會(huì)組成Raid1, 這樣兩塊硬盤的數(shù)據(jù)會(huì)是一模一樣的鏡像。只要不是兩塊硬盤同時(shí)損壞,系統(tǒng)是不會(huì)出問題的。
如果只壞一塊硬盤,只要及時(shí)更換一塊同樣型號(hào)和容量的硬盤,RAID 1會(huì)自動(dòng)重建數(shù)據(jù)。
為了進(jìn)一步確認(rèn)。把硬盤拆下,接到其他電腦上,還是無法識(shí)別硬盤。
對(duì)于這兩塊硬盤只能嘗試做數(shù)據(jù)恢復(fù)。因?yàn)槔锩嬗锌蛻舻闹匾Y料。
問題總結(jié):
- 服務(wù)器一定要有定期的檢查和備份。否則一旦出問題了,就是愿意花錢也不一定能找回全部數(shù)據(jù)。預(yù)防性維護(hù)非常重要。
- 對(duì)于好點(diǎn)的服務(wù)器,硬盤會(huì)有獨(dú)立的健康指示燈?梢酝ㄟ^指示燈狀態(tài)了解硬盤的監(jiān)控狀況。
比如下面圖片示范的最下面一塊硬盤,健康指示燈已經(jīng)橙色了,表示有故障,需要立即更換。
3.客戶的這款聯(lián)想服務(wù)器是2018年5月出廠的。到現(xiàn)在一年半不到的時(shí)間,居然兩塊硬盤都?jí)牧。這種情況也非常少見。聯(lián)系了售后,硬盤可以質(zhì)保,但是數(shù)據(jù)不負(fù)責(zé)。
相對(duì)于客戶這個(gè)案例,這個(gè)保修是無效的,因?yàn)橐坏┳隽藬?shù)據(jù)恢復(fù),可能需要開盤,也就失去保修的權(quán)利了。
最后再次強(qiáng)調(diào),關(guān)于重要的數(shù)據(jù),無論是個(gè)人電腦還是服務(wù)器,一定一定一定要有備份。 |