接到客戶微信報修,說是共享盤斷開,也就是網絡驅動器丟失了,顯示為紅色的叉,無法連接。
我們的技術人員通過堡壘機,也無法登錄該服務器。
那就只能驅動前往了,到了客戶機房,只看見服務器是在藍屏狀態。
重啟后,又出現“你的電腦出現問題,需要重啟……”,此時發現,0號磁盤為黃燈,頓時有種不祥的預感。
耐心等它跑完,重啟服務器,沒有看到CTRL+R進入陣列卡管理界面的提示,所以就按F2進入設置界面,然后再找到陣列卡配置,查看硬盤狀態。
很明顯,0號磁盤確實壞了,好在是RAID5,應該不至于丟失數據。
退出設置,嘗試啟動操作系統。
不出所料,系統還是可以進入的,看了一下文件資料,應該沒有丟失,通知客戶,共享盤暫時已恢復,同時申請一塊硬盤。
3T的硬盤不好找了,直接上塊4T的SAS 7.2K。注意,此時服務器不要關機,直接拔掉舊硬盤,插入新的硬盤就可以了,RAID5會自動重建的。
新硬盤插入后,狀態顯示正常,根據經常,RAID5正在重建中。
由于這臺舊服務器前期沒有配置iDRAC,此時又不方便再重啟,所以直接在系統里安裝DELL OpenManage System Management Software,也一樣能看到RAID5同步狀態,當時并沒有截圖,以下是為了寫文章,后補的圖片。
從時間上日志可以看到,12:37拔出壞硬盤,12:51新硬盤接入,RAID開始重建,到晚上19:56,RAID5重建完成。
順便說一句,在Windows Server中可以通過DELL OpenManage System Management Software來配置iDRAC,修改IP地址,修改密碼等。
然后就能通過瀏覽器,訪問iDRAC,實時查看服務器狀態,以及配置郵件告警等功能。
下圖1是服務器物理磁盤的狀態,目前狀態良好;下圖2是服務器虛擬磁盤的狀態,可以看到兩組RAID5磁盤當前都是正常的了。
至于,郵件告警功能,配置也不難,看圖片便知。
第一步,配置發件服務器及相關信息;
第二步,配置收件人,注意,當然可以是多個收件人;
第三步,設置報警的內容;
下次服務器再有什么故障,你就能收到郵件了,能在很大程度上防患于未然,尤其是硬盤故障,早點知道,能避免數據丟失的損失。
當然了,能部署Zabbix或者Prometheus這類實時監測軟件,那就更好了,凡是我們長期服務的客戶,基本上都在我們的監測之中,我們平時遠程,也基本上是通過堡壘機完成,畢竟,安全第一嘛。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.