數(shù)據(jù)庫系統(tǒng)是位于操作系統(tǒng)和應(yīng)用業(yè)務(wù)系統(tǒng)之間,處于承上啟下的位置,和醫(yī)院信息系統(tǒng)其他設(shè)備的故障處理相比,分析和定位難度更大。因此當(dāng)出現(xiàn)數(shù)據(jù)庫系統(tǒng)的故障時,首先進(jìn)行故障類型的識別和分析,才能在處理故障時對癥下藥。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
一、故障處理流程
數(shù)據(jù)庫系統(tǒng)故障的處理,需要在醫(yī)院信息部門建立切實(shí)可行的故障處理流程。故障處理流程要充分考慮到醫(yī)院信息化的實(shí)際情況和信息部門的人力資源,做到早發(fā)現(xiàn),早定位和早處理,而且要提高處理的準(zhǔn)確性,同時還需要積累寶貴的故障處理經(jīng)驗(yàn)在醫(yī)院信息部門內(nèi)相互學(xué)習(xí)和借鑒。部分醫(yī)院的數(shù)據(jù)庫系統(tǒng)采用第三方協(xié)助運(yùn)維的方式,有助于提高處理故障的技術(shù)水平,那么第三方公司的服務(wù)能力的考核就非常關(guān)鍵,服務(wù)響應(yīng)速度和處理速度是考核選擇的關(guān)鍵指標(biāo)。
創(chuàng)建數(shù)據(jù)庫系統(tǒng)的故障處理流程首先要建立故障處理聯(lián)系人列表,包括醫(yī)院信息部門的所有人員清單、移動聯(lián)系方式及電子郵箱或者即時通訊號碼,并且明確個人職責(zé)。聯(lián)系人列表還要包括第三方運(yùn)維公司的相關(guān)責(zé)任工程師和原廠的報障熱線。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
1.故障記錄
醫(yī)院信息系統(tǒng)無論發(fā)生任何故障,記錄工作都是首先而且是極為關(guān)鍵的,它為之后的分析、處理和統(tǒng)計過程提供可追溯的依據(jù)。在記錄數(shù)據(jù)庫系統(tǒng)的故障信息時,關(guān)鍵的是要記錄故障報告人和部門、錯誤的代碼、錯誤發(fā)生的時間,系統(tǒng)對口人及影響的范圍。可以使用專業(yè)的服務(wù)臺軟件進(jìn)行故障記錄,如果條件不具備也可以使用電子文檔進(jìn)行記錄。
2.故障定位
在進(jìn)行故障的記錄以后,下一步就是故障的初步定位。故障的初步定位通常情況下是由醫(yī)院信息科人員在接到報障時就進(jìn)行判斷,故障定位的準(zhǔn)確性取決于醫(yī)院信息系統(tǒng)故障知識庫的完備性和受理故障人員的知識和經(jīng)驗(yàn)的儲備。隨著醫(yī)院信息化系統(tǒng)的規(guī)模越來越大,合理明確的人員分工及精細(xì)的流程管理就勢在必行,甚至考慮使用部分外包的方式來提高數(shù)據(jù)庫系統(tǒng)故障處理的技術(shù)專業(yè)性和故障處理成功率。
3.故障處理
當(dāng)完成故障的初步定位,下一步就進(jìn)入到故障的處理階段。故障處理階段由醫(yī)院信息科及相關(guān)廠家工程師和原廠工程師進(jìn)行處理,根據(jù)故障的難易程度決定采用的處理方式。處理故障時通常采用分級別處理,由醫(yī)院信息科技術(shù)人員先對故障進(jìn)行處理,如果在規(guī)定時間內(nèi)處理不好再交由本地的廠家工程師進(jìn)行處理,如果有必要還可以上升到原廠工程師處理,這樣的分級處理雖然會延長故障處理的時間,但對于均衡成本是有效的方式。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
二、故障處理注意問題
對于醫(yī)院核心的數(shù)據(jù)庫系統(tǒng)故障,因?yàn)橛绊懨孑^大、處理的及時性強(qiáng)且需要的知識比較專業(yè),可以考慮采用維護(hù)服務(wù)外包并且故障問題直接交由運(yùn)維廠家工程師進(jìn)行處理。醫(yī)院信息科相關(guān)人員在處理數(shù)據(jù)庫系統(tǒng)故障時需要重點(diǎn)關(guān)注的幾個問題如下:
1.檢測數(shù)據(jù)庫可連接性
檢測數(shù)據(jù)庫的可連接性是判斷數(shù)據(jù)庫故障的首要做法,可以通過客戶端配置指向數(shù)據(jù)庫系統(tǒng)的連接字串,然后測試是否可以登錄數(shù)據(jù)庫。可包括使用客戶端工具、應(yīng)用軟件及ODBC、JDBC等。通常70%的數(shù)據(jù)庫系統(tǒng)故障并不影響全部的業(yè)務(wù),大多數(shù)的問題可能都是由于客戶端的個別問題造成,如客戶端版本不符合,病毒,網(wǎng)絡(luò)設(shè)置,誤操作等。多數(shù)情況下重啟客戶端工作站就能解決問題。
2.檢測數(shù)據(jù)庫服務(wù)器運(yùn)行
當(dāng)出現(xiàn)大量的客戶端不能連接到數(shù)據(jù)庫時,就有必要連接到數(shù)據(jù)庫服務(wù)器上檢測數(shù)據(jù)庫軟件的運(yùn)行情況。首先需要檢查數(shù)據(jù)庫是否仍是啟動狀態(tài),判斷數(shù)據(jù)庫是否已經(jīng)宕機(jī)。如果數(shù)據(jù)庫出現(xiàn)宕機(jī),需要檢查數(shù)據(jù)庫的日志及操作系統(tǒng)日志,根據(jù)關(guān)鍵性錯誤日志信息判斷是由于什么樣的問題造成故障,常見的有存儲訪問故障,板卡故障,網(wǎng)絡(luò)通訊故障,磁盤損壞等。如果數(shù)據(jù)庫是運(yùn)行正常的,也沒有明顯的關(guān)鍵性錯誤信息。這時需要關(guān)注數(shù)據(jù)庫服務(wù)器上的資源使用情況,如CPU使用率,內(nèi)存使用率和I/O繁忙程度,是否是由于性能遭遇瓶頸導(dǎo)致無法連接。這時需要通過重啟數(shù)據(jù)庫和服務(wù)器來恢復(fù)業(yè)務(wù)運(yùn)行。如果沒有發(fā)現(xiàn)故障原因所在,可能需要具備專業(yè)經(jīng)驗(yàn)的工程師進(jìn)行處理,通過聯(lián)系數(shù)據(jù)庫維護(hù)工程師或者數(shù)據(jù)庫代維工程師進(jìn)行問題分析和處理。
3.容災(zāi)系統(tǒng)的啟用
當(dāng)出現(xiàn)嚴(yán)重的數(shù)據(jù)庫系統(tǒng)不可用故障時,容災(zāi)和備份系統(tǒng)的完備性和可用性就非常重要。對于醫(yī)院的數(shù)據(jù)庫系統(tǒng),連續(xù)性要求較高,當(dāng)嚴(yán)重的生產(chǎn)數(shù)據(jù)庫不可用故障不能在規(guī)定的時間內(nèi)完成處理時,啟用容災(zāi)系統(tǒng)是zui終的方案。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
三、數(shù)據(jù)庫系統(tǒng)故障預(yù)防措施
減少故障率的zui好辦法當(dāng)然是提前做好防范措施。對于連續(xù)性要求很高的醫(yī)院數(shù)據(jù)庫系統(tǒng),做好故障的預(yù)防格外重要,預(yù)防措施通常在設(shè)計一個醫(yī)院數(shù)據(jù)庫系統(tǒng)時就需要考慮。一般情況下可以通過以下幾個角度進(jìn)行故障的預(yù)防。
1.預(yù)防單點(diǎn)故障
故障的發(fā)生是概率性事件,那么通過冗余來減小故障帶來的停機(jī)時間,這是IT領(lǐng)域常用的預(yù)防故障的手段。如存儲系統(tǒng)通過建立磁盤的RAID冗余來保障數(shù)據(jù)的安全,服務(wù)器通過集群系統(tǒng)來保障節(jié)點(diǎn)的高可用性,網(wǎng)絡(luò)交換機(jī)通過互備來保障網(wǎng)絡(luò)可用性,網(wǎng)卡通過綁定來保障鏈路的可用性等。這些冗余措施能夠很好地預(yù)防單點(diǎn)故障,在數(shù)據(jù)庫級別也有數(shù)據(jù)庫的冗余機(jī)制,如數(shù)據(jù)庫集群,日志文件冗余和數(shù)據(jù)文件冗余等。設(shè)備冗余的預(yù)防措施會成倍增加IT建設(shè)成本,需要決策者進(jìn)行權(quán)衡。
2.完善的災(zāi)備機(jī)制
對于數(shù)據(jù)庫系統(tǒng)來說,完善的容災(zāi)和備份機(jī)制能夠應(yīng)對嚴(yán)重的故障和保障數(shù)據(jù)的安全。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
3.故障處理知識庫的建立
就醫(yī)院信息系統(tǒng)數(shù)據(jù)庫來說,可以使用數(shù)據(jù)庫廠家提供的故障處理知識庫。在此基礎(chǔ)之上,對于醫(yī)院在自身數(shù)據(jù)庫系統(tǒng)運(yùn)維過程中積累得到的經(jīng)驗(yàn)也是非常寶貴的資產(chǎn),這些運(yùn)維經(jīng)驗(yàn)如果可以記錄進(jìn)知識庫中,對于數(shù)據(jù)庫系統(tǒng)的故障處理工作將是極大的幫助。如果有條件,可以使用專業(yè)的IT知識庫軟件進(jìn)行記錄。在不具備條件的情況下,可以采用電子文檔進(jìn)行記錄和歸檔。
4.建立監(jiān)控和預(yù)警系統(tǒng)
通常情況下,數(shù)據(jù)庫系統(tǒng)的故障是可監(jiān)控的。建立一個完善的監(jiān)控和預(yù)警系統(tǒng),能夠盡早的發(fā)現(xiàn)數(shù)據(jù)庫系統(tǒng)的故障隱患,幫助醫(yī)院信息科人員在故障還沒有產(chǎn)生大的影響前就可以有充分的時間進(jìn)行處理。監(jiān)控系統(tǒng)通常會關(guān)注數(shù)據(jù)庫的空間使用率,日志中的報錯信息,操作系統(tǒng)的資源使用情況,達(dá)到用戶設(shè)置的報警閾值和遇到定義的錯誤關(guān)鍵字,就通過手機(jī)短信,報警燈,聲音等方式發(fā)出通知。
HIS系統(tǒng)-嘉訊醫(yī)院信息管理系統(tǒng):www.jxhis.cn
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.