晴時多雲

自由廣場》教育部出大包 談備援機制

◎ 朱學亭

自由時報率先報導教育部「高中學習歷程檔案」系統發生嚴重錯誤,廠商的系統疑似發生操作錯誤,致使系統被自動還原,大量資料遺失。教育部重申,廠商正在全力救援硬碟資料,也請學校協助學生重新上傳檔案。眾人對這個事件發生感到驚異,也顯示政府委外資訊系統對災難準備之不足。

資訊系統很難避免程度不一的災難,像谷歌、臉書等大廠商也不時聽聞發生系統災難。災難發生之時,備援機制的良窳就非常重要。評估備援機制有二個最重要的關鍵指標:復原時間目標 (RTO) 和復原點目標 (RPO)。RTO是系統恢復服務的時間目標(Recovery Time Objective)。RPO是資料回復點的目標(Recovery Point Objective)。兩者都是在系統設計之初就要先評估的目標。換言之,系統剛建置就要未雨綢繆一旦災難發生,多久可以恢復服務:5秒、30分鐘還是24小時。根據報導,災難發生至少已經3天,表示廠商在設計系統之初,也許沒有正確評估復原目標(RTO和RPO)。

備援機制有熱備援(hot standby)和冷備援(cold standby)機制。熱備援機制是同時有兩組系統在線,在主機房有一組系統A工作,在遠方機房另一組系統B同樣開機中。一旦有意外,可以切換系統接續服務。臺灣證券交易所就有仰德和信義兩機房,維持全時異地備援的機制,保證每天數千億的交易正常。熱備援架構必須維持兩套設備在線,而且機房間需要高速網路通訊,成本高昂。

雲端備援服務可以大幅降低異地備援的成本。雲端備援架構是平時使用自己本地的運算主機提供服務。一旦本地的主機發生災難,再啟動雲端的運算主機,切換到雲端去提供服務。因為雲端系統平時並不提供服務,沒有運算和流量的費用,只有資料備份需要少許費用,大幅降低異地備援成本。政府在107年就制定了雲端備援產品的標案規格,只是目前許多資訊業者欠缺雲端架構人才,大部份政府委外系統尚待完成雲端備援的機制。

冷備援是最便宜的備援模式,但需要來自於原來主系統的備份。現在的運算主機通常都是運行在虛擬機(VM)或容器(Container)的可執行映像(image),很容易遷移到其他機房或雲端。根據報導,此次系統是進行更新重新開機後,系統錯誤。如果在進行系統更新之前,都先把原來的虛擬機映像(VM image)備份起來,就不會發生這種錯誤。坊間也有多家廠商提供在線備份虛擬機映像的工具及服務。

各大資訊廠商搶食虛擬化和雲端化大餅之際,此事件突顯國內雲端人才培育不足所造成的系統災難。未來,還有很多政府委外的系統需要虛擬化和雲端化,此一事件也可以讓大家思考如何建立正確的雲端備援機制SOP以降低資訊系統的風險。

(作者為前端設計協會理事長/中臺灣教授協會理事/亞洲大學副教授)

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

已經加好友了,謝謝
歡迎加入【自由評論網】
按個讚 心情好
已經按讚了,謝謝。

編輯精選