香港公司

Business Continuity Planning

9547 171

業務連續性計劃(Business Continuity Planning,縮寫為BCP)

目錄

  • 1 業務連續性計劃概述
  • 2 業務連續性計劃的重要性
  • 3 業務連續性計劃的基本要素
  • 4 業務連續性計劃的內容
  • 5 業務連續性計劃的運作流程

業務連續性計劃概述

  業務連續性計劃是一套基於業務運行規律的管理要求和規章流程,使一個組織在突發事件面前能夠迅速作出反應,以確保關鍵業務功能可以持續,而不造成業務中斷或業務流程本質的改變。

  業務連續性是指企業有應對風險、自動調整和快速反應的能力,以保證企業業務的連續運轉。為企業重要應用和流程提供業務連續性應該包括以下三個方面。

  1.高可用性(High availability) 。它是指提供在本地故障情況下,能繼續訪問應用的能力。無論這個故障是業務流程、物理設施,還是IT軟硬體故障。

  2.連續操作(Continuous operations)。 它是指當所有設備無故障時保持業務連續運行的能力。用戶不需要僅僅因為正常的備份或維護而需要停止應用的能力。

  3.災難恢復(Disaster Recovery)。它是指當災難破壞生產中心時,在不同的地點恢複數據的能力。

  同時,上述三個部分不是相互孤立的,是相互關聯,而且有交叉的。

  區分業務連續性和災難恢復是很必要的。嚴格地說,災難恢復是恢複數據的能力,是業務連續性計劃的一部分。

  讓業務連續性計劃成為企業變化管理文化的一部分。在制定企業業務連續性計劃之後,不要把這個計劃放在一邊。要確保該計劃的切實可行,就需要把它變成活動的文檔。如果企業的業務模式發生了變化,或是業務過程進行了重新設計,或是發生突髮狀況時的重要聯繫人不再為公司工作,舊的計劃就需要及時進行更新。當有變化時,每個員工都應該問問自己該變化會對業務連續性計劃中涉及到自己的部分會產生怎樣的影響。

業務連續性計劃的重要性

  現在的社會特別是經濟社會對網路的依賴日益加深,傳統的備份恢複式安全計劃已經無法保證企業業務的連續運行。

  業務連續性計劃正是因此而生,它根據業務流程而非針對技術進行制訂,有助於建立起更具統籌能力的安全管理制度。據Gartner Group的調查結果顯示,如果企業的大型數據中心和信息基礎設施停止運行10日以上,超過百分之三十的企業在一個季度內倒閉,而接近90%的企業在一年內倒閉。

  這些數據說明瞭保證業務連續有效的運行對企業來說是多麼重要,同時也可以看出企業花費大量的資金於業務連續性計劃最核心的原因。

業務連續性計劃的基本要素

BCP的基本要素

  籠統地說,BCP的目標只有一個,那就是確定並減少危險可能帶來的損失,有效地保障業務的連續性。而有關BCP的一些特定目標我們將在以下各個部分中加以描述。

  BCP實施的最終結果是:

  • 一組防範危險的評測指標;  
  • 一支執行團隊,在經過培訓後可以處理各種危險事件;
  • 一套計劃,提供危險發生時的路線圖。該計劃應該是充分和完備的,必須詳細落實到該計劃實施範圍內的每一個單位、人員或設備。

  每個企業所制定的BCP都應該有每個企業或者所處行業獨有的特色,彼此之間不會完全一致,但大致上說來,一個完備的BCP主要是由以下一些關鍵部分構成的:

  一、 危險評估

  危險評估就是認識並分析各種潛在危險的結果。這些危險的來源可能是:

  • 各種區域性的天然災難,如洪水、地震、疫病等;
  • 人為事故或蓄意破壞造成的嚴重災難,如火災、恐怖主義襲擊等;
  • 安全威脅、硬體、網路或通信故障;
  • 災難性的應用系統錯誤。

  所有的危險都應納入企業的危險評估範圍,並且應對各種危險的可能來源地進行較準確的定位。對於每一種危險的來源都應該認識到:

  • 危險的類型;
  • 危險的程度;
  • 危險發生的可能性。

  比如說,如果按照有無警示性先兆來分,各類危險還可以分為:

  • 有些危險可能沒有任何先兆而突然發生,無法事先防範;
  • 有些危險可以有一定的先兆,可以迅速啟動應急計劃加以防範,比如疫病的傳播;
  • 有些危險可能從來不會發生。

  如果按照危險的破環類型或程度來分,它們對業務的影響可以分為:

  • 經營場所及設備完全破環;
  • 經營場所及設備部分破環;
  • 經營場所及設備完好,但人員不能進入,比如疫病的隔離、恐怖威脅造成的人員輸散等。

  顯然,對於企業來說,一個完備的BCP必須儘可能多地考慮到所有可能的危險情況,只有處理災難性事件的計劃而沒有處理應用系統失誤的計劃,這樣的BCP是不完備的;反之亦然。

  企業所制定的BCP應該同時兼顧兩個方面——預防和控制。例如,人為事故和蓄意破壞可以通過物理安全和個人行為的評測來預防。而應用系統的錯誤則可以通過對軟體的有效評測與測試來預防。

  危險評估的最後結果應該是一份有關危險效益分析的詳細陳述報告,要有對危險的精確描述、哪些危險可能發生,以及需要採取的保障業務連續性和緩和危險的措施,同時要有因為剋服了危險而帶來的收益分析。這份報告還應該描述清楚任何現有的前提或者限制因素。

  二、 業務影響分析(BIA)

  業務影響分析(Business Impact Analysis)實質上就是對關鍵性的企業功能、以及當這些功能一旦失去作用時可能造成的損失和影響的分析。

  對於企業業務運營的關鍵人員來說,他們需要分析:

  A. 影響

  • 哪種功能對於企業的整體戰略而言是生死攸關的
  • 該功能在多長時間內失效不會造成影響和損失
  • 企業的其他業務功能由於該功能的失效會受到何種影響——運營影響分析
  • 該功能的失效可能造成的收入影響——財務影響分析
  • 該功能是否會對客戶關係造成影響——客戶信心的損失
  • 該功能是否會對市場份額造成影響——市場占有率的下滑
  • 該功能是否會對企業在行業中的地位造成影響——企業競爭力的損失
  • 該功能是否會影響今後的銷售——機會的喪失
  • 什麼是最大的/可承受的/可允許的失效

  B. 業務恢復需求

  • 要使該功能連續,需要哪些資源和數據紀錄
  • 最少的資源需求是什麼
  • 哪些資源可能來自企業外部
  • 它與企業其他功能的依賴關係以及依賴程度
  • 企業的其他功能與該功能的依賴關係以及依賴程度
  • 該功能與企業的外部業務/供應商/其他廠商的依賴關係以及依賴程度
  • 在缺少試驗環境的情況下進行恢復,需要採取怎樣的預防措施或檢驗手段

  在進行了這些分析之後,才有可能對企業的各種功能進行分類:

  a)關鍵功能——如果這類功能被中斷或失效,就會徹底危及企業的業務並造成嚴重損失。

  b)基礎功能——這些功能一旦失效將會嚴重影響企業長期運營的能力。

  c)必要功能——企業可以繼續運營,但這些功能的失效會在很大程度上限制企業的效率。

  d)有利功能——這些功能對企業是有利的;但它們的缺失不會影響企業的運營能力。

  根據各種功能的恢復需求,企業便可為上述各類功能制定標準的恢復時間架構。例如,關鍵功能<1天;基礎功能:2~4天;必要功能:5~7天;有利功能:>10天。

  影響分析可以幫助企業確定各類業務功能的優先順序,換句話說,也就確定了各業務功能的優先恢復順序。

  BIA有助於定義恢復對象。在進行了影響分析之後可能會發現,在一次災難之後恢復業務運營時,首先恢復部分功能就足夠了,比如說在24小時內先恢復日常業務的40%就夠了。

  詳細定義好在災難或業務中斷之後保障業務功能運營的資源需求也是可能的。這些資源需求包括基礎設施、人力資源、文檔、記錄、設備、電話、傳真機等,無論需要什麼資源都要有完備的規範要求。擁有適當的細節要求是非常重要的,因為在危險事件發生時,會產生一定程度的慌亂,到那時再決定這類細節已經不可能了。

  成本因素在進行影響分析時也是不能忽略的。我們需要記住以下一些事項:

  • 收入的損失和商機的喪失與恢復所需的時間直接成正比
  • 一種恢復策略的成本與恢復所需的時間成反比
  • 可能的恢復策略的成本必須和在採納該策略之前由於業務功能中斷而造成的實際損失進行比較。如果所建議的恢復策略的成本遠高於預計的成本,那麼這種策略就是不可取的。

  三、 策略

  BCP應包括以下策略:

  A.預防 預防的目的在於減少災難發生的可能性。有關預防的策略應該包括制止和預防控制。制止控制可以減少危險的可能性。預防控制則是保護企業的弱點區域,以防禦危險的發生並降低其影響。這兩類控制在實際運營中廣泛存在,比如經營場所的安全、人員控制、相關基礎設施(如UPS、後備電池、煙火探測器、滅火器等)、軟體控制、相關的存儲和恢復等。

  企業希望保障其資源(包括信息資產)的可用性和安全性,其安全策略必須針對這些對象而制定,並且提供有關資源使用和管理的指南。在熟悉了企業的所有資源、資源的佈局以及危險管理等之後,才可能拿出實施安全策略所需的必要的控制措施。這些控制措施或安全舉措必須時時加以檢查和測試。

  如果一種安全策略,能將預防措施都部署到位,可以監控對系統的入侵併防範那些試圖破壞系統的行為,那麼其本身就是一種制止控制。預防計劃的執行必須小心謹慎。必須保證實施安全策略時既不能對日常業務帶來限制,出現瓶頸,也不能引起可用性問題,或者給系統的訪問和使用帶來障礙。

  B.響應 響應就是當危險發生時的反應。它必須能夠阻止危險的進一步擴大,評估危險的程度,通過與外部世界的正常通信聯絡輓回企業的聲譽,並啟動必要的恢復時間表。

  對業務中斷的第一反應應該是告知所有相關的人員。如果危險有事前警示的話(比如這次的非典爆發),那麼這種告知就可以提前進行。及時的告知非常重要,因為這可能會給阻止危險的進一步擴大創造機會。如果在適當的時機執行一次關機、一次轉換或者一次撤離,甚至有可能完全防止危險的發生。但是這需要有診斷或探測控制的存在。這類控制或者可以持續掃描以探測發生中斷的徵候(網路、伺服器),或者可以從外部資源搜集信息(自然災害)。

  準確的告知程式必須事先制定好。必須清楚地記錄在案:需要告知誰,怎樣告知,由誰告知,而且還得有逐步擴大的機制。

  在BCP中必須設立好一棵告知樹。最初的告知發送給一組人,然後再由他們中的每個人去告知另一組人,依次類推。屬於這棵告知樹的人都有不同的責任和作用,所涉及的人員應包括:

  • 管理團隊——需要獲得有關危險發展狀況的信息。該團隊有權力啟動緊急響應體系和下一步的行動。管理團隊還要負責與媒體、公眾、客戶以及股東們打交道。
  • 危險評估團隊——需要立刻對危險進行評估,評價業務中斷的嚴重程度。
  • 技術團隊——應當為關鍵決策制定者如何採取下一步BCP行動提供服務。
  • 運營團隊——應當執行BCP的實際運作。

  還有很重要的一點就是每一個團隊都應明確第二負責人。萬一第一負責人沒有通知到或者無法負起責任,那麼必須告知第二負責人。告知可以使用各種工具或手段:如手機、呼機、簡訊、電話和E-mail。每個團隊都應當有相應的配備。

  危險評估團隊應該是最早(或者與管理團隊同時)被告知的。他們應當最早來到現場,以便評估所遭受的危險程度和級別。如果工作現場已經遭到破壞,那麼他們就應該做好各項準備,一旦允許進入現場就開始工作。

  評估過程本身也應有計劃地進行,必須與保障業務連續性的優先順序密切相關。這就是說評估團隊應當意識到危險所影響到的工作區域和工作流程是否對整個業務的運行至關重要。這將有助於他們優化其評估進程,同時也可正確地關註關鍵性工作區域。這支團隊需要察看以下事項:

  • 中斷的原因是什麼
  • 阻止危險擴大的前景如何
  • 基礎設施和設備受損情況
  • 業務受影響狀況
  • 關鍵記錄受損情況
  • 可以輓回什麼損失
  • 什麼設備需要修理、恢復和更換

  有了危險評估團隊提供的有關受損程度和受損區域的詳盡信息,技術團隊便可立刻投入工作。

  BCP必須擁有一組基於業務影響分析和持續性目標的預設參數,這些參數應該能夠區分出中斷和災難的不同性質,同時也能評價出危險的嚴重程度。

  當危險評估團隊和技術團隊開始工作時,其他BCP團隊也應依照警示告知到位,以便按照連續性計劃採取應當採取的行動。

  C.業務接續(Resumption) 業務接續只涉及那些時間敏感的業務流程,要麼是在中斷發生後立即接續,要麼是在可允許的一段平均時間後接續,但不是對所有業務的恢復。

  一旦BCP被激活,命令將從指揮中心發出。這個指揮中心應該是在一個不同於日常經營場所的地方。該中心應配備相應的通信設施、辦公設備,可能的話還應該構建區域網和VPN。

  需要做出的第一個決策是,關鍵性業務的運營能否在日常的工作場所或者在一個備選場所很快恢復運營。

  備選場所可以分成以下幾類:

  (a)空場所(Cold Site)——該場所只需配備必要的環境條件即可,比如說,應配備電話插座、電源以及UPS等,但要避免其內有任何其他設備,它的作用就是準備將保障業務持續所需的全部設備搬移進來。

  (b)熱場所(Hot Site)——該場所是一個完全的備份場所,有人員工作的空間,所有設施一應俱全,數據備份也是最新的。一旦災難發生,BCP團隊只需進駐該場所就可開始工作,不會有額外的時間拖延。

  (c)溫場所(Warm Site)——該場所實際上就是配備了部分設備的熱場所,數據備份不算最新,但也不能太舊。

  (d)機動場所(Mobile Site)——該場所是一個具有較小設施配置的機動場所。可以位於主要經營場所附近,因而也可節省關鍵人員在路程上花費的時間。

  (e)鏡像場所(Mirrored Site)——該場所在所有方面都與主要經營場所完全相同,信息和數據也與主要場所同步。實際上該場所就是正常狀況下的一個冗餘場所,因而通常也是成本最高的一種選擇。

  在備選場所(或主要場所,如果仍然可用的話),工作環境需要恢復。通信、網路和工作站需要設置。與外界的聯繫必須持續暢通。企業可以首先手動恢復一些業務,直到關鍵的IT業務可以繼續運行為止。當然,如果恢復計劃(下麵就要講到)允許,那麼關鍵業務功能也可採用自動方式迅速恢復。

  D.業務恢復(Recovery) 業務恢復是啟動時間敏感度稍低一些的業務流程。業務恢復的開始時間要取決於接續那些時間敏感的業務流程需要的時間。

  在進行業務恢復的場所(可以是主要經營場所或備選場所),需要在備份的設備上恢復操作系統,並按照關鍵性次序恢復必要的應用系統。當服務於關鍵功能的應用系統恢復之後,則需要從備份磁帶或其他異地備份媒介上恢複數據。

  備份數據也必須經常保持同步,也就是說,重建的數據應當與業務中斷之前的某一預先確定的時點的數據相吻合。該時點的選擇取決於關鍵業務的要求。由於商業數據有各種不同的來源,因此重建的每一種數據都必須達到所需的數據一致性狀態。經過同步的數據必須經常進行複查並保持其有效。這種複查必須強制執行,因為在危險發生的緊急關頭,不可能再有閑暇來測試數據是否可用。因此,必須要有一套清楚的方法、策略或複查清單來執行這個讓數據保持其有效性的過程。

  一旦數據達到了可靠的狀態,企業的事務就可以加速運行,因為災難已經得到處理,所有的關鍵性功能都已得到接續。逐步地,其他業務也可開始恢復其功能。

  E.複原(Restoration) 複原則是修複並恢復主要的經營場所。最終是要在原有的場所或者一個全新的場所完全恢復所有的業務流程。

  就在恢復團隊開始從某個備選場所開始支持恢復運營的時候,對主要場所的全部功能進行複原的工作也可以展開。如果原有場所在災難後的確無法恢復,則需要在一個新的場所進行複原工作。恢復團隊和複原團隊的成員有可能是同一組人。

  必須確保該複原場配備必要的基礎設施、設備、硬體、軟體和通信設備。而且要對該場所能否處理全部的業務流程進行測試。

  執行上述所有行動的計劃應當包括一個時間跨度定義,確定在某一跨度內必須完成哪些行動。這個時間跨度的定義必須與企業的恢複目標相一致。BCP團隊必須意識到,如果在任一時點,他們的行動超出了規定的時間跨度,那麼這個意外事件就必須立刻上報到指揮中心,由指揮中心馬上制定相應的解決辦法,否則企業就無法實現其恢複目標。

  四、 指標定義

  在危險評估和業務影響分析階段之後,保持業務連續的基礎業務就已經顯現出來。我們在上面已經說過,按照業務術語可將企業的業務功能分成4類,即關鍵業務、基礎業務、必要業務和有利業務。

  這種分類可以讓業務連續的優先順序十分清晰,這樣,業務恢復的目標就可以用下麵的指標進行量化:

  • 恢復的時間目標(RTO)——最大可允許中斷時間
  • 恢復的時點目標(RPO)——數據損失可允許的最遠回溯時點
  • 由於引進了BCP的評測指標而導致的企業性能退化
  • 實施BCP的成本

業務連續性計劃的內容

  業務連續性計劃既可以分成幾個單獨的計劃:即預防、響應、業務接續、業務恢復和複原計劃,也可以由每一個這樣的計劃構成總的計劃書中的不同章節。

  1.基本項目

  • 目的
    • 制定計劃的目的必須加以說明。還應該說明即劃分幾個階段試時,每個階段所要實現的目標是什麼。
  • 範圍
    • 說明有哪些部門和運營業務需要實施BCP。如果一個BCP只針對某些災難而非全部災難,則需要針對這些特殊災難制定專門的實施處理腳本。
  • 必備條件/前提條件和限制因素
    • 形成一份BCP的前提條件需要在此說明。在某些情況下,還須說明BCP成功的必備條件。比如說,伺服器的數據備份間隔不得超過多少小時,受過訓練的運營恢復團隊必須呼之即來,備選場所必須在災難發生之後多少小時之內一切準備就緒等等。
    • 如果BCP計劃的執行還存在一些限制條件的話,也應在此列出。
  • 團隊
    • BCP團隊的組織/負責人選、下屬哪些分支團隊、團隊的作用和責任等,都必須在此說明。
  • 指標
    • 作為一種策略,企業必須由用於恢復的RPO和RTO指標,以及性能指標等,這些指標應該在此加以說明,並向客戶和股東說明。

  2.預防保護

  作為BCP中的一個實施部分,預防措施需要在此說明。這些措施可以概括如下:

  • 監督
  • 訪問控制
  • 身份認證
  • 防病毒
  • 過濾
  • 入侵檢測系統
  • 備份計劃

  3.緊急響應

  • 響應的準備
    • 在響應階段需要哪些資源應當在此列出,同時詳細申明這些資源的配置和所需數量。如果還需要一些文檔和記錄的硬拷貝,也必須在此申明。
  • 告知樹
  • 危險評估
  • 何時對外宣佈
  • 激活BCP的關鍵標準

  4.業務接續

  從緊急響應階段到業務接續階段如何進行銜接是需要在這裡說明的。有關業務接續運營的決策過程、在哪裡以及怎樣進行業務接續、需要採取什麼行動,以及接續哪些業務到何種程度等等,都需要在此加以說明。還要為BCP團隊中的各個小組指定各自應該採取的行動,每個小組要完成指定的任務。BCP中的這一部分也稱為業務接續計劃(BRP)。

  5.業務恢復

  執行業務恢復的程式在此加以說明。BCP的這一部分也可稱為災難恢復計劃(DRP)。

  這一部分計劃文檔的組織可以有很多種方式。一種方式就是簡單地列出所有的恢複目標(按照RPO、RTO、目標伺服器/網路等來列)。根據每一目標進行計劃分解,同時明確相應的團隊/負責人以及任務。還有一種方式就是按部門來組織。無論採用哪種方式,都應確保所有的BCP目標都能覆蓋到。

  計劃的這一部分必須編排得像一本操作手冊,由一系列簡單明確的指令構成,恢復團隊完全可以按照這些指令進行恢復操作。各種操作之間的相互關係也必須加以明確說明。所有的指令和說明必須明白無誤,以免因可能引起誤解或不明瞭而導致時間損失。

  6.複原

  為業務運營複原原有場所應採取的步驟在此加以說明。需要標明每個團隊/負責人的責任和任務。

業務連續性計劃的運作流程

  BCP運作共有6個階段,分別為:1、項目初始化、2、風險分析及業務影響、3、策略及實施、4、BCP開發、5、培訓計劃、6、測試及維護。

  1、項目初始化

      • 獲得管理層的支持與投入
    • 為了確保該程式能夠成功,高級管理層必須參與其中。BCP計劃必須成為公司的戰略性業務計劃之一。同時,公司必須設定合理預算,併為BCP提供獨立的預算。
      • 建立團隊
    • 必須建立一個團隊,人員包括財務部,審計部,信息技術部,人事部,行政部等等。當災難開始時,這些部門在繼續扮演他們承擔的支援角色的同時,也必須實施重大的機構轉變以援助受影響的區域。法律部、公關部與投資部在事件發生後需要向公眾及股東通告公司的運作狀況。

  2、風險分析及業務影響分析

    • 決定BCP需求的關鍵驅動力是“企業能在災難中承受多少金額的損失”?業務影響分析的目的是回答以下問題:
      • 保護何種資產?(資產識別與評估)
      • 資產的威脅與脆弱點?(脆弱點和威脅評估)
      • 有沒有控制措施?控制措施能否預防或減少潛在的威脅?(評估控制)
      • 投入金額/勞力的多少?(決定)
      • 投入資金的效率如何?(通訊和監控)
  • 當進行業務影響分析時,應考慮以下幾方面:
      • 金額的影響:如果不採取相應的措施,則組織的經濟損失是多少?
      • 客戶的影響:如果發生業務中斷,則組織會損失多少市場占有率
      • 法律的影響:組織是否遵從法律的要求?
      • 內部依賴關係的影響:中斷的業務是否會其他領域的關鍵業務?
  • 作為業務影響分析的一部分,應該評估業務允許中斷的時間長短;
    • 組織能提供多常時間的信息;當信息重新可用時,允許損失的信息是多少?這些問題可以通過恢復時間目標(recovery time objective (RTO))和恢復點目標(recovery point objective (RPO))來決定。
  • 決定BCP需求的另一個因素是“災難實際發生的可能性”。此因素由威脅的級別和組織具有的薄弱點範圍決定,威脅的程度取決於下列因素:
      • 有惡意性的破壞,如轟炸、縱火、工業間諜等。
      • 意外事故,如組織的辦公場所、環境,內部系統和處理程式的質量。

  3、業務持續性策略及實施

  • 業務持續性策略
    • 業務影響分析為制定業務持續性策略提供必要的信息,下來,根據提供的信息,可以確定多種滿足組織業務持續管理的方案。必須為各種業務持續方案進行成本、效益及風險分析,包括:
      • 滿足業務持續目標的能力
      • 影響的可能性
      • 安裝設備的成本
      • 維護、測試及調用設備的成本
      • 中斷對於技術、組織、文化和管理的干擾及未採取持續管理的潛在影響
    • 應該仔細考慮採取業務持續方案確實解決了具體的風險但不會增
    • 加其它風險。通過風險降低和業務持續方案成本的平衡來決定業務持續策略以降低風險達到業務持續的目標。
  • 實施
      • 設立組織及準備實施計劃書
      • 實施備份安排
      • 實施降低風險的措施

  4、BCP開發

  • 開發業務持續性計劃之前,確定災難發生的情況下執行的行動,你需要熟悉每天的操作任務。這意味這你需要熟悉每一個業務處理過程的基本文檔。在開發業務持續性計劃之前,須考慮下列措施是否已經存在:
      • 變更控制流程
      • 最終用戶的標準操作流程
      • 操作人員的具體需求和特殊外圍設備需求
      • 數據流圖表及問題管理程式
      • 重要記錄
      • 磁帶備份/記錄管理日常安排
      • 異地存儲
  • 開發BCP計劃時,需考慮在計劃執行的七個階段中為每個恢復小組分派任務:
      • 評估與聲明
      • 通告
      • 應急反應
      • 過渡期處理
      • 搶救
      • 重新安置及啟動
      • 重新正常運做

  5、培訓計劃

  • 一些員工需要的特殊培訓如下:
      • 有緊急情況時可應用替代的技術流程
      • 當自動操作系統正在恢復時可替代的人工操作流程
      • 確保團隊成員達到推動BCP所需能力的技術培訓

  6、測試及維護

  進行演示及有規律的測試,增強信心及效率,確保其相關的文檔時常更新。

  (1)BCP的測試

  制定好的BCP需要進行適當地測試才能投入使用。這一過程必須經常周期性地進行。省略了這一過程就意味著BCP只能等災難實際發生之後進行實地測試,這樣做的風險太大,恐怕任何一家企業都不敢做這種嘗試。

  規劃一次BCP測試需要規定以下事項:

  • 測試腳本——將可能發生的災難定義為測試的一個部分。
  • 測試計劃——定義檢查程式、各種測試腳本、任務的類型、任務的參與者,比如說主要團隊或者主要團隊與預備團隊的混合行動。

  簡而言之,在測試BCP時,需要執行下列行動

  • 準備一份測試計劃,選擇測試腳本,說明預期要達到的結果。
  • 執行該計劃
  • 記錄測試結果
  • 評估測試結果,報告存在差距
  • 將測試結果和報告向團隊公佈
  • 確認需要做何改進以彌補差距
  • 培訓團隊

  (2)BCP的維護

  一個BCP必須周期性地加以檢查和維護。一旦有新的系統、新的業務流程、或者新的商業行動計劃加入企業的生產系統或者信息系統,引起企業整體系統發生變化時,就更應該強制啟動這種檢查程式。除此之外,像聯繫人名單的更改這樣微小的變動都可能觸發BCP計劃的更新。

  每一次在進行這種檢查程式時,最好是與對BCP的改進相互結合。例如,在測試過程中發現的問題、企業為了實現連續性對機構所作的調整,或者在保持業務連續性測試時發現了更好的行動方式和計劃等等。因此,BCP的維護應該是變化和改進的結合與不斷促進。

  每一次對BCP計劃所作的改動都應該及時通知所有的BCP團隊,並具體落實到每一次的培訓和測試過程中去。

  最後,與業務連續性相關的資源——人和設備——也會受到維護的影響。人員會通過培訓和測試程式受到影響,設備會通過維護程式受到影響。只有當這些資源始終處於良好狀態,才能在危機發生時成為可靠和可依賴的資源。

  公司沒有業務持續計劃就象是不設防,不可能阻止任何不可預測的破壞所造成的各種損失。所以公司必須認真的對待業務持續計劃。