이 책에서 다루는 각종 재해 복구 전략은 앞으로 비즈니스와 IT 의사 결정 프로세스의 필수 요소로 대두될 것이다. 특히, 파업/해킹 등과 같은 비상사태나 재해로 인해 금융권의 전산시스템이 마비될 경우, 해당 금융회사는 물론이고 국가적으로도 치명적인 경제적 손실이 발생할 우려에 대비해 우리나라에서도 지난 8월 27일 이 같은 내용을 골자로 하는 비상시 금융기관 전산망 안전대책을 시행할 예정이라고 밝혔다. 따라서 그동안 권고사항으로 추진됐던 "재해 복구 센터(Disaster Recovery Center)" 구축도 이제 더 이상 권고사항이 아니라 의무화된다. 『재해 복구 전략: disaster RECOVERY planning』에서는 저자의 풍부한 필드 경험을 바탕으로 예상치 못한 재해에 미리 준비하고, 재해 발생시 분야별로 체계적으로 극복해 나갈 수 있는 전략을 수립하는 방법을 제시한다.
"2001년을 돌이켜보면 9/11 테러사건에 대한 깊은 슬픔과 분노로 가슴이 메이는 것을 느낄 것이다. 과연 어느 누가 이 날의 충격과 공포를 잊을 수 있을까? 직원 3,700명이 세계 무역 센터에서 근무하고 있던 모건 스텐리의 경우, 9/11 테러로 인해 본사가 직접적인 피해를 입었으며 불행하게도 정규직 7명과 계약직 서비스 전분가 6명이 세상을 떠났다. 그럼에도 우리는 테러 사건 직후 및 그 후 몇 주 동안에 이루어진 회사의 대처 방식을 자랑스럽게 생각한다. 북쪽 빌딩이 파괴된 직후 불굴의 의지, 훈련 그리고 몇몇의 사람이 보여준 영웅적인 정신 덕분으로 거의 모든 직원은 그 동안 자주 훈련해온 안전 대피 요령에 따라 남쪽 빌딩을 신속히 탈출할 수 있었다. 대다수의 직원들은 고객과 회사 보호를 위해 즉시 백업 사이트로 향했다. 우리는 이 사건이 우리가 추구하는 것이 무엇이며 극한 상황에 처했을 때 우리가 어떻게 대응해야 하는지를 확실히 보여주는 계기가 되었다고 생각한다.
─ 2001년 모건 스탠리 연차보고서의 "주주에게 드리는 글" 중에서
9월 11일 미국에서 있었던 대표적인 재해는 사회적, 정치적 결과 외에 기업들에게 재해 복구 계획을 가지게 했다. 이 사건으로 세계 무역 센터에 입주해 있던 회사 440여 개와 미 국방부의 수많은 정부 기관 중 200여 곳만이 사전 계획된 영속성 전략을 가지고 있음을 확인할 수 있었다. 이는 공식적으로 재해를 공표하고 컴디스코(Comdisco), IBM 비즈니스 연속성과 복구 서비스, 선가드 복구 서비스(SunGard Recovery Service), HP 비즈니스 연속성과 복구 서비스와 같은 최고의 "핫 사이트(hot site)" 업체와 계약을 가동한 회사의 수를 조사한 매체 기사를 근거로 예측한 것이다. 다행히도 일부 회사에서는 테러 사건 발생시 핫 사이트 업체의 서비스가 필요 없었다. 주요 본사나 중요한 데이터 센터가 아니라 "지점"만 세계 무역 센터나 미 국방부 건물에 입주해 있었기 때문이다.
그러나 이런 일부 회사의 경우를 제외하고는 극소수 회사만 재해 발생 가능성에 대해 대비를 해왔다. 1993년 세계 무역 센터 폭발 사건 후, 몇 개월 혹은 몇 년 안에 사라진 143개 업체의 경우처럼 연속성 계획 없이 9/11 참사를 겪은 많은 회사는 내년 이맘때면 사라질 것이다. 그리고 이런 회사들은 더 심한 고통을 주는 엄청난 사건의 비통한 기억으로 복구 계획의 중요성을 배우게 될 것이다. 테러 발생 후 실시한 일부 세계 무역 센터 생존자들과의 인터뷰가 있는 보고서를 근거로 살펴보면 미래의 재해로부터 막중한 임무를 가지고 있는 비즈니스 업무를 보호할 수 있도록 도와주는 몇 가지 교훈을 얻을 수 있다. 그리고 이러한 교훈은 대부분 재해 복구 능력을 활성화하고 사용해야 하는 환경과 배경을 다루고 있다.
1. 전체적인 재해 계획
통신, 전기, 운송 등 기업이 제어하기 어려운 중요한 인프라 구성 요소를 사용 불가능하게 되는 최악의 상황을 가정해보라. 직접적인 재해 당사자가 아니더라도 재해 복구 계획을 가동해야 할 것이다. 이웃들은 국지적인 재해 발생시 반드시 동반하는 파생적인 재해의 한 부분이다. 잘 짜놓은 재해 복구 계획은 최악의 시나리오를 전제로 하며, 비즈니스에 발생한 "더 작은" 재해라 해도 대응할 수 있는 모듈형 구현 방식으로 설계되어 있다.
2. 핵심 자산에 관한 초점
기업의 가장 중요한 자산은 대체할 수 없다. 재해 복구 전략은 교체와 이중화라는 두 가지 특색을 갖추고 있다. 숙련된 인력과 데이터를 교체하기는 불가능하므로 이중화 전략을 실행해야 한다. 이는 데이터 측면에서 데이터 미러링이나 테이프 백업 전략을 의미하며, 전략을 신중히 검토하고 정기적으로 테스트해야 한다.
3. 규모는 문제가 아니다
많은 회사들이 힘들게 얻은 교훈으로 PC 하드 디스크에 저장된 중요한 데이터를 매우 과소평가했다는 것을 들 수 있다. 기업의 재해 복구 계획가와 IT 관리자들이 미션 크리티걸한 데이터를 생각할 때, 어레이(array), 대규모 NAS, SAN, 또는 메인프레임 DASD와 같은 "Big Iron"에 집중하는 경향이 있다. 하지만 보통 PC나 주요 기업 재정을 쫓는 데 사용하는 엑셀 스프레드시트는 비즈니스 복구 관점에서 기업의 ERP 시스템의 모든 데이터보다도 중요도가 아주 높다. 회사가 재해로부터 살아남으려면 이렇게 작지만 중요한 모든 애플리케이션으로부터 중요한 자산을 추출해서 오프사이트로 복제할 수 있는 역량을 갖추어야 할 것이다.
4. 법률 시행 처리
재해 발생 후의 생존 기업들은 중단된 장비에 전원을 공급하거나 최종 백업을 실시하기 위해 사무실에 어떻게 접근할 것이지 등의 내용보다는 약탈을 방지하고 대중의 건강과 안전을 보장하는 것에 관심이 더 많은 공공 안전 전문가의 보호 하에 연속성 계획을 실행해야 할 필요성을 깨닫게 되었다.
5. 최선을 다하는 사람들의 노력을 기대하고 최악의 상태를 예측하라
재해 복구 계획의 예행 연습이나 테스트의 목적은 복구팀에 프로세스를 수행하는 방법을 판에 박힌 방식으로 가르치는 것이 아니라 심각한 부조리에 직면하여 그들이 합리적으로 생각할 수 있도록 하는데 있다. 또한 사람들은 심리적으로 복구 환경에서 보안 보호책을 제공하기를 바란다.
6. 타격입은 서드파티를 주의하라
서드파티가 제시하는 계획의 가정을 주의해야 한다. 일부 기업들은 재해 발생시 하드웨어를 교체하기 위해 자신들의 전략 중 "넥스트 박스 오프 더 라인(next-box-off-the-line)" 접근 방식을 계속 사용하고 있다. 이들의 계획은 바로 재해 발생 후 가능한 빨리 공급 업체로부터 새로운 물품의 우선적인 발송을 요청하여 손상된 컴포넌트들을 대체하는 것이다. 따라서 안전한 오프사이트 시설에 여분의 중요한 컴포넌트를 관리 유지하는 것은 좋은 생각이다.
7. 직원 업무 공간을 계획하라
많은 재해 복구 계획이 시스템과 네트워크 교체까지 진행하고 계획을 중단해버린다. 즉 대부분의 복구 계획은 신규 사용자의 업무 공간을 고려하지 않는다. 그러나 복구 일정이 위태롭게 되면 직원들이 혼란스러워할 수 있다. 따라서 기업들은 직원이 전화 연결이나 월드 와이드 웹을 통해 미션 크리티컬한 애플리케이션에 접속할 수 있도록 애플리케이션 서비스 제공 업체나 웹 호스팅 제공 업체를 이용하는 것을 검토해야 한다.
8. 매체를 피하라
TV 카메라를 통해 기업의 중요 정보가 그대로 시청자들에게 방영될 수 있다. 재해 지역에서 멀리 떨어진 사령 센터 설립과 기업 커뮤니케이션 매체를 통한 매체 대처의 필요성을 인식하고 있어야 한다.
9. 직원들을 염두에 두어라
테러이든 천재지변 이든 재해의 충격은 직원들에게 정신적인 피해를 입힌다. 단축 근무, 헌장 상담 및 기타 특별 고려 사항들은 통합된 모든 물류나 계획들보다도 성공적인 복구에 더 많이 기여할 수 있다.
10. 혁신에 보답하라
팀의 리더가 솔선 수범해야 할 필요성을 느낄 때, 계획가들은 즉시 또는 사건 후 보고 회의에서 이를 보상해야 한다. 그리고 만약 실수하면 최대한 빨리 용서하도록 한다. 고객, 주주 그리고 평상시로 복귀하길 기다리는 다른 사람도 그럴 것이기 때문이다. 대부분은 재해 복구가 어려운 일이라는 것을 이해할 것이다.
본 기사는 『재해 복구 전략: disaster RECOVERY planning』 12장의 내용을 발췌한 것입니다.