IT이론 정리노트/IT보안(CISSP)

CISSP IT보안이론 요약: 재해 복구 계획 (DRP)

G. Hong 2022. 2. 16. 11:42
728x90
반응형

1. 재해의 특징

자연재해

  • 지진: 단층선 인근 지역은 지진이 발생 할 수 있으니 DRP 구현 절차에 따라 계획을 수립 해야함.
  • 홍수: 이론적으로 거의 모든 지역에서 발생 가능 하지만 특정지역에서 발생하기 더 쉽다.
  • 폭풍: 자연 및 인공시설물 파괴. 홍수,우박,번개(정전) 동반.
  • 화재: 자연적, 인위적으로 발생 가능
  • 지역 이벤트: 화산, 계절풍, 쓰나미, 눈사태 등

 

재해와 인재

  • 화재(인간의 부주의에 의한)
  • 테러행위
  • 폭탄 테러/폭발
  • 정전
  • 시설 및 인프라 장애
  • HW/SW 장애
  • 파업/시위
  • 도난/파손

 

2. 복구 전략

  • DRP에서는 DRP팀이 현장에 도착하지 않았더라도 현장의 직원에 의해서 즉시 복구노력을 시작 할 수 있게 설계 되어야 한다.
  • 금전적 손실을 줄이기 위한 충분한 보험가입도 필요하다.

 

업무 단위와 기능 우선순위

  • 가장 효율적으로 업무운영을 복구하기 위해 DRP팀은 업무단위들을 확인하고 우선순위에 의한 순서를 합의 해야 한다.
  • 결과로 우선 순위에 따른 업무단위 목록이 나와야 한다.

 

위기관리

  • 비상상황에서 개개인은 재해복구 절차에 충분히 훈련 되어 있어야 한다.
  • 적절한 경고 절차를 알아야 한다.
  • 즉각적인 대응 기재를 알아야 한다.

 

비상통신

  • 재해시에 바깥세상 뿐만 아니라 내부에서도 소통 할 수 있도록 해야 한다.

 

작업 그룹 복구

  • DRP 설계시에 작업 그룹들이 일반적인 작업 장소에서 활동을 다시 할 수 있게 작업 그룹의 복구 목표를 유지하는 것이 중요하다.

 

대체 처리 사이트

  • 가장 중요한 요소 중 하나로 주 사이트가 사용될 수 없을 때, 대체 처리 사이트를 선택하는 것이다.

콜드사이트

  • 충분히 큰 대기시설, 적절한 전기시설과 환경적 지원 시스템을 갖추고 있다.
  • 구축된 컴퓨팅 시설이 없고 활성화된 광대역통신링크도 없다.
  • 장점: 싼 비용
  • 단점: 시간지연 발생

핫 사이트

  • 전체 HW, SW, 네트워크 환경 등이 갖추어지고 유지 되고 있다.
  • 주기적이나 연속적으로 데이타가 복제 된다.
  • 옵션
    • 주사이트 셧다운 전에 시간이 충분 할 경우, 데이터 복제를 강제로 진행
    • 복제가 불가능 할 경우, 주사이트에서 핫사이트로 트랜잭션 로그 백업 데이프를 이동하고, 마지막 복제에서 트랜잭션들을 수동으로 재배치
    • 백업과 강제 재배치가 가능하지 않을 경우, 데이터 일부의 손실을 받아 들어야 함.
  • 장점: 재해복구 보호 수준이 탁월함
  • 단점: 비싼 비용
  • 대안: 공유 핫사이트

웜 사이트

  • 설비는 미리 구축 되어 있음. 하지만 데이터 복사본은 없음.
  • 활성화를 위해서 충분한 백업 미디어 운송과 핵심 데이터 재배치가 필요. 약 12시간 소요.
  • 핫사이트에 비해 비용절감 가능.
  • 공유시설도 사용이 가능하며 계약서에 '폐쇄없음' 보증 등도 고려한다.

모바일 사이트

  • 비주류 대안.
  • 독립적 트레일러나 재배치가 용이한 유닛으로 구성.

서비스 대행사

  • 시간제 컴퓨터 임대회사.
  • 재해 발생시 직원들의 데스크톱이나 모든 IT에 대한 지원을 제공 가능.

다중 사이트

  • 여러지역에 부서나 사무실이 분할 되어 있는 경우 다중 사이트를 통해 재해의 영향을 줄인다.
  • 회사 관리,운영이 어려울 수 있다.

 

상호 지원협정 (MAA)

  • 재해복구 조사에서는 대중적이지만, 실제로 거의 구현되지 않음
    • 재해 발생시 합의 파기 가능성 높음
    • 협력 기관들이 가까이 위치할 경우 같은 위협에 취약
    • 기밀성 문제로 인해 데이터를 맡기는 것을 꺼려함

 

데이터베이스 복구

전자소산 보관(Electric Vaulting)

  • DB백업이 대량전송을 통해 원격지로 옮겨진다.
  • 재해를 공표한 시간과 DB가 현재 데이터로 작동하는 시간 사이에 큰 지연이 있다.

 

원격 저널링

  • 데이터는 대량전송 모드에서 이뤄지지만, 더 빈번하게 이뤄진다.
  • 백업파일이 전송 될 때, 이전 전송으로 부터 이뤄진 트랜잭션 로그를 전송한다.

 

원격 미러링

  • 활성화 된 DB서버가 백업사이트에서 유지된다.
  • 주사이트에서 적용되는 내용이 원격서버에도 동시에 적용된다.

 

3. 복구계획 개발

  • 한 번에 전체 계획을 작성하려고 기대하지 말 것.

고려할 가치가 있는 문서의 유형

  • 경영 종합보고(높은수준의 개요 제공)
  • 부서별 계획
  • 백업시스템 구축과 유지보수담당 IT인력을 위한 기술가이드
  • 재해복구팀의 개인 체크리스트
  • 중요재해복구팀 전원을 위한 계획의 전체 사본

 

긴급대응

  • 긴급대응계획은 체크리스트 형태로 제공되기도 한다.
  • 가장 중요한 작업을 체크리스트의 첫번째에 놓아야 함.

 

직원과의 소통

  • 재해 발생시 연락해야 하는 직원들의 목록을 포함.
  • 연락의 대체수단 뿐만 아니라 연락이 닿지 않는 동안의 백업 연락처를 포함 한다.

 

평가

  • 활동을 분류하고 진행 중인 대응을 파악하기 위한 평가.
  • 순환적으로 일어나고, 사건이 진행 됨에 따라 더 자세한 평가가 이뤄진다.

 

백업과 외부저장소

풀 백업

  • 시스템의 모든 파일을 복제

증분 백업

  • 가장 최근의 풀백업이나 증분백업 이후 변경된 내용만 저장

차등 백업

  • 가장 최근의 풀백업 이후 변경된 내용만 저장

 

백업테이프 형태

  • 물리적특성: 테이프유형, 미디어에 물리적으로 사용되는 것
  • 회전주기: 백업주기와 데이터의 보유기간

 

디스크 to 디스크 백업

  • 디스크 드라이브의 가격하락으로 D2D사용이 늘어남

 

백업 모범사례

  • 백업/복원 활동은 네트워크 성능에 영향을 줄 수 있으므로 밤이나 주말로 예약되어야 한다.
  • 데이터 백업 비용은 점점 증가하므로 합리적으로 비용을 처리하여야 한다.
  • 백업주기가 돌아오기 전에 데이터가 손실 될 수 있다. RAID, 클러스터링, 서버 미러링과 같은 실시간 연속 백업을 배치 할 필요가 있다.
  • 복구 테스트를 할 것

 

테이프 순환

  • Grandfather-Father-Son, Tower of Honoi, Six cartridge Weekly Backup 등의 방법이 있다.
  • 백업SW나 HSM으로 자동 구현 할 수 있다.

 

SW 에스크로 협정

  • SW의 기술적인 지원이 불가능 할 경우 회사를 보호하기 위해 사용되는 유일한 도구

 

외부 커뮤니케이션

  • 재해복구 지원품 제공을 위해 공급업체와의 연락
  • 고객들의 기업운영상황 확인을 위한 연락 등등
  • CEO를 대변인으로 사용하는 것은 건전한 사례가 아니다. 교육되고 준비된 고용인을 통해 진행되어야 한다.

 

그외 복구계획 개발

  • 유틸리티 : 전력,물,가스,하수도 등
  • 물류와 공급: 재해복구운영 관련 물류와 인력들을 위한 음식,시설등의 공급
  • 복원과 회복: 복구가 오래 걸릴 것으로 예상 될 경우 복구작업을 분리 함.
    • 복원: 업무시설 및 환경을 포함
    • 복구: 업무운영과 절차

 

4. 훈련과 문서화

훈련계획 고려사항

  • 신입사원을 위한 오리엔테이션
  • 처음으로 새로운 재해복구 역할을 부여 받은 직원을 위한 초기교육
  • 재해복구 팀원을 위한 자세한 보수교육
  • 다른 모든 직원을 위한 간략한 보수교육

DRP는 완전히 문서화 되어야 한다.
 

5. 테스트와 유지보수

  • DRP는 주기적으로 테스트 해야한다.

 

체크리스트 테스트

  • 실행하기에 가장 쉽지만 가장 위험한 것 중 하나

구조화 된 연습

  • 재해 시나리오에 따른 역할극

모의 테스트

  • 시나리오에 대한 적절한 대응 개발.
  • 일부는 시험으로 측정되고, 중요하지 않은 사업활동 중단과 일부 운영인력지원이 수반된다.

병렬 테스트

  • 사이트에 배치된 직원들이 실제 재해와 마찬가지로 재해복구 임무를 재현.
  • 주요시설들의 운영이 중단되지 않고 진행 된다.

전체 중단 테스트

  • 실제로 운영이 중단되고 복구사이트로 옮겨진다.

 

유지보수

  • 조직의 변하는 요구에 따라서 DRP를 조정하여야 한다.
728x90
반응형