서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

서버 망치는 원숭이, 고치는 원숭이… 넷플릭스에는 ‘사이버 교관’ 있다

김민석 기자
김민석 기자
입력 2022-10-18 20:14
수정 2022-10-19 01:13
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0

해외 빅테크 재난대응 어떻게

‘원숭이 부대’ 훈련 프로그램
불시에 고의로 서버 등 공격
구글 ‘DiRT’도 극단상황 설정
임직원 대응·해결 능력 강화
이미지 확대
‘카카오 사태’로 구글, 넷플릭스 등 글로벌 플랫폼 기업들의 재난 및 위기 대응 방식이 더욱 주목받고 있다. 화재 등 재난 발생 시 백업 서버 가동과 데이터 이중화를 기본으로 갖춘 것은 물론 비상 상황을 일부러 연출해 장애를 복구하는 훈련체계도 있는 것으로 알려졌다.

넷플릭스엔 업무 시간뿐 아니라 일요일 새벽 3시에도 불시에 서버 불능 상태 등 돌발 상황을 일으킬 수 있는 훈련 프로그램이 가동되고 있다. 넷플릭스는 이런 프로그램을 ‘원숭이 부대’라고 이름 지었다. 구글과 메타 등 대부분의 글로벌 빅테크 기업들은 넷플릭스처럼 자체 훈련 프로그램을 도입해 운영하고 있다. 최근 ‘카카오 먹통 사태’와 같은 일이 발생하지 않게 하기 위한 ‘사이버 교관’인 셈이다.

아마존 클라우드 컴퓨팅인 아마존웹서비스(AWS)를 기반으로 운영되는 넷플릭스는 2015년 AWS 서버 문제로 잠시 장애를 경험한 뒤 원숭이 부대를 고안했다.

이 ‘부대’엔 여러 마리의 ‘원숭이’가 소속돼 있다. ‘혼돈 원숭이’(카오스 몽키)는 ‘야생 원숭이가 서버실에 난입해 공격하고 케이블을 물어뜯는 동안에도 서비스가 중단돼선 안 된다’는 넷플릭스의 철학을 반영해 탄생했다. 이 프로그램은 업무 시간 중간은 물론 일요일 오전 3시에도 실행돼 작업을 비활성화한다. 넷플릭스는 혼돈 원숭이에 이어 서버 통신을 인위적으로 지연시키는 ‘지연 원숭이’, 규칙에 어긋나는 소프트웨어상 실체를 종료시키는 ‘적합성 원숭이’, 취약한 실체를 탐지해 서비스에서 제외시키고 종료시키는 ‘의사 원숭이’ 등을 탄생시켰다. 이에 더해 전체 클라우드 서버를 종료하는 ‘혼돈 고릴라’를 개발해 극단적인 장애 상황에 대응하는 능력을 시험하고 있다.

구글 역시 클라우드 백서를 통해 재해 발생 시에도 서비스와 사업 운영이 계속될 수 있도록 매년 전사 차원의 ‘재해 복구 테스트’(DiRT·Disaster Recovery Testing)를 시행한다고 소개했다. DiRT는 강제로 서비스가 불능 상태가 되거나 핵심 인력이 없는 상황, 지원 시스템 차단 상황 등을 의도적으로 부여하고 해결하는 훈련 방식이다.

메타 역시 전 직원이 참여하는 특별한 재해 복구 훈련 프로그램을 운영하고 있다고 밝혔다. 다만 훈련 프로그램의 이름과 구체적인 내용은 대외비에 해당된다며 공개하지 않았다.

이번 사고 대응에 실패하긴 했지만 카카오도 자체 재난 훈련 프로그램을 운영하고 있다고 설명했다. 네이버 관계자 역시 “평소 재난에 대비한 정기 훈련을 해 왔고 이번에도 훈련된 절차대로 빠르게 대처해 피해를 최소화할 수 있었다”고 말했다.
2022-10-19 2면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
학생들 휴대폰의 도청앱 설치 여러분의 생각은?
지난 달 대전의 한 초등학교에서 교사가 김하늘(8)양을 살해한 사건이 발생한 데 이어 정신질환을 가진 교사가 3세 아들을 살해하고 극단적인 선택을 하는 사건이 알려지면서 학부모들이 불안에 떨고 있다. 개학을 앞두고 불안한 학부모들은 아이의 휴대전화에 도청앱까지 설치하고 있다. 하지만 일부 교사들은 이 도청앱의 오남용으로 인한 교권침해 등을 우려하고 있다. 학생들의 휴대폰에 도청앱을 설치하는 것에 대한 여러분의 생각은 어떤가요?
오남용이 우려된다.
안전을 위한 설치는 불가피하다.
광고삭제
광고삭제
위로