KT ‘어이없는 대란’… 명령어 누락 ‘인재’에 전국 멈췄다
먹통 89분의 전말, 알고 보니
지난달 25일 발생한 KT의 ‘부산발 네트워크 장애’가 설비 교체 중 벌어진 어처구니없는 실수 탓으로 확인된 가운데, KT의 보안 역량과 외부 대응에도 심각한 문제가 있었던 것으로 지적됐다. 사고 당일 오전 11시 16분부터 낮 12시 45분까지 89분간 전국에서 발생한 KT 인터넷 장애의 시작은 관리자 없이 협력업체 직원들끼리 진행한 라우팅(네트워크 경로 설정) 작업에서 발생한 명령어 '엑시트(exit)' 누락 오류 때문이었다. 특히 KT는 잘못된 데이터 전달에 대한 안전장치가 없어 부산에서 발생한 데이터 오류가 전국으로 확산되는 빌미를 제공한 것으로 드러났다.
31일 과학기술정보통신부의 조사결과에 따르면, KT가 장애를 최초로 인지한 시점은 25일 오전 11시 20분이었다. 통신재난의 불씨가 된 부산 지역 라우팅 사고 발생 시점으로부터 따지면 4분 후였다.
설비 교체 중에 벌어진 실수
협력업체 직원이 명령어 빼먹어
안전장치 없어 부산→전국 확산
KT, 24분간 장애 원인 ‘헛다리’
골든타임 놓치고 엉터리 대응
KT는 초기에 디도스(DDoS·분산 서비스 거부) 공격을 원인으로 추정하고, 장애 인지 20분 후인 11시 40분 과기정통부에 사이버 공격 신고를 했다. 실제 장애 원인이 라우팅(네트워크 경로설정) 오류였음을 파악하고 과기정통부에 다시 알린 것은 그로부터 4분이 더 지난 11시 44분이었다.
결국 KT는 장애 인지 후에도 정확한 원인을 파악하기까지 24분간 엉뚱한 대응을 하는 바람에 소중한 ‘골든타임’을 놓쳐 버린 셈이다. 이 같은 KT의 오판 탓에 경찰이 사이버 테러 여부를 확인하기 위해 경기도 성남시 분당구의 KT 본사에 출동하는 등 혼란이 가중됐다. KT 새노조는 “디도스 대응 상품을 판매하기까지 하는 KT가 인터넷 장애 원인이 디도스 때문인지도 정확히 구별하지 못했다”고 비판했다.
KT의 오판과 대응이 너무나 비상식적이었던 탓에, KT가 헛다리를 짚고 있었음을 24분간 몰랐다는 게 과연 사실이냐는 의문을 제기하는 전문가도 있다. 엔지니어는 디도스 여부를 충분히 구별하고 판단할 능력이 있기 때문에 만약 진짜 몰랐다면 자만한 결과였을 수 있다는 것이다.
정부 조사에서도 이번 장애 당시 외부 공격을 막는 방화벽이 전혀 작동하지 않은 것으로 파악되는 등 KT가 사태 초기에 왜 디도스 공격이라고 의심했는지 의문이 가는 정황이 나왔다. 게다가 이번 조사에서 KT가 오전 11시 44분 과기정통부에 라우팅 오류라고 알린 사실이 확인되면서, ‘대규모 디도스 공격’이 있었다고 한 낮 12시 2분 KT의 1차 공지는 명백히 엉터리였던 것으로 드러났다.
홍진배 과기정통부 정보보호네트워크정책관은 “조사 과정에서 경찰 및 전문가 등과 함께 KT가 실제로 오인한 상황을 확인했다”며 “KT도 초기 정확한 분석을 하지 않고 트래픽 급증에만 집중하다가 오판을 했다고 인정했다”고 말했다.
앞서 과기정통부는 지난달 29일 발표한 ‘KT 네트워크 장애 원인 분석 결과’에서 “(KT)부산국사에서 기업 망 라우터 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고, 이후 라우팅 오류로 인해 전국적인 인터넷 네트워크 장애가 발생한 것”이라고 밝혔다. 과기정통부는 이번 통신장애와 관련, KT의 관리적·기술적 문제점이 있었다고 지적하고 ‘네트워크 안정성 확보 방안’을 마련하겠다고 밝혔다.
KT는 이번 사태에 대해 “전적으로 책임을 통감한다”면서도, 네트워크 작업이 당초 승인시간이었던 새벽 1~6시가 아닌 낮 시간대에 진행된 점에 대해서는 “일탈이 이루어진 예외적인 사례”라며 재발 방지 대책을 수립 중이라고 밝혔다.
송현수 기자 songh@busan.com