IT >

'뼈 아팠던 서비스 장애' 카카오, 시스템 영역별 다중화 이어간다

관련종목▶

개발자 컨퍼런스 '이프카카오' 내 '1015 회고' 기술 세션

인프라설비, 데이터, 운영 및 관리도구 등 5개 영역 구분

향후 다원화된 배터리실 마련, 운영 및 관리도구 다중화 진행

'뼈 아팠던 서비스 장애' 카카오, 시스템 영역별 다중화 이어간다
유용하 카카오 회원플랫폼사업실장이 8일 열린 개발자 컨퍼런스 '이프카카오 데브 2022' 행사 내 '1015 회고' 특별 기술 세션에서 데이터센터 다중화 조치에 대해 설명하고 있다. 카카오 제공

[파이낸셜뉴스] 카카오가 대규모 서비스 장애사고 재발 방지를 위해 전체 시스템 다중화를 약속한 가운데 보다 세부적인 내용을 공개했다. 시스템별로 레이어(층위)를 나눠 다중화를 추진하고 기술을 개선하겠다는 게 핵심이다.

8일 관련 업계에 따르면 카카오는 연례 개발자 컨퍼런스 '이프카카오 데브 2022(이프 카카오)' 행사 중 '1015 회고' 특별 기술 세션 5개를 마련하고 다중화 계획에 대해 설명했다.

카카오는 올해 기준 4개 주요 데이터센터를 이용하고 있다. 이번 화재가 발생한 판교 SK C&C데이터센터에 3만2000대의 서버가 있었고 중요한 역할을 하는 서버도 많이 몰려있었다. 그러나 서버 이중화 조치를 제대로 하지 않아 복구에 차질이 생겼다는 지적이 나왔고, 카카오는 전체 시스템 레이어에 다중화 체계를 구축한다고 발표했다.

서버 다중화는 각각의 레이어별로 진행될 예정이다. 카카오 서비스를 위한 시스템을 5개로 나눠 다중화 기술을 도입한다는 것. 카카오는 크게 △인프라 설비 △데이터 △운영 및 관리도구 △서비스 플랫폼 △애플리케이션(앱) 부문으로 레이어를 구분했다.

인프라설비 부문에서는 데이터센터(IDC)에 간격을 넓게 설정해 배터리실 공간을 확보해야 한다고 전했다. 한 배터리에 문제가 생기더라도 무정전전원장치(UPS)가 작동할 수 있는 구조도 필요하다. 이는 향후 카카오 자체 IDC 설계에 반영될 전망이다. 앞으로도 IDC에 문제가 생겼을 때 정보 및 데이터 손실이 없도록 데이터 레이어 부문의 다중화도 개선한다.

여러 레이어 중 핵심은 '운영 및 관리도구'다. 카카오는 '운영 및 관리도구' 레이어에서 IDC 다중화 구성이 완벽하지 못해 전체적인 서비스 복구 시간이 늦어졌다고 밝힌 바 있다.

운영 및 관리도구 레이어는 서비스 운영에 필요한 기술적 도구가 속한 부분이다.
사내 계정과 인증, 소스 관리나 앱 배포 도구, 위키, 지라 등의 협업 도구 등이 포함된다. 이러한 도구 중 일부 이중화가 돼 있지 않아 장애 초기에 개발자들이 복구할 시간이 지연된 만큼 다중화를 진행 중이라고 밝혔다.

유용하 카카오 회원플랫폼사업실장은 "모든 기술 발전은 실패 혹은 문제 발생에 대해 분석하는 것으로부터 시작한다"며 "카카오 개발자들은 장애 이후 많은 논의를 이어가며 문제에 대한 개선 사항이나 계획을 수립하고 있다"고 강조했다.

soup@fnnews.com 임수빈 기자