사진=픽사베이
아마존의 클라우드 서비스 아마존웹서비스(AWS) 가 20일(현지시간) 발생한 대규모 서비스 장애를 약 3시간 만에 복구했다. 하지만 최근 글로벌 주요 플랫폼에서 연이어 접속 불안이 발생하면서, 클라우드 인프라의 안정성에 대한 우려가 커지고 있다.
AFP·블룸버그통신에 따르면 AWS는 이날 공지를 통해 한국시간 오후 7시 35분께 “대부분의 서비스가 정상적으로 운영되고 있다”고 발표했다. 다만 일부 사용자는 여전히 접속 지연을 호소하고 있는 것으로 전해졌다.
이번 장애는 미국 동부 지역 게이트웨이 오류에서 시작된 것으로 파악됐다. 이로 인해 아마존 프라임, 스냅챗, 듀오링고, 포트나이트, 퍼플렉시티 등 다수의 온라인 서비스가 일시 중단됐다. 또한 레딧, 훌루, 디즈니플러스, 시그널, 델타항공 등 글로벌 플랫폼도 장애 영향을 받았으며, 유럽에서는 일부 은행과 메신저 왓츠앱, 데이팅 앱 틴더에서도 접속 불안이 보고됐다.
국내에서도 이날 오후 4시경부터 AWS 기반 웹사이트와 앱의 접속이 원활하지 않았다는 신고가 이어졌다. AWS는 현재 전 세계 클라우드 시장의 약 3분의 1을 점유하고 있어, 단일 장애가 전 세계 서비스로 번질 가능성이 크다.
최근 이 같은 대형 서비스 장애는 반복되고 있다. 지난달에는 유튜브 서버 오류로 전 세계 사용자들이 접속 불가를 겪었고, 이달 초에는 마이크로소프트 애저(Azure) 일부 리전에서 네트워크 지연이 보고됐다.
전문가들은 디지털 전환 가속화로 클라우드 의존도가 급증하면서, 소수 사업자에 대한 집중 리스크가 커지고 있다고 지적한다. 네트워크 복잡성이 높아질수록 단일 설정 오류나 업데이트 충돌이 대규모 장애로 이어질 가능성이 높기 때문이다.
IT업계 관계자는 “이제는 ‘한 곳이 멈추면 모두 멈추는’ 구조가 됐다”며 “클라우드 사업자 간 분산 인프라 설계, 서비스 이중화, 백업 라인 확보가 필수적 과제가 됐다”고 말했다.