세계 최대 클라우드 서비스 제공업체인 아마존의 AWS에서 발생한 대규모 장애가 글로벌 비즈니스에 큰 영향을 미친 가운데, 아마존은 20일(현지 시각) 모든 서비스가 정상화되었다고 발표했다.
스냅챗, 레딧 등 웹에서 가장 인기 있는 수천 개의 사이트와 앱에서 전 세계적인 혼란을 야기했던 인터넷 장애가 발생했다.
21일 로이터 통신에 따르면 아마존은 일부 AWS 서비스에 메시지 처리 백로그가 발생하여 해소하는 데 몇 시간이 걸릴 것이라고 덧붙였다.
▲ 전 세계 비즈니스와 일상생활에 미친 광범위한 영향
AWS는 전 세계 기업들의 애플리케이션과 컴퓨터 프로세스를 호스팅하는데, 이번 장애는 런던에서 도쿄에 이르는 근로자들의 업무를 마비시켰으며, 미용사에게 돈을 지불하거나 항공권 변경과 같은 일상적인 작업을 수행하지 못하게 했다.
20일 오후에는 디지털 지갑 벤모(Venmo)와 화상 통화 사이트 줌(Zoom) 등의 서비스 이용에 지속적인 어려움을 호소하는 사용자들의 불만이 이어졌다.
이번 사태는 지난해 병원, 은행, 공항의 기술 시스템을 마비시켰던 크라우드스트라이크(CrowdStrike) 오작동 이후 가장 큰 규모의 인터넷 중단 사태로, 세계 상호 연결된 기술의 취약성을 부각시킨다.
▲ 잦은 문제가 발생하는 AWS의 US-EAST-1 데이터 센터
이번 문제는 AWS의 북부 버지니아 클러스터, 일명 US-EAST-1에서 비롯되었으며, 지난 5년 동안 주요 인터넷 마비를 초래한 것이 이번이 최소 세 번째다.
아마존은 해당 특정 데이터 센터가 계속해서 영향을 받는 이유에 대한 추가적인 설명을 요청하는 질문에는 응답하지 않았다.
문제는 DNS(Domain Name System)라고 알려진 것에서 발생했다.
이로 인해 애플리케이션들이 사용자 정보 및 기타 중요 데이터를 저장하는 데 의존하는 클라우드 데이터베이스인 AWS의 다이나모DB API의 정확한 주소를 찾지 못하게 된 것이다.
앞서 AWS는 이번 장애의 근본 원인이 여러 서버에 트래픽을 분산하는 데 사용되는 네트워크 로드 밸런서의 상태를 모니터링하는 기본 서브시스템이었다고 밝혔다.
이 문제는 AWS 내에서 온디맨드 클라우드 용량을 제공하는 아마존의 EC2 서비스인 EC2 내부 네트워크에서 시작되었다고 AWS는 설명했다.
▲ 개발자의 '내결함성' 구축 필요성 대두
코넬대 컴퓨터공학과 켄 버만 교수는 “개발자들은 장애에 대비한 내결함성을 더 강화해야 한다”고 지적했다.
그는 AWS가 개발자들이 방대한 데이터 센터 네트워크 중 한 곳에서 문제가 발생할 경우 스스로를 보호하는 데 사용할 수 있는 도구를 제공하며, 다른 클라우드 제공업체를 통한 백업 생성도 가능하다고 말한다.
버만 교수는 로이터 통신과의 인터뷰에서 "사람들이 비용을 절감하고 지름길을 택하여 애플리케이션을 구동하려고 할 때, 마지막 단계를 건너뛰어 장애에 대비하지 않았다는 사실을 잊어버리면, 그러한 회사들이 나중에 정말로 정밀 조사를 받아야 할 곳"이라고 강조했다.
▲ 취약한 인프라와 소수 클라우드 의존성 심화
이번 문제는 일상적인 디지털 서비스가 얼마나 상호 연결되어 있으며, 소수의 글로벌 클라우드 제공업체에 의존하고 있는지를 다시 한번 보여주며, 작은 결함 하나가 비즈니스와 일상생활에 큰 혼란을 일으킬 수 있음을 시사한다고 전문가와 학계는 분석한다.
글로벌 보안업체 ESET의 제이크 무어 연구원은 “우리 사회가 상대적으로 취약한 인프라에 과도하게 의존하고 있다는 사실을 드러낸 사건”이라고 평가했다.
영국에서는 로이드은행, 스코틀랜드은행, 보더폰, BT 등 통신사뿐 아니라 국세청(HMRC) 시스템까지 일시적으로 중단됐다.
서리대 니샨트 사스트리 교수는 “대기업 대부분이 단일 클라우드 서비스에 의존한 결과”라며 구조적 위험성을 지적했다.
인터넷 성능 분석업체 우클라(Ookla)는 이번 장애로 전 세계적으로 약 400만 건 이상의 사용자 신고가 접수됐다고 밝혔다.
보험중개사 맥길앤파트너스의 라이언 그리핀 분석가는 “대형 기업들의 클라우드 다운타임 몇 시간은 수백만 달러의 생산성과 매출 손실로 직결된다”라고 설명했다.
다만 월가의 반응은 차분했다. 이날 나스닥 시장에서 아마존 주가는 오히려 1.6% 상승하며 216.48달러에 마감했다.
▲ 스냅챗부터 벤모까지, 다양한 앱 서비스 마비
우클라는 이번 장애로 최소 천 개의 회사가 영향을 받았다고 밝혔다.
레딧, 로블록스(Roblox), 스냅챗, 듀오링고(Duolingo) 등 주요 앱과 함께 암호화폐 거래소 코인베이스, 주식거래앱 로빈후드(Robinhood), 인공지능 스타트업 퍼플렉서티(Perplexity)도 AWS 문제로 플랫폼 운영이 중단됐다.
아마존의 자체 서비스인 온라인 쇼핑몰, 프라임비디오, 음성비서 알렉사도 예외가 아니었다.
게임 플랫폼 포트나이트, 클래시로얄, 클래시오브클랜, 차량호출 서비스 리프트까지도 연결이 끊겼다.
메시징 앱 시그널 역시 영향을 받았으며, 인터넷 플랫폼 X(전 트위터)의 일론 머스크는 “자사 서비스는 정상 작동했다”라고 밝혔다.







![[금융진단] 미 증시, 지정학 완화·빅테크 반등에 상승](https://images.jkn.co.kr/data/images/full/982892/image.jpg?w=288&h=168&l=50&t=40)

