AWS 미 동부 리전 장애 대부분 복구…DNS 오류가 원인

13 hours ago 1

DNS 해석 문제서 시작돼 네트워크 로드밸런서까지 영향
AWS “모든 주요 서비스 정상화…일부는 백로그 처리 중”

[아이뉴스24 윤소진 기자] 아마존웹서비스(AWS)가 미 동부(US-EAST-1) 리전에서 발생한 대규모 장애를 대부분 복구했다.

AWS 로고. [사진=AWS]AWS 로고. [사진=AWS]

19일(현지시간) 밤 11시 49분부터 20일 오후 3시 1분까지 약 15시간 동안 AWS DynamoDB, EC2, Lambda, CloudWatch 등 주요 서비스가 지연과 오류를 겪었다.

AWS에 따르면 장애 원인은 데이터베이스 서비스 ‘DynamoDB’의 DNS(주소 변환 시스템) 오류였다. 이로 인해 EC2(가상서버) 내부의 인스턴스 실행 관리 시스템이 마비됐고, 이어 네트워크 로드밸런서(NLB)의 헬스체크 기능까지 영향을 받으면서 Lambda(자동 실행 서비스), CloudWatch(모니터링 서비스) 등으로 장애가 확산됐다.

AWS는 “DNS 문제를 오전 2시 24분에 해결한 뒤 단계적으로 복구를 진행했다”며 “오전 9시 38분 NLB 시스템이 복구된 이후 대부분의 네트워크 연결 문제가 해소됐다”고 밝혔다. 이어 “오후 3시 1분 기준 모든 주요 서비스가 정상화됐지만, AWS Config·Redshift·Connect 등 일부 서비스는 백로그(누적 작업) 처리 중”이라고 덧붙였다.

이번 장애는 AWS의 핵심 리전인 미 동부 지역에서 발생해, 이를 기반으로 작동하는 글로벌 서비스(IAM, DynamoDB 글로벌 테이블 등)에도 일시적인 지연이 발생했다. AWS는 “사건 원인과 복구 과정을 정리한 사후 분석 보고서(Post-Event Summary)를 곧 공개할 예정”이라고 밝혔다.

/윤소진 기자(sojin@inews24.com)








포토뉴스



Read Entire Article