최대 1 분 소요

신경 쓰지 않고 내버려두었던 AWS Lightsail에 구축해놓은 홈페이지 서버가 갑자기 마비가 되어버렸다. 접속이 아예 안되는 것은 아닌데 무지무지하게 느려졌다. SSH로 접속해보니 CPU가 100%인 상황.

CPU를 모두 사용하고 있는건 php-fpm이었다. 그런데 이상한건 접속자가 없는 상황에서도 php-fpm이 계속 CPU 점유율 100%를 쓰고 있었고 nginx를 꺼버렸는데도 계속 100%였다.

뭔가 이상한 상황. 서버를 재부팅해도 해결되지 않았고 인스턴스 자체를 restart해도 해결되지 않았다.

구글에 검색하다보니 다음의 문서를 발견했다.

나와 동일한 케이스였는데 이 링크에서 설명한대로 Lightsail 콘솔에 들어가서 아예 stop하고 잠시 기다렸다가 start해주니 모든 것이 정상화되었다.

이유도 알 수 없어서 조금 찝찝하지만 어쨌튼 완전히 종료하고 시작하는 것이 해결책이었다. 클라우드 환경에서는 이렇게 알 수 없는 문제들이 종종 생겨나고 단순히 인스턴스를 완전히 종료하고 재시작하는 것만으로 해결되는 경우가 종종 생겨나는 것 같다.

2021년 4월 19일 추가

위 재부팅만으로는 현상이 해결되지 않았다. 원인을 찾지 못한 채 약 일주일이 흘렀고, 어느 날 갑자기 상태가 정상으로 돌아왔다. AWS 측의 문제였던 것으로 보이며, AWS에서 해당 문제가 해결되면서 CPU 점유율도 자연히 정상화된 것으로 추정된다.

댓글 남기기