5장. 지표 모니터링 및 경보 시스템
1단계: 설계 범위1. 개략적 요구사항대규모 인프라를 모니터링일간 활성 사용자수(DAU, Daily Active Users)는 1억 명서버 풀 1,000개, 풀당 서버 수 100개.데이터 보관 기간 1년수집한 데이터를 보관하는 기간은 일주일, 그 뒤에는 1분 단위 데이터로 변환 후에 30일간 보관, 그 뒤에는 1시간 단위 데이터로 변환한 뒤에 1년간 보관모니터링할 지표CPU 사용률요청 수메모리 사용량메세지 큐 내의 메세지 수2. 비기능 요구사항규모 확장성: 늘어나는 지표 수와 경보의 양에 맞게 확장될 수 있어야 한다.낮은 응답 지연:대시보드와 경보를 신속하게 처리할 수 있도록, 질의에 대한 낮은 응답 지연 보장안정성: 높은 안정성을 제공하여 중요 경보를 놓치지 않도록 해야 한다.유연성: 기술은 계속 변화..