현재 프로젝트에서는 관제서버의 다양한 메트릭 데이터를 조회하기 위해서 시계열 데이터 베이스인 Prometheus를 사용하고 있었다. 점차 프로젝트를 SaaS Service로 전환하기 위해 모든 모듈과 서비스의 Scale out 구조를 고민하고 있는데 기존에 Prometheus는 Scale out 구조가 감안되지 않았기 때문에 Scale out 할 수가 없었고, 그로 인해 우리는 Cortex 라는 오픈소스를 도입하게 되었다. 이에 알람을 울려주는 Alertmanager도 다시 연동하게 되었고, 연동하면서 겪었던 어려움들과 이슈들을 어떻게 대응했지는 정리해보고자 한다. (다시 생각하면 정말 끔찍했다.) Work Flow Cortex Alertmanager가 알람을 등록하고 알람이 울려 Client에게 울리기..