← 기술 목록으로

BTS 모니터링 시스템 v2 구축

고객사 on-premise 동기화 상태를 중앙에서 관측하는 Grafana 기반 관측 체계를 재설계·구축

기간2026 (~04 v2.0.0)
소속래브라도랩스(LabradorLabs) · 데이터파트
역할데이터파트 파트리더
GrafanaMySQLnginxMonitoringDashboardAlerting

1배경

바이너리 로그 전송 시스템(BTS)은 운영 데이터를 다수 고객사 on-premise 환경까지 동기화하는 핵심 경로입니다. 그러나 기존 모니터링으로는 고객사별 동기화 상태를 중앙에서 한눈에 관측하기 어려웠습니다.

2구조

BTS 서버
nginx / MySQL

통계 수집
수집 파이프라인

통계 테이블
집계 저장

Grafana
대시보드 + 알람

수집 현황

고객사 현황

에러 모니터링

DB 용량

BTS 서버(nginx/MySQL)에서 통계를 수집해 통계 테이블에 적재하고, 이를 Grafana 대시보드로 시각화하며 임계치 기반 알람을 연동했습니다.

3대시보드 구성

수집 현황인스턴스별 binlog 현황, 도메인별 로그 수집 상태
고객사 현황업데이트 현황, API 버전 분포
에러 모니터링고객사별 에러 요약, 최근 24시간 상세
DB 용량일별 용량 추이

네 영역을 단일 관측 체계로 묶어, 수집·고객사·에러·용량을 하나의 흐름에서 추적할 수 있도록 구성했습니다.

4임팩트

가시성 확보 — 분산된 고객사 환경의 동기화 상태를 중앙에서 관측
선제 대응 — 에러·용량 추이를 사전에 감지해 선제적 장애 대응이 가능
관측 체계화 — 수집·고객사·에러·용량을 단일 대시보드로 표준화

5역할

데이터파트 파트리더로서 기존 모니터링의 한계 제기부터 v2 재설계 → 대시보드 구축 → 알람 연동 → 산출물 문서화까지 주도했습니다. v2 설계서·아키텍처·구축 런북·신규 고객사 등록 가이드를 함께 정리해 운영·확장 가능한 관측 체계를 확립했습니다.

고객사 on-premise 동기화 경로는 별도의 DB 업그레이드·복제 항목과도 맞닿아 있습니다.