← 기술 목록으로

컨테이너 OS 취약점 수집 정확도 고도화

12종 주요 컨테이너 OS의 보안 권고안을 소스 특성에 맞게 파싱해, 패치 버전까지 정확히 담은 취약점 데이터를 수집

기간2022
소속래브라도랩스(LabradorLabs) · 데이터파트
역할데이터 엔지니어 · 수집 정확도 고도화 주도
VulnerabilityContainer OSOVALSecurity TrackerCrawlerData Pipeline

1배경

클라우드 네이티브가 빠르게 확산되면서 컨테이너 OS 취약점 정보의 정확성에 대한 요구가 커졌습니다. 그러나 기존 크롤러는 각 OS 배포판이 제공하는 보안 권고안을 정확히 파싱하지 못해, 패치된 버전 정보가 누락되거나 부정확한 문제가 있었습니다.

2접근

12종 주요 컨테이너 OS(RedHat · Debian · Ubuntu 등)가 보안 데이터를 어떻게 제공하는지 심층 분석한 뒤, 소스 특성에 맞춰 크롤러를 수정·재개발했습니다.

① 소스 분석12종 OS의 제공 방식(API/OVAL/Tracker) 파악
② 파서 재설계소스별 특성에 맞춰 크롤러 수정·재개발
③ 패치버전 추출패치 버전 포함 정확한 데이터 수집
④ 신뢰도 검증스캐너 분석 결과 정확성 확인

대표 사례로 Ubuntu는 기존의 웹 페이지 파싱 방식에서 Git 리포지토리를 직접 클론해 파싱하는 방식으로 변경해, 데이터 신뢰도를 높였습니다.

다종 보안 소스API · OVAL · Security Tracker · Git
소스별 파서12종 OS 맞춤 수집기
정규화패치 버전 포함 취약점 데이터
취약점 스캐너신뢰도 높은 판정

3임팩트

정확성 향상 — 패치 버전을 포함한 취약점 데이터를 정확히 수집
최신성 향상 — 소스별 특성에 맞춘 수집으로 데이터 최신성 개선
스캐너 신뢰도 — 취약점 스캐너 분석 결과의 신뢰도에 기여

4역할

데이터 엔지니어로서 소스 분석 → 파서 재설계 → 패치 버전 추출 → 신뢰도 검증의 전 과정을 주도했습니다. 12종 OS의 서로 다른 보안 데이터 제공 방식을 각각 분석하고, 소스에 가장 맞는 수집 방식(예: Ubuntu의 Git 직접 클론 파싱)을 선택해 데이터 정확성과 신뢰도를 끌어올렸습니다.

데이터 수집 파이프라인의 정확도·신뢰도 개선에 초점을 둔 작업.