클라우드 네이티브가 빠르게 확산되면서 컨테이너 OS 취약점 정보의 정확성에 대한 요구가 커졌습니다. 그러나 기존 크롤러는 각 OS 배포판이 제공하는 보안 권고안을 정확히 파싱하지 못해, 패치된 버전 정보가 누락되거나 부정확한 문제가 있었습니다.
"취약하다/아니다"만이 아니라 어느 버전에서 고쳐졌는지(패치 버전)가 정확해야 스캐너가 신뢰할 만한 판정을 내릴 수 있음
배포판마다 보안 데이터 제공 방식이 달라(API · OVAL · Security Tracker), 단일 파싱 방식으로는 정확도 확보가 어려움
2접근
12종 주요 컨테이너 OS(RedHat · Debian · Ubuntu 등)가 보안 데이터를 어떻게 제공하는지 심층 분석한 뒤, 소스 특성에 맞춰 크롤러를 수정·재개발했습니다.
① 소스 분석12종 OS의 제공 방식(API/OVAL/Tracker) 파악
→
② 파서 재설계소스별 특성에 맞춰 크롤러 수정·재개발
→
③ 패치버전 추출패치 버전 포함 정확한 데이터 수집
→
④ 신뢰도 검증스캐너 분석 결과 정확성 확인
대표 사례로 Ubuntu는 기존의 웹 페이지 파싱 방식에서 Git 리포지토리를 직접 클론해 파싱하는 방식으로 변경해, 데이터 신뢰도를 높였습니다.
다종 보안 소스API · OVAL · Security Tracker · Git
→
소스별 파서12종 OS 맞춤 수집기
→
정규화패치 버전 포함 취약점 데이터
→
취약점 스캐너신뢰도 높은 판정
3임팩트
정확성 향상 — 패치 버전을 포함한 취약점 데이터를 정확히 수집
최신성 향상 — 소스별 특성에 맞춘 수집으로 데이터 최신성 개선
스캐너 신뢰도 — 취약점 스캐너 분석 결과의 신뢰도에 기여
4역할
데이터 엔지니어로서 소스 분석 → 파서 재설계 → 패치 버전 추출 → 신뢰도 검증의 전 과정을 주도했습니다. 12종 OS의 서로 다른 보안 데이터 제공 방식을 각각 분석하고, 소스에 가장 맞는 수집 방식(예: Ubuntu의 Git 직접 클론 파싱)을 선택해 데이터 정확성과 신뢰도를 끌어올렸습니다.