← 기술 목록으로

OS 패키지 취약점 수집 정확도 고도화

12종 주요 OS 배포판의 보안 권고안을 소스 특성에 맞게 파싱해, 패치 버전까지 정확히 담은 취약점 데이터를 수집

기간2022

소속래브라도랩스(LabradorLabs)

역할데이터 엔지니어 · 수집 정확도 고도화 주도

VulnerabilityOS PackageOVALSecurity TrackerCrawlerData Pipeline

0작업자의 메모

OS 취약점 데이터는 CVE ID만 맞아도 되는 문제가 아닙니다. 실제 고객사 검증에서는 어떤 패키지 버전이 패치됐는지까지 맞아야 합니다.

12종 배포판의 API, OVAL, Security Tracker를 따로 다룬 이유는 그 정확도를 확보하기 위해서였습니다. 이 작업은 데이터 수집이라기보다 오탐을 줄이는 기반 작업이었습니다.

1배경

클라우드 네이티브가 빠르게 확산되면서 OS 패키지 취약점 정보의 정확성 요구가 커졌습니다. 그러나 기존 크롤러는 각 OS 배포판이 제공하는 보안 권고안을 정확히 파싱하지 못해 패치된 버전 정보가 누락되거나 부정확한 문제가 있었습니다.

"취약하다/아니다"만이 아니라 어느 버전에서 고쳐졌는지(패치 버전)가 정확해야 스캐너가 신뢰할 만한 판정을 내릴 수 있음
배포판마다 보안 데이터 제공 방식이 달라(API · OVAL · Security Tracker), 단일 파싱 방식으로는 정확도 확보가 어려움

2접근

12종 주요 OS 배포판(RedHat · Debian · Ubuntu 등)이 보안 데이터를 어떻게 제공하는지 심층 분석한 뒤, 소스 특성에 맞춰 크롤러를 수정·재개발했습니다.

① 소스 분석12종 OS의 제공 방식(API/OVAL/Tracker) 파악

→

② 파서 재설계소스별 특성에 맞춰 크롤러 수정·재개발

→

③ 패치버전 추출패치 버전 포함 정확한 데이터 수집

→

④ 신뢰도 검증스캐너 분석 결과 정확성 확인

대표 사례로 Ubuntu는 기존의 웹 페이지 파싱 방식에서 Git 리포지토리를 직접 클론해 파싱하는 방식으로 변경해 데이터 신뢰도를 높였습니다.

다종 보안 소스API · OVAL · Security Tracker · Git

→

소스별 파서12종 OS 맞춤 수집기

→

정규화패치 버전 포함 취약점 데이터

→

취약점 스캐너신뢰도 높은 판정

3임팩트

정확성 향상 — 패치 버전을 포함한 취약점 데이터를 정확히 수집

최신성 향상 — 소스별 특성에 맞춘 수집으로 데이터 최신성 개선

스캐너 신뢰도 — 취약점 스캐너 분석 결과의 신뢰도에 기여

4역할

데이터 엔지니어로서 소스 분석 → 파서 재설계 → 패치 버전 추출 → 신뢰도 검증의 전 과정을 단독으로 수행했습니다. 12종 OS의 서로 다른 보안 데이터 제공 방식을 각각 분석하고 소스에 가장 맞는 수집 방식(예: Ubuntu의 Git 직접 클론 파싱)을 선택해 데이터 정확성과 신뢰도를 끌어올렸습니다.

데이터 수집 파이프라인의 정확도·신뢰도 개선에 초점을 둔 작업.

🛡 OS 패키지 취약점 수집 시리즈 ① — ② 멀티 배포판 개편·OSV 자동화