← 기술 목록으로

OS 패키지 취약점 수집 멀티 배포판 개편 + OSV 자동화

Alpine·RHEL·Debian·Ubuntu 등 주요 리눅스 배포판별 패키지 취약점 수집을 전면 재설계하고, OSV 공개 취약점 데이터 수집을 자동화

기간2025
소속래브라도랩스(LabradorLabs) · 데이터파트
역할데이터 엔지니어 · 수집 파이프라인 개편 주도
OSV (osv.dev)AlpineRHELDebianUbuntuVulnerability DataData Pipeline

1배경

OS 패키지 취약점 데이터는 배포판마다 보안 권고(advisory)의 출처·포맷·식별 체계가 모두 달라, 한 가지 방식으로 수집하면 누락·오탐·갱신 지연이 발생합니다. 기존 수집 방식은 배포판별 차이를 충분히 반영하지 못해 정확성·커버리지·최신성에 한계가 있었습니다.

2접근

배포판별 수집기를 각각 전면 개편하는 연쇄 작업으로 진행하고, 이를 OSV 자동 수집 파이프라인으로 묶어 일관된 데이터 흐름을 만들었습니다.

① 배포판별 개편Alpine·RHEL·Debian·Ubuntu 수집기를 각각 재설계
② OSV 자동화osv.dev 공개 데이터 자동 수집 파이프라인 구축
③ 정규화배포판 간 식별·포맷 차이를 통합 표현으로 정리
④ 검증커버리지·정확성 확인 후 정기 갱신 체계화

핵심은 "하나의 수집기로 모든 배포판을 처리"가 아니라, 배포판별 특성을 살린 개별 개편OSV 자동화를 결합해 정확성과 자동화를 동시에 끌어올린 것입니다.

3데이터 흐름

Alpine advisory

Per-distro collectors (redesigned)

RHEL advisory

Debian advisory

Ubuntu advisory

OSV auto-collection (osv.dev)

Normalize and unify (identifier / format)

Coverage and accuracy check

Vulnerability dataset

4임팩트

정확성 향상 — 배포판별 특성을 반영해 누락·오탐을 줄임
자동화 — OSV 공개 데이터 수집을 자동화해 갱신 지연 해소
커버리지 확대 — 멀티 배포판을 일관된 체계로 포괄

5역할

데이터 엔지니어로서 배포판별 수집기 개편 → OSV 자동 수집 파이프라인 구축 → 정규화·검증을 주도했습니다. 배포판마다 다른 취약점 권고 체계를 각각 분석해 개별 개편하는 연쇄 작업을 이끌고, 이를 자동화된 데이터 흐름으로 묶어 멀티 배포판 OS 패키지 취약점 데이터의 정확성·자동화·커버리지를 함께 끌어올렸습니다.

보안 데이터 파이프라인 영역의 다른 작업은 별도 항목으로 정리.