기술 포트폴리오

2026래브라도랩스바이너리 로그 동기화 ⑤

파일 기반 배치형 CDC와 멱등 UPSERT

mysqlbinlog 통째 리플레이의 All-or-Nothing 한계를, binlog 이벤트를 직접 파싱해 UPSERT로 적용하는 Go 기반 CDC로 바꿔 재시도해도 깨지지 않게 만든 재설계. 파일당 처리 속도 평균 2.5배(최대 5배).

GoCDCUPSERTBinary Log

상세 보기 →

2026래브라도랩스바이너리 로그 동기화 ③

바이너리 로그 기반 데이터 동기화 암호화 전환

고객사로 나가는 binlog 경로를 난독화 수준에서 멈추지 않고 AES-256-GCM 기반 암호화와 다운로드 상태 관측까지 갖춘 구조로 전환.

암호화Binary Log보안

상세 보기 →

2026래브라도랩스데이터 플랫폼 재구축 ①

RAW 보존·재파싱 구조로 바꾼 ETL 수집 플로우

RAW 원본을 먼저 보존하고, 파싱 버그를 고친 뒤 외부 API 재호출 없이 변환만 다시 실행하도록 바꾼 수집 플로우.

ETLSeaweedFS스토리지

상세 보기 →

2026래브라도랩스데이터 플랫폼 재구축 ②

오픈소스 RAW 데이터 오브젝트 스토리지 구축 (SeaweedFS)

외부 원천이 사라져도 데이터를 다시 만들 수 있도록 메타·바이너리·Git 원본을 보존하는 자체 RAW 데이터 저장 기반을 설계.

SeaweedFSZFSForgejo

상세 보기 →

2026래브라도랩스

이슈와 문서를 1:1로 연결한 팀 운영 규칙

이슈와 중앙 문서에 같은 17종 업무 유형을 표시하고, 작업마다 같은 이름의 문서를 1:1로 연결한 팀 운영 규칙.

이슈 관리문서 관리17종 업무 유형

상세 보기 →

2024–26래브라도랩스

K8s · Airflow 데이터 수집 플랫폼 운영 & 장애 대응

80개가 넘는 크롤러의 스케줄, rate limit, 자원과 네트워크를 Airflow/Kubernetes 공통 실행 환경에서 관리한 기록.

KubernetesAirflowSRE

상세 보기 →

2026래브라도랩스

크롤러 DB 부하를 줄인 DML Broker 설계

80개+ 크롤러의 DB 직접 연결을 bounded queue와 connection pool을 둔 공통 Broker로 바꿔 lock·connection 오류를 하루 3~4건에서 0건으로 줄인 작업.

DML BrokerConnection PoolKubernetes

상세 보기 →

2024–25래브라도랩스

Linux 서버 계정·접근 설정 자동화

IDC·In-house 서버 12대의 개인 ID, SSH key와 공용 디렉터리 권한을 공통 스크립트와 적용 목록으로 정리해 신규 입사자 온보딩과 작업 추적을 단순화.

LinuxShell ScriptSSH

상세 보기 →

2026래브라도랩스바이너리 로그 동기화 ④

Grafana 기반 고객사 동기화 상태 모니터링 구축

물리 서버 5대에 흩어진 on-premise 동기화 상태를 Vector, TimescaleDB, Grafana, Slack/Jira 알림으로 한 화면에서 보이게 만든 작업.

Grafana모니터링알람

상세 보기 →

2024–26래브라도랩스

AWS → IDC/In-house 인프라 이전 & 비용 절감

AWS 비용을 줄이려 범용 PC(M.2)로 옮긴 DB가 월 10~20건씩 멈추던 문제를 스케줄 분산으로 5건 미만까지 낮추고, IDC 이전으로 전환(2024) 후 1~2건까지 줄인 단계적 전환.

AWS→IDC비용 절감인프라 이전

상세 보기 →

2026래브라도랩스

K8s 하이브리드 클러스터 확장 (IDC + In-house)

IDC 2대에서 자원 쏠림으로 주 70~100건 발생하던 Pod 할당 실패를, In-house 4대를 WireGuard로 붙여 1~5건 미만으로 줄인 확장 작업.

KubernetesWireGuardNAT

상세 보기 →

2021–26래브라도랩스

이슈 트래킹 & 장애 추적 체계

1,000건 넘는 작업과 장애를 그냥 처리하지 않고 유형, RCA, 완료 흐름으로 남겨 팀이 다시 같은 문제를 추적할 수 있게 만든 운영 체계.

이슈 관리장애 추적RCA

상세 보기 →

2024–26래브라도랩스

on-premise 데이터 동기화 배포 시나리오 & 최종 기술지원

고객사별 보안 조건에 맞춘 배포 시나리오를 설계·리뷰하고, 기술지원팀 운영에서 접수된 깊은 동기화 이슈를 개선한 기록.

on-premiseBinary Log기술지원

상세 보기 →

2026래브라도랩스

CI/CD 개발 완료 루틴 Bootstrap Kit

repo마다 갈라지던 개발 완료 흐름을 중앙 bootstrap kit로 묶고, Jira 브랜치·Bitbucket branch pipeline·Claude 리뷰·Slack 알림·Docker image push까지 같은 루틴으로 적용한 작업.

Bitbucket PipelinesClaude PR ReviewJira/Slack

상세 보기 →

2026래브라도랩스라이브러리 크롤러 ③

12개 라이브러리 크롤러 누락 점검과 Python 전환

레지스트리 원본과 DB를 직접 맞춰 누락을 찾고, Java/Maven 크롤러를 Python으로 옮기며 재시도·백필 경로를 손본 작업.

Go·Javatransformer크롤러

상세 보기 →

2026래브라도랩스

악성 패키지 정보 수집·분석

CVE만 보는 수집에서 벗어나 typosquatting, dependency confusion, 계정 탈취형 악성 패키지까지 제품 데이터 범위로 끌어온 보안 데이터 작업.

악성 패키지OpenSSF보안

상세 보기 →

2026래브라도랩스

라이브러리 컴포넌트 테이블 재설계 (DB 부하 개선)

CPU 부하를 슬로우 쿼리와 실행계획으로 따라가 collation 불일치 뷰 조인(약 130만 건 스캔)을 찾아내고, 식별자·인덱스·정합성까지 고친 DB 설계 개선.

MySQL실행계획스키마 재설계

상세 보기 →

2026래브라도랩스

수십억 행 실측으로 검증한 DB 엔진 비교

4개 인스턴스를 read-only 실측해 파티셔닝 0건과 인덱스 701GB>데이터 178GB의 원인(복합 PK 동봉)을 확인하고, 라이선스 요구에 맞춰 MySQL·MariaDB·PostgreSQL 전환 경로와 비용을 정리한 검토.

MySQLPostgreSQL파티셔닝

상세 보기 →

2026래브라도랩스

사내 git 포지(Forgejo) 서버 재구성 설계

HA를 흉내 내는 대신 독립 2포지(팀 샤딩)를 택하고, RAID10 유력·RAID5/ZFS 기각 사유와 원본 전용 백업 정책까지 별점 비교로 문서화한 설계.

ForgejoRAID백업/DR

상세 보기 →

2024–26래브라도랩스

취약점 검증 & 고객사 검증 대응

수집 결과를 그대로 믿지 않고 고객사 OS 이미지, 커널 유발 취약점, 오탐·미탐 케이스를 근거 있는 보고서로 다시 검증한 작업.

취약점 검증오탐·미탐보고서

상세 보기 →

2025래브라도랩스

DB 인덱스 최적화 & 용량 53% 절감

크롤러·분석 엔진이 실제 실행하는 쿼리를 전수 조사해 인덱스 사용 여부를 확인한 뒤, 수집 DB 9.6TB→4TB, 배포용 DB 2.6TB→1.2TB로 줄인 과정.

MySQL인덱스 튜닝성능

상세 보기 →

2025래브라도랩스라이선스 데이터 ③

라이선스 원문을 보존하는 LLM 분류 파이프라인

라이선스 원문을 먼저 보존하고 LLM의 분류 결과와 판단 근거를 단일 운영 데이터셋에 남긴 파이프라인.

AI/LLMPython라이선스

상세 보기 →

2025래브라도랩스OS 패키지 취약점 ②

OS 패키지 취약점 수집 멀티 배포판 개편 + OSV 자동화

배포판마다 다른 보안 권고안 형식을 한 방식으로 억지 통합하지 않고 Alpine·RHEL·Debian·Ubuntu별 특성에 맞춰 수집기를 다시 잡은 작업.

PythonOSVOS 패키지 취약점

상세 보기 →

2025래브라도랩스바이너리 로그 동기화 ②

바이너리 로그 기반 데이터 동기화 모니터링 & 로그 수집기

고객사가 먼저 장애를 알려주기 전에 중앙에서 상태를 볼 수 있도록 on-premise 동기화 모듈의 로그 포맷과 수집 API를 정리한 작업.

모니터링API

상세 보기 →

2024–25래브라도랩스

Grafana 기반 사내 데이터·DB 모니터링 구축

DB 안에만 있던 운영 지표를 크롤러, 백업, CI/CD, 고객사 동기화 상태와 함께 Grafana에서 볼 수 있게 만든 관측 기반.

Grafana모니터링알람

상세 보기 →

2024–25래브라도랩스

수집 원천·서비스 배포용·on-premise DB 백업 자동화

백업 파일을 만드는 것에서 멈추지 않고 공지, 중지, 체크섬, 분할 압축, NAS 이동, 검증까지 복구 가능한 절차로 묶은 작업.

백업 자동화NASMySQL

상세 보기 →

2024–25래브라도랩스

서비스 배포용 DB 변경 관리 정책 수립

긴급 DDL이 사람 기억에 기대지 않도록 요청, 승인, 실행, 반영, 전파, 형상 검증으로 배포 DB 변경 흐름을 다시 세운 정책 작업.

DDL 거버넌스일관성MySQL

상세 보기 →

2024래브라도랩스

MySQL 8.0 → 8.4 LTS 무중단 업그레이드

운영 DB와 고객사 on-premise까지 연결된 MySQL을 중단 없이 올리기 위해 인스턴스별 검증과 rollout 순서를 설계한 업그레이드.

MySQL 8.4 LTSReplicationBinary LogAWS/IDC

상세 보기 →

2024래브라도랩스바이너리 로그 동기화 ①

바이너리 로그 스크램블링

고객사로 전달되는 변경 로그가 평문처럼 노출되지 않도록 동기화 경로에 먼저 보호 장치를 넣은 보안 개선의 초기 단계.

Binary LogReplication스크램블링

상세 보기 →

2024래브라도랩스

DB 아키텍처 리엔지니어링 — 인스턴스 분리

모든 데이터가 한 DB에 섞여 장애와 확장의 경계가 흐려진 상태를 데이터 성격별 인스턴스와 복제 구조로 다시 나눈 재설계.

DB 아키텍처MySQLReplication

상세 보기 →

2023래브라도랩스

파일/함수 취약점 수집 파이프라인 재설계

한 프로세스에 몰려 있던 취약점 수집을 단계별로 분리하고 스키마를 정규화해 실패 지점과 재처리 범위를 명확히 만든 개편.

Python아키텍처보안

상세 보기 →

2023래브라도랩스

함수 추상화 정확도 문제 분석·해결

유사성 분석 도구의 정확도 문제를 “결과가 이상하다”에서 멈추지 않고 식별자 안정성 문제까지 추적해 내용 기반 해시로 고친 디버깅.

코드 분석해시정규식

상세 보기 →

2023래브라도랩스라이선스 데이터 ②

오픈소스 라이선스 양립성 DB 구축

라이선스 이름을 저장하는 수준을 넘어 SPDX 식별자 기준으로 함께 써도 되는지 판단할 수 있는 호환성 데이터를 만든 기반 작업.

크롤러라이선스

상세 보기 →

2022–2023래브라도랩스

ETL DB 영역 분리 — 수집/배포/PROD 경계 재설계

수집·배포·서비스가 한 DB에 묶여 수집 흔적까지 고객사로 흘러가던 구조를, 수집/배포 영역과 메타·파일 2계열로 나눠 binlog 반영 순서와 PROD 정합성을 잡은 재설계.

MySQLBinary LogDB 아키텍처

상세 보기 →

2022래브라도랩스

다차원 취약점 패치 우선순위 시스템

CVSS 점수만으로는 현장에서 패치 순서가 정해지지 않아, 실제 제품 분석 신호와 추가 위협 요소를 함께 반영한 우선순위 체계.

Python취약점 스코어링CVSS·CWE

상세 보기 →

2022래브라도랩스OS 패키지 취약점 ①

OS 패키지 취약점 수집 정확도 개선

OS별 보안 권고안의 형식 차이를 파서와 데이터 모델에 반영해 패치 버전까지 실무에서 쓸 수 있는 취약점 데이터로 맞춘 작업.

PythonOVALOS 패키지 취약점

상세 보기 →

2022래브라도랩스라이브러리 크롤러 ②

컴포넌트 인기도 기반 차등 수집

모든 오픈소스 컴포넌트를 같은 주기로 긁는 대신, 활성도와 유지보수 신호를 점수화해 수집 자원을 중요한 곳에 먼저 쓰게 한 최적화.

GraphQLPython스코어링

상세 보기 →

2021래브라도랩스라이브러리 크롤러 ①

멀티 언어 라이브러리 크롤러 구축 & Java→Python 전환

언어 생태계가 늘어날 때마다 임시 크롤러를 붙이지 않고 8개 언어 커버리지를 확보하며 유지보수 가능한 구조로 다시 쌓은 작업.

PythonGoWeb CrawlingGit

상세 보기 →

2021래브라도랩스라이선스 데이터 ①

DB 스키마 정립 & 라이선스 DB화

텍스트 매핑과 한 테이블에 기대던 라이선스·버전 데이터를 언어별 테이블과 JSON 기반 DB 관리 구조로 옮긴 초기 기반 공사.

MySQL스키마 설계JSON

상세 보기 →

2026개인

나라장터 공고 선별·마케팅 질의 자동화

나라장터 사전공고·일반공고를 키워드와 LLM 적합도 평가로 선별해 Discord로 보냅니다. 영업·마케팅 담당자가 알림 확인과 후속 질의에 사용하고 있습니다.

나라장터LLMHermes/Discord

상세 보기 →

운영 중개인

Discord 요청을 검증 기록으로 남기는 개인 LLM Wiki

Discord에서 시작한 작업의 결정 이유, 검증 결과, 백업 경로를 git 기반 llm-wiki에 남기는 개인 운영 흐름.

HermesDiscordMarkdown/Git

상세 보기 →

운영 중개인

개인 포트폴리오·위키·문서 운영 플랫폼

블로그, 위키, 문서, 포트폴리오가 따로 낡지 않도록 Next.js 앱과 Go API, DB·캐시·게이트웨이를 한 운영 단위로 묶은 개인 작업장.

Next.jsGo APIPostgreSQL

상세 보기 →

운영 중개인

YouTube Shorts 멀티 채널 자동화 플랫폼

기획, 생성, 검수, 업로드, 기록을 한 흐름으로 묶고 업로드 전 승인 지점을 남긴 개인 자동화 플랫폼.

FastAPIn8nWorker

상세 보기 →

운영 중개인

Vibekits — 다국어 랜덤 도구·캐주얼 웹게임

작은 랜덤 도구와 캐주얼 게임을 서비스처럼 다듬는 실험. i18n, 게임 로직 분리, 랭킹·광고·공유 흐름까지 염두에 둔 React/Vite 프로젝트.

ReactViteGame Engine

상세 보기 →

2021세종대 대학원펌웨어 보안 연구 ⑤

FIRM-COV: IoT 펌웨어 고커버리지 그레이박스 퍼징

EF-Fuzz 석사논문을 모체 연구로 삼아 추가 기법과 실험으로 보완·확장한 IEEE Access 후속·확장 공저 논문.

FuzzingAFLQEMUIoT Firmware

상세 보기 →

2021세종대 대학원펌웨어 보안 연구 ④

IoTHybridFuzzer 특허 (하이브리드 퍼징)

변이 퍼징만으로 닿기 어려운 경로를 심볼릭·콘콜릭 실행과 결합해 돌파하려 한 펌웨어 취약점 검출 특허.

Hybrid FuzzingSymbolic ExecutionIoT Firmware

상세 보기 →

2020세종대 대학원펌웨어 보안 연구 ②

EF-Fuzz: 결합된 에뮬레이션 기반 임베디드 퍼징 (석사학위논문)

실제 펌웨어의 커버리지와 크래시 탐지를 개선한 석사학위논문이자, 이후 FIRM-COV 후속·확장 논문으로 이어진 모체 연구.

FuzzingQEMU EmulationIoT FirmwarePSO

상세 보기 →

2020세종대 대학원펌웨어 보안 연구 ③

IoTFirmFuzz — 펌웨어 퍼징 장치 및 방법 (등록특허)

복합 에뮬레이션과 PSO 기반 변이 최적화를 결합해 IoT 펌웨어 취약점을 찾는 방법을 특허로 정리한 연구 성과.

IoT FirmwareFuzzingCombined EmulationPSO

상세 보기 →

2019세종대 대학원펌웨어 보안 연구 ①-B

PLC·라우터 펌웨어 동적 분석 환경 구축

논문·특허로 이미 들어간 퍼징 성과와 중복되지 않게, PLC와 상용 라우터를 실제 분석 가능한 상태로 만들던 UART/JTAG·On-Chip Debugging·VxWorks 셸 환경 구축 작업만 따로 정리.

PLCUART/JTAGVxWorksOn-Chip Debugging

상세 보기 →

2019세종대 대학원펌웨어 보안 연구 ①

UART 기반 임베디드 펌웨어 획득 연구

펌웨어 분석의 출발점인 획득 문제를 UART 방어 기법과 우회 연결 방식으로 다룬 초기 임베디드 보안 연구.

UARTIoT FirmwareHardware SecurityUSB-to-TTL

상세 보기 →

김현욱 · Data Engineer

대표 항목

역할과 범위를 구분해서 적었습니다

전체 항목

파일 기반 배치형 CDC와 멱등 UPSERT

바이너리 로그 기반 데이터 동기화 암호화 전환

RAW 보존·재파싱 구조로 바꾼 ETL 수집 플로우

오픈소스 RAW 데이터 오브젝트 스토리지 구축 (SeaweedFS)

이슈와 문서를 1:1로 연결한 팀 운영 규칙

K8s · Airflow 데이터 수집 플랫폼 운영 & 장애 대응

크롤러 DB 부하를 줄인 DML Broker 설계

Linux 서버 계정·접근 설정 자동화

Grafana 기반 고객사 동기화 상태 모니터링 구축

AWS → IDC/In-house 인프라 이전 & 비용 절감

K8s 하이브리드 클러스터 확장 (IDC + In-house)

이슈 트래킹 & 장애 추적 체계

on-premise 데이터 동기화 배포 시나리오 & 최종 기술지원

CI/CD 개발 완료 루틴 Bootstrap Kit

12개 라이브러리 크롤러 누락 점검과 Python 전환

악성 패키지 정보 수집·분석

라이브러리 컴포넌트 테이블 재설계 (DB 부하 개선)

수십억 행 실측으로 검증한 DB 엔진 비교

사내 git 포지(Forgejo) 서버 재구성 설계

취약점 검증 & 고객사 검증 대응

DB 인덱스 최적화 & 용량 53% 절감

라이선스 원문을 보존하는 LLM 분류 파이프라인

OS 패키지 취약점 수집 멀티 배포판 개편 + OSV 자동화

바이너리 로그 기반 데이터 동기화 모니터링 & 로그 수집기

Grafana 기반 사내 데이터·DB 모니터링 구축

수집 원천·서비스 배포용·on-premise DB 백업 자동화

서비스 배포용 DB 변경 관리 정책 수립

MySQL 8.0 → 8.4 LTS 무중단 업그레이드

바이너리 로그 스크램블링

DB 아키텍처 리엔지니어링 — 인스턴스 분리

파일/함수 취약점 수집 파이프라인 재설계

함수 추상화 정확도 문제 분석·해결

오픈소스 라이선스 양립성 DB 구축

ETL DB 영역 분리 — 수집/배포/PROD 경계 재설계

다차원 취약점 패치 우선순위 시스템

OS 패키지 취약점 수집 정확도 개선

컴포넌트 인기도 기반 차등 수집

멀티 언어 라이브러리 크롤러 구축 & Java→Python 전환

DB 스키마 정립 & 라이선스 DB화

나라장터 공고 선별·마케팅 질의 자동화

Discord 요청을 검증 기록으로 남기는 개인 LLM Wiki

개인 포트폴리오·위키·문서 운영 플랫폼

YouTube Shorts 멀티 채널 자동화 플랫폼

Vibekits — 다국어 랜덤 도구·캐주얼 웹게임

FIRM-COV: IoT 펌웨어 고커버리지 그레이박스 퍼징

IoTHybridFuzzer 특허 (하이브리드 퍼징)

EF-Fuzz: 결합된 에뮬레이션 기반 임베디드 퍼징 (석사학위논문)

IoTFirmFuzz — 펌웨어 퍼징 장치 및 방법 (등록특허)

PLC·라우터 펌웨어 동적 분석 환경 구축

UART 기반 임베디드 펌웨어 획득 연구