A
공공데이터 이관 잔존 PII 스캐너
4.35
파생 체인
단계 1
민감 공공데이터 민간 클라우드 이관
→
단계 2
이관 데이터 내 잔존 개인정보 리스크
→
단계 3
보안등급 분류 후 실제 데이터 내 PII 탐지
→
단계 4
PII 탐지 자동화 및 처리 워크플로우
문제
공공데이터를 민간 클라우드로 이관할 때, 보안등급이 '일반'으로 분류된 데이터셋 내에도 주민등록번호, 전화번호, 주소 등 잔존 개인정보가 숨어 있는 경우가 빈번하다. 실제 이관 사고 사례에서 '일반' 등급 데이터의 12%에서 PII가 발견되었다. 잔존 PII가 민간 클라우드로 이관되면 개인정보보호법 위반으로 기관장 징계 및 과태료 최대 5,000만원 리스크가 발생한다.
솔루션
이관 대상 데이터셋의 전체 레코드를 스캔하여 한국 PII 패턴(주민번호, 전화번호, 주소, 계좌번호 등)을 탐지하고, 발견된 PII의 위치·유형·건수를 리포트로 제공한다. 자동 마스킹 제안과 함께, PII 처리 완료 인증서를 생성하여 감사 증적으로 활용할 수 있다.
NUMR-V Scores
NUMR-V Scoring System
| N Novelty | 1-5 | 시장 내 유사 서비스 부재 정도. 경쟁사 0개 = 5, 10+개 = 1 |
| U Urgency | 1-5 | 사용자가 지금 당장 필요로 하는 긴급성. 트렌드 부합 + 시급성 |
| M Market | 1-5 | 타겟 시장의 크기와 성장 가능성. 프록시 지표 기반 (LLM 추정 X) |
| R Realizability | 1-5 | 1-2인이 실현 가능한 정도. 기술 난이도 + 데이터 확보 용이성 |
| V Validation | 1-5 | 시장 검증 통과 여부. 경쟁사 분석 + 수요 프록시 + 타이밍 |
SaaS N=.15 U=.20 M=.15 R=.30 V=.20
Senior N=.25 U=.25 M=.05 R=.30 V=.15
실현성 (79%)
실현성 분석
| 기술 복잡도 | / 40 | 핵심 기술 스택의 난이도. low=40, medium=24, high=10 |
| 데이터 접근성 | / 25 | 필요 데이터의 확보 용이성. user_generated=25 → proprietary=4 |
| MVP 일정 | / 20 | 최소 기능 제품 구축 소요 기간. 2주=20, 1개월=12, 3개월=8 |
| API 보너스 | / 15 | 공공 API 활용 가능 시 보너스. 매칭 API가 있으면 가산 |
시장 검증 (63/100)
검증 분석
| 경쟁 분석 | / 20 | 경쟁사 검색 결과 기반. 적절한 경쟁 존재 = 시장 검증 |
| 시장 수요 | / 20 | 검색량, 뉴스 언급 등 프록시 지표. 실제 수요의 간접 증거 |
| 타이밍 | / 20 | 현재 트렌드와의 부합도. 규제/기술 변화 시점 적합성 |
| 수익 참조 | / 15 | 유사 비즈니스 모델의 수익 사례. 실제 과금 레퍼런스 존재 여부 |
| 곡괭이 적합 | / 15 | 곡괭이 전략 부합도. 도구/인프라 제공 관점 적합성 |
| 1인 구축 | / 10 | 혼자서 MVP 구축 가능 여부. 외부 의존성 최소화 정도 |
기술 요구사항
백엔드 [medium]
AI/ML [low]
프론트엔드 [low]