![[출처=개인정보위]](https://cdn.ebn.co.kr/news/photo/202412/1646344_658297_454.jpeg)
개인정보보호위원회(이하 개인정보위)는 개인정보 보호 강화 기술인 합성데이터(Synthetic data)의 안전한 생성과 활용을 지원하기 위해 '합성데이터 생성·활용 안내서(이하 안내서)'를 발간했다고 19일 밝혔다.
합성데이터는 컴퓨터 시뮬레이션 또는 알고리즘에 의해 원본데이터의 형식과 구조 및 통계적 분포 특성과 패턴을 학습해 생성된 모의(simulated) 또는 가상(artificial) 데이터다. 가상의 데이터이기 때문에 원본데이터에 있는 개인 식별정보나 민감정보를 노출하지 않고 데이터를 자유롭게 공유, 활용할 수 있다.
데이터의 안전한 활용을 위해 합성데이터를 생성하고 활용하는 사례가 늘어나고 있지만, 그간 현장에서 적용 가능한 기준이나 참고할 만한 선례가 부족했다. 이에 개인정보위는 지난 5월 관련 실증사례를 담은 '합성데이터 생성 참조모델'을 발표한 데 이어, 이번에는 해당 사례를 바탕으로 합성데이터 생성절차와 관련 법령 준수사항을 수록한 안내서를 발간했다.
안내서에서는 개인정보 식별가능성에 실질적으로 대응할 수 있도록 합성데이터 생성·활용 단계를 제시한다. 또 합성데이터 생성·활용 주체와 관련된 적법절차, 원본데이터의 전처리 방식, 안전성·유용성 검증방법과 지표 등 생성·활용 단계별 세부절차를 안내한다.
앞으로 산업현장, 연구소 등에서는 합성데이터 관련 절차나 서식, 방법론, 법령 준수사항 등을 참고하고자 할 때 안내서를 활용할 수 있다. 구체적으로, 정형·비정형 합성데이터별 세부 사례는 '합성데이터 생성 참조모델'에서 확인할 수 있다.
양청삼 개인정보정책국장은 “이번 안내서를 통해 합성데이터 활용 과정에서의 어려움을 해결하고, 산업 및 연구 현장에서 안전하고 효과적인 데이터 활용이 가능해지길 기대한다”고 말했다.