[출처=한국제약바이오협회]
[출처=한국제약바이오협회]

한국제약바이오협회가 국민의 건강보험 및 의료 데이터를 안전하게 활용해 신약개발을 가속화하고, 이를 통해 발생한 수익을 국민과 공유하는 ‘국민신약배당’ 정책을 제안했다.

김화종 한국제약바이오협회 연합학습 기반 신약개발 가속화 프로젝트(K-멜로디) 사업단장은 11일 열린 온라인 기자간담회에서 국민신약배당에 관한 내용을 설명했다.

이날 김 단장은 “국민 건강보험과 병원 진료데이터, 유전체 등 방대한 의료데이터를 데이터 이동 없이 안전하게 활용하는 체계를 구축해 글로벌 신약개발 경쟁력을 확보할 수 있다”고 말했다. 이를 통해 수익이 발생하면 원천 데이터 제공자인 국민에게 보상이 돌아가는 선순환 구조를 만들어야 한다는 것.

인공지능(AI) 바이오 산업에서 가장 중요한 요소는 바이오 데이터다. 하지만 언어 인식과 시각 인식은 학습 데이터가 충분해 AI 구현이 가능했지만 신체의 약물 반응 모델링은 데이터가 불충분해 여전히 난제로 여겨지고 있다. 

특히 한국은 전국민 단일 건강보험체계를 기반으로 방대한 의료데이터가 정리돼 있지만 개인정보 보호 등 제약으로 인해 상업적 활용은 제한돼 있는 상황이다.

김 단장은 “전통적 방식으로는 선진국을 따라잡기 어렵다”며 “한국이 잘 갖추고 있는 의료데이터를 안전하고 효율적으로 활용할 수 있는 시스템을 구축해야 한다”며 “국민으로부터 생산된 바이오 데이터의 효과적인 활용 체계 구축으로 AI 바이오 선도국 진입 전략이 필요하다”라고 강조했다. 

김화종 한국제약바이오협회 연합학습 기반 신약개발 가속화 프로젝트(K-멜로디) 사업단장. [출처=한국제약바이오협회 웨비나 캡쳐]
김화종 한국제약바이오협회 연합학습 기반 신약개발 가속화 프로젝트(K-멜로디) 사업단장. [출처=한국제약바이오협회 웨비나 캡쳐]

기존의 데이터 공유 방식이 가진 문제점도 지적됐다. 최근 데이터 가명화와 암호화, 중간 결합기관 활용 등 다양한 방식이 시도되고 있지만 완벽한 개인정보 보호가 어렵고 데이터 결합 과정의 비효율성이 문제로 여겨지고 있다. 개별 금융기관이나 병원이 보유한 데이터 역시 제한적이다. 

이 같은 문제를 해결할 대안으로 김 단장은 연합학습(Federated Learning) 기반의 ‘모델 퍼스트’ 방식을 제시했다. 이 방식은 데이터 자체를 외부로 이동시키지 않고 AI 모델이 각 기관의 데이터에 접근해 학습을 진행한 후 학습된 모델의 파라미터만 공유하는 시스템이다.

김 단장은 “데이터가 이동하지 않고도 고성능의 AI 모델을 개발할 수 있어 개인정보 유출 우려를 최소화할 수 있으며 각 기관의 협력 참여도 용이해진다”라고 설명했다. 

김 단장은 국민신약배당 모델을 설명하며 홍콩 지하철의 역세권 개발 수익 배분 사례를 인용했다. 홍콩은 지하철 운영에서 발생하는 부동산 개발 수익을 공공에 환원하는 구조를 구축해 흑자 운영을 하고 있다. 한국도 데이터라는 새로운 공공자원을 활용해 신약개발 산업을 육성하고 그 수익을 국민에게 배당하는 시스템을 만들자는 것이다.

해외에서도 개인 데이터 제공에 따른 보상을 시도하는 다양한 사례가 있었지만, 대부분 데이터 가치를 사전에 평가하고 가격을 매기는 방식은 실패했다고 지적했다. 데이터의 가치는 활용 후에야 비로소 파악 가능하기 때문에 사전 거래는 실패할 수밖에 없다는 설명이다.

끝으로 김 단장은 “한국이 이 모델을 선도적으로 추진할 경우 글로벌 데이터 기반 신약개발 플랫폼을 주도할 기회를 확보할 수 있다”며 “해외 유수의 병원과 기업들도 이 모델에 참여하게 된다면 한국이 세계 최초로 민감한 의료데이터를 활용한 글로벌 신약개발 혁신 생태계를 주도할 수 있다”고 강조했다.

저작권자 © 이비엔(EBN)뉴스센터 무단전재 및 재배포 금지