
김 단장은 25일 오후 2시 서울 여의도 국회도서관 소회의실에서 열린 2025 이코노믹데일리 제약바이오포럼에서 ‘국내 AI 주도 신약개발 정책 방향’을 주제로 발표하며 이같이 말했다.
김 단장은 “구글·엔비디아 등 글로벌 빅테크들이 ‘디지털 바이올로지’ 기술개발과 신사업 창출을 주도하고 있다”며 “글로벌 투자와 경쟁이 치열해지는 만큼 우리나라도 바이오 산업 선도국이 될 수 있는 혁신적인 정책이 필요하다”고 말했다.
이어 그는 “전략으로는 공공 예산이 투입된 데이터와 국민으로부터 생산된 바이오 데이터의 공익화, 공동자산화 등이 있다”며 “연합학습 기술 도입으로 데이터를 공개하지 않으면서 활용이 가능한 ‘데이터 기분 협력 생태계’ 구축이 절실하다”고 밝혔다.
연합학습은 여러 기관이 보유한 데이터의 직접 공유 없이 AI 모델(파라미터, 가중치)만 공유하는 방식으로, 데이터 프라이버시를 보호하면서 AI 모델 성능을 전체적으로 개선하는 방법을 말한다.
현재 원시 데이터, 가공 데이터는 물론 바이오 데이터도 공유가 어려운 상황이다. 미래에 발생할 수 있는 정보 유출 책임과 품질관리 문제 등 때문이다.
연합학습이 이뤄지면 민감한 정보의 보호와 활용이 동시 가능하고 서로 경쟁 관계인 기관 간에도 데이터 기반 협력이 가능하다. 또 각 기관이 제공한 데이터가 AI 모델 개선에 기여한 정도를 평가하고 보상하는 것도 가능해진다.
김 단장은 “엔비디아는 ‘Clara FL’을 통해 여러 의료기관이 데이터를 중앙 서버로 전송하지 않고도 AI 모델을 훈련할 수 있는 환경을 제공하고 있다”며 “유럽도 EU-멜로디를 통해 10개 제약기업이 협력해 신약개발 관련 데이터의 안전한 활용이 가능한 것을 검증했다”고 말했다.
김 단장은 바이오 융합 데이터 인재 양성의 필요성도 언급했다. 디지털 바이오 분야는 화학·생물·약학·의학 등 여러 분야의 심도있는 융합이 필요한 분야라는 취지에서다.
김 단장은 “기초교육·직무 교육이 아닌, 첨단 산업을 주도할 수 있는 디지털 바이오 융합 인재 양성 전략이 필요하다”며 “대학·기업·연구소·정부가 협력해 창업을 지향하는 프로젝트형 인재 양성 프로그램도 운영해야 할 것”이라고 강조했다.