
AI 주도 국내 신약개발의 환경 변화에 따른 방향성으로 의료부문에도 도입되고 있는 분산형 연합학습 방식이 제안됐다.
예종철 교수(카이스트)는 19일 롯데호텔 서울에서 열린 제약바이오 AI 혁신포럼을 통해 AI 신약개발의 촉진을 위한 방안으로 연합학습(Federated Learning) 기술의 적극적인 활용을 제안했다.
예교수는 국내 보건의료 빅테이터 플랫폼 등 중앙집중방식이 갖는 다양성과 유연성부족 등의 단점 극복하고 글로벌 시장 대비 다소 늦은 AI 신약개발 환경의 획기적인 성장의 방안으로 업체간의 협업을 통한 연합학습 기술의 활용이 필요하다고 주장했다.
연합학습은 간단히 한 곳에 집중화된 공공DB을 이용하는 방식이 아닌 의료기관이나 개인, 개별회사가 보유하고 있는 데이터 등을 상호 활용, 개별회사가 갖는 적은 양의 데이터의 축적속도와 편향성 등에 한계를 극복, 신약개발을 촉진하는 방안이다.
즉 글로벌 환경대비 AI가 학습가능한 국내 데이터의 양도 부족한 상황에서 업체별로 구축한 적은 양의 데이터 마저 서로 공유되지 않는 경우, 신약 개발의 속도나 다양성을 확보할 수 없는 만큼 상호정보를 활용하자는 의미다.
연합학습은 블록체인 기술을 활용, 개별회사가 갖고 있는 데이터 공유시 문제시될 수 있는 독창적인 기술의 유출의 우려를 차단, 상호 필요한 선별적인 자료를 공유하는 개념이다.
예교수는 이를 위해 우선 "업체에 참여할 동기의 부여"를 첫번째 극복해야할 대목으로 꼽았다.
생명공학사 입장에서 굳이 어렵게 구축한 DB을 동종계열 약물을 개발하는 경쟁사가 포함되어 있을 수 있는 환경에 오픈할 이유가 없다고 판단할 수 있기 때문이다.
그는 데이터베이스를 각자 보관하고 AI가 단지 정보의 학습이후 분석 결과만 중앙서버에 전송하는 만큼 개인정보는 물론 기업비밀은 보호되고 자체적으로 구축한 데이터의 편향성도 개선할 수 있다는 강점을 강조했다.
끝으로 블록체인 기술을 활용한 로그데이터를 기반으로 어떤 회사의 데이터 베이스가 특정 신약개발이 기여했는지 기여도를 측정할 수 있어, 향후 개발 또는 상용화 과정에서 특허권리 등에 따른 수익배분 등 조정과 관리가 가능하다는 점도 연합학습의 강점과 가능성으로 꼽았다.
향후 조율을 통해 풀어야할 숙제이기는 하나 이는 자체 개발에 실패할 경우라도 원천 데이터의 높은 성숙도 자체가 의료기관과 기업의 이윤으로써 역할이 향후 가능할 수 있다는 것으로 해석됐다.
이에 앞서 머신학습이 가능한 개별 데이터의 표준화 등 다양한 난제를 풀어내야 하나 국내 연합학습 시스템 구축시 다른 글로벌 업계나 조직과의 협업 가능성 등이 높아지는 등 국내 신약개발 관련 부족한 DB의 한계를 극복한 계기가 될 것으로 기대된다.
한편 제약협회는 유럽지역의 글로벌제약사와 대학, 생명공학사들이 참여, 윤영중인 머신러닝 기반 데이터 공유 플랫폼 (MELLODDY: Machine Learning Ledger Orchestration for Drug Discovery)를 벤치마킹한 연합학습 기반 신약개발 가속화 프로젝트(K-MELLODDY)를 추진하고 있다.