(기고)의료 데이터 개방화에 대한 고찰

김성환 한림대학교강남성심병원 성형외과 교수

의료 데이터는 전 국민의 진료정보와 의료기관, 제약회사 유관기관 등 다양한 경로에서 수집한 정보를 분석, 정제한 데이터이다. 최근 의료 데이터 공유와 활용이 중요해지고 있으며, 연구를 비롯해 인공지능, 의료기기, 신약 개발, 의료 서비스 등에도 데이터 활용이 필수가 되는 추세이다.

정부는 국내 공공 및 민간 의료기관의 의료 데이터의 가치가 2조원이 넘을 것으로 예상하고 있으며, 시장조사 업체 글로벌 마켓 인사이트에 따르면 헬스케어 분석 시장은 연평균 11%씩 성장해 2027년에는 27조원에 달할 것으로 전망하고 있다.

2020년 국회에서 데이터 3법이 통과되었고, 인공지능, 빅데이터를 활용한 의료기기, 신약 개발, 의료 서비스 등 맞춤형 정밀 의료 시대를 준비하는 헬스케어 혁신이 시작됐다.

세계적으로 한국의 의료 데이터 보유량은 높은 수준이다. 건강보험공단과 건강보험심사평가원이 보유한 의료 빅데이터는 각각 3조 4천억 건과 3조 건까지 누적되어 있고, 전자의무 기록 보급률도 92%로 세계적인 수준이다.

현재 국내 보건의료 데이터는 공공기관을 중심으로 개방 중이며 보건복지부 및 지자체에서는 공공데이터 포털을 통해 보건의료 데이터 2040개를 개방하고 있고, 국민건강보험공단과 건간보험심사평가원도 CSV 와 Open API형태로 데이터를 제공 중이다.

의료 데이터 개방을 통해 의료기기, 신약 개발, 의료 서비스를 개발하고 국민 건강 보건을 향상시키고자 하지만 ‘데이터’를 개방하는 목적과 다르게 민간 활용이 쉽지만은 않은 상황이다. 현재 수전에서는 공공기관 데이터들이 공개되고 있으며 대부분 통계 데이터에 그치는 수준이다. 민간 기업이 필요로 하는 임상 데이터의 공개는 요원한 상태다.

이런 문제를 보완하기 위해 데이터 뉴딜 사업의 일환으로 2017년부터 한국지능정보사회진흥원에서 인공지능 학습용 데이터 구축, 개방사업을 시행하고 있다. 해당 사업을 통해 구축 완료된 총 35종의 학습용 데이터는 ‘AI허브’를 통해 개방되고 있지만 이 역시 온/오프라인 세이프존 내에서만 활용이 가능한 상황이라 좋은 제약이 심하다.

오프라인의 경우 폐쇄망에서만 사용이 가능하기 때문에 연구자들이 직접 가서 연구를 해야 하는 등 번거로움이 있고, 온라인을 사용하더라도 GPU등의 제한점이 있어 적극적으로 활용해 개발하는데 어려움이 있다.

해외의 경우 간단한 회원 가입을 통해서 TCIA(The Cancer Imaging Archive), ADNI, OASIS 등의 사이트에서 데이터 요청과 다운로드가 가능한 것과 비교된다. 의료기관이 많은 자원을 투자해 데이터를 구축 관리하고 있음에도 이를 활용할지에 대한 기준과 지침이 정리되어 있지 않아 많은 데이터들이 사장되고 있는 실정이다. 병원별, 연구자별로 조각조각 나눠져 있는 데이터를 연계하고 결합해서 활성화할 필요성이 있다.

의료 데이터 개방화를 위한 데이터 구축 및 활성화를 정부 주도하에서 시행할 경우 효율을 극대화하기 위해서는 신뢰할 만한 전문가로 구성된 조직을 만들고 체계적으로 관리할 필요가 있다. 현재 이 같은 업무를 한국지능정보사회진흥원에서 시행하고 있으나 여러가지 보완점이 필요하다.

의료 데이터 표준화 작업을 시행할 때 많은 임상의가 참여해 원칙에 근거한 가이드라인을 만들어야 하고, 이를 정부 기관이 조율하는 것이 필요하다. 데이터의 표준화, 정형화 과정에서 많은 임상의가 참여하지 않아 표준을 무시한 의료 데이터가 만들어지고, 이를 개방하더라도 수요자들이 별로 활용을 하지 못하는 상태가 지속되고 있다. 또한 이를 이용하여 개발하는 민간 수요 사업자의 요구에 잘 반영하기 위해서라도 많은 임상의가 참여하는 것이 필요하다고 생각된다.

이를 위해 의료정보학회와 각 임상학회가 적절하게 의료 데이터 표준화에 힘 써야한다. 이 과정에서 임상의가 개입해 용어를 정의하고 데이터 표준화작업을 시행한다면 의료 데이터의 생산과 소비가 연결되고 병원 간 상호 운용이 잘 확보될 것이라고 생각한다.

현재 오픈 플랫폼 등을 전제로 이뤄지고 있는 정부 지원 과제들은 개방될 수 있는 환경을 마련하고 단기적 사업이 아닌 중장기적 사업으로 확대 시행해야 한다. 이를 통해 각 병원이 보유하고 있는 데이터를 정부 주도하에 통합 플랫폼에서 관리하고 공개 가능한 데이터 순으로 점차 늘려가야 한다.

병원이 데이터를 보관, 가공하고 개방 체계를 만드는데 많은 자원이 소모되는 만큼 정부에서 적절한 보상이 필요하다고 생각한다. 현재 데이터 공개가 공공기관에 많이 편중되어 있기 때문에 다양한 의료기관들의 참여를 독려하기 위한 방법도 마련해야한다. 또한 정부에서 의료 기관이 보건 의료 데이터를 개방할 때 이에 대한 활용을 어디까지 관리해야 하는지 명확한 기준을 제시해야한다.

데이터 개방화에 대한 방향성만 제시하지 말고 문제 발생 시 자료를 개방한 주체에게 책임을 묻기 보다는 정부에서 적극적으로 문제를 해결해야한다고 생각한다. 특히 공공 데이터의 소유권이나 개인정보 유출 등의 문제는 해결해야 할 과제들이 많다. 데이터 소유권에 대한 논란은 오래전부터 지속해왔던 문제들이며, 국민의 의료 데이터를 제공받은 기업들이 개발한 제품을 국민들이 다시 비용을 지불하는 게 맞는지는 생각해야할 문제이다.

기업들은 새로운 의료 서비스가 나오고 의료산업이 발전할 수 있기 때문에 공유하는 의료 데이터가 많아질수록 국민에게 돌아가는 혜택이 커질 것이라는 입장이다. 하지만 의료 정보는 개인정보보다 민감한 문제를 일으킬 수 있다. 개인의 유전정보나 질병명, 치료 기록이나 생활습관 등의 많은 건강정보들은 유출되었을 경우 사생활 침해 및 개인의 자유가 억압될 수 있는 등의 피해가 커질 수 있다.

비식별화를 거친 데이터가 개방돼도 큰 문제가 없을 것이라는 의견도 있지만 흩어진 정보를 조합해 개인을 식별하는 ‘재식별화’ 문제가 꾸준히 제기되어 있다. 이런 문제들은 정부 주도로 해결하는 것이 바람직하다고 생각된다. 데이터 관련 규제가 지속적으로 좋아지고 있으나 산업계와 의료계의 의견을 수렴해 정부가 순차적으로 의료 데이터의 개방을 진행해 의료공공복지 분야에서의 역량 강화 및 보건의료서비스의 창출 등을 해야 국민 보건 향상에 도움이 될 것이다.

뉴스더보이스 다른기사 보기