적은 정보로도 감염재생산지수(R) 더 정확히 추정…Nature Communications 誌 게재
고려대학교 세종캠퍼스(부총장 김영) 최보승 교수(빅데이터사이언스학부)가 △이효정 교수팀(경북대 통계학과) △김재경 CI(KAIST 수리과학과, 기초과학연구원(IBS) 수리 및 계산 과학 연구단 의생명 수학 그룹) △최선화 선임연구원(국가수리과학연구소)과 공동으로 전염병 확산 예측 모델을 제시했다. 이는 정확도를 획기적으로 높임으로써 추가 역학 정보 없이도 감염재생산지수를 정확히 추정할 수 있어 공중보건 전문가들이 효과적인 방역 전략을 수립하도록 도울 수 있다.
미지의 바이러스가 나타나면 과학자들은 구조와 실체를 파악하고, 제약사는 바이러스에 대항할 백신과 치료제를 개발한다. 바이러스를 제압할 무기를 만드는 동안, 방역은 국민을 보호하고 피해를 최소화하는 방어막 역할을 한다. 피해를 정확하게 예측하고, 의료진을 배치하고, 병상을 확보하는 등 대책 수립에 수학이 쓰인다.
코로나19 팬데믹은 수리 모델 기반 전염병 확산 모델의 중요성을 재조명하게 해준 사례다. 이를 통해 추정한 감염재생산지수(R값), 잠복기, 감염기 등 변수들은 질병의 확산 양상을 이해하고, 방역 정책을 설계하는 데 중요한 요소로 작용했다.
그러나 기존 모델에는 한계가 있었다. 기존 대부분 모델은 감염자와 접촉한 시점에 상관없이 모든 접촉자가 동일 확률로 감염력이 발현된다고 가정한다. 미래 상태가 현재 상태에 의해서만 결정되고, 과거의 영향을 받지 않는다는 마르코프(Markovian) 시스템에 기반하여 미래를 추정해왔다.
하지만 실제 환경에서는 현재뿐 아니라 과거 상태도 미래에 영향을 준다(비마르코프(non-Markovian) 시스템). 감염자와 접촉 이후 잠복기를 거쳐 감염되기 때문에, 접촉 시점이 오래된 사람일수록 감염력이 발현될 확률이 높다.
최보승 교수(고려대 세종캠퍼스 빅데이터사이언스학부)는 “현재와 과거를 모두 고려해야 하는 비마르코프 시스템은 수학적 추정과 모델링이 복잡하고, 계산이 어려워서 기존 전염병 확산 모델은 마르코프 시스템을 가정하고 추정을 진행해왔다”며 “즉, 실제 감염병 확산 양상을 정확하게 반영하지는 못했다”고 설명했다.
이에 연구팀은 현재와 과거를 모두 고려하는 새로운 감염병 확산 모델을 개발했다. 미래의 변화를 현재의 상태만으로 설명하는 상미분방정식 대신, 미래의 변화를 현재와 과거의 상태를 모두 이용하여 설명하는 지연미분방정식을 도입해 기존 모델의 한계를 극복했다.
연구진은 2020년 1월 20일부터 11월 25일까지 서울의 누적 코로나19 확진자 정보를 활용해 새로 제시한 모델의 정확도를 평가했다. 초기 바이러스의 전파로 확진자가 급증했던 시기(2020.1.20.~3.3)의 감염재생산지수를 기존 모델은 4.9, 새 모델은 2.7로 추정했다. 확진자 전염 경로를 추적해 얻은 실제 값은 2.7이었다. 즉, 기존 모델이 감염재생산지수를 2배 가까이 과대 추정하는 상황이 생길 수 있고, 이에 따라 코로나19 감염력을 과대 예측할 수 있다는 것을 보여준다.
최선화 선임연구원(국가수리과학연구소)은 “과대 예측 문제를 해결하기 위해 기존 모델은 감염기(감염자가 다른 사람에게 전염을 일으킬 수 있는 기간) 등 추가 역학 정보를 사용해 값을 보정해 사용해왔다”며 “새로운 모델은 추가 역학 정보 없이도 감염재생산지수를 정확히 추정할 수 있다는 장점이 있다”고 설명했다.
김재경 CI(KAIST 수리과학과)는 “우리 연구진은 새로운 모델을 바탕으로 ‘IONISE(Inference Of Non-markovIan SEir model)’라는 프로그램을 개발하여, 분야 연구자들이 활용할 수 있도록 무료로 공개했다”며 “향후 공중보건 전문가들이 전염병 확산 양상을 보다 깊이 이해하고, 효과적인 방역 전략을 수립하도록 도울 것으로 기대한다”고 말했다.
연구 결과는 10월 9일 국제학술지 ‘네이처 커뮤니케이션스(Nature Communications, IF 14.7)’에 실렸다.
[그림 1] 현실적인 가정에 기반한 전염병 역학 지표의 새로운 추정 방법 개발
IBS-KAIST-고려대-NIMS 공동연구진은 기존의 전염병 역학 지표 추정 방법의 근본적인 한계를 극복한 새로운 추정 방법을 개발했다. 기존 방법들이 미래 상태가 과거 상태에 영향을 받지 않고 현재 상태에만 의존한다고 가정하여 상미분방정식(ordinary differential equations)에 기반한 추정 방법을 사용한 반면, 새로운 방법은 과거 상태에도 의존할 수 있는 미래 상태를 가정하여 지연미분방정식(delay differential equations)에 기반한 추정 방법을 개발하였다.
[그림 2] 전염병 역학 지표를 추정하는 기존 방법과 새로운 방법의 추정 결과
실제 COVID-19 확진자 자료에 기존 방법과 새로운 방법 적용한 결과. (a) 두 방법 모두 확진자 숫자를 정확하게 근사하였다. (b) 하지만, 감염재생산지수(R)을 추정한 결과, 새로운 방법은 실제 접촉 및 감염 자료에 기반하여 계산된 값(점선으로 표시)에 근접하게 추정한 반면, 기존 방법은 2배에 가까운 값으로 과대 추정을 하였다.
[그림 3] 기존 모델과 새로운 모델의 비교에 활용된 코로나19 누적 확진자 데이터
2020년 1월 20일부터 11월 25일까지 서울의 누적 코로나19 확진자 데이터 중 급격한 확진자 증가가 보이는 3개 구간을 이용하여 분석을 진행했다. 모든 구간에서 새로운 모델은 정확하고도 일관적인 감염재생산지수 추정 결과를 보여주었다. 하지만 기존 모델은 초기 확산 구간에서 재생산지수를 2배 가까이 과대 추정하였고, 2차 파동 구간에서는 모델의 입력 인자에 따라 크게 영향을 받는 일관적이지 못한 추정 결과를 보여주었다. 3차 파동 구간에서는 새로운 모델과 기존 모델이 비슷한 결과를 보여주었다.
[그림 4] 이번 연구에 참여한 연구진의 모습
(왼쪽부터) 김재경 CI(IBS/KAIST, 공동 교신저자), 홍혁표 박사(IBS/KAIST, 현 소속: 위스콘신 대, 공동 제1저자), 최선화 선임연구원(NIMS, 공동 교신저자), 엄은진 박사(고려대, 현 소속 질병관리청, 공동 제1저자), 최보승 교수(IBS/고려대, 공동 교신저자)
[그림 5] 이번 연구에 참여한 연구진의 모습
(왼쪽부터) 김재경 CI(IBS/KAIST, 공동 교신저자), 최보승 교수(IBS/고려대, 공동 교신저자), 홍혁표 박사(IBS/KAIST, 현 소속: 위스콘신대, 공동 제1저자), 이효정 교수(경북대), 최선화 선임연구원(NIMS, 공동 교신저자), 엄은진 박사(고려대, 현 소속 질병관리청, 공동 제1저자)