바이러스 골든타임


코로나19가 터지자 가장 빨리 충격을 받은 곳도, 세계가 극찬할 만큼 신속히 대처한 곳도 바로 한국이다. 우리는 바이러스 발발 초기, 중국과 일본에 이어 확진자 수 2, 3위를 기록할 만큼 단시간 내 폭발적으로 증가했다. 특히 2월 말 확산세가 최고조에 달했을 때, 하루 909건의 확진 케이스가 발견되기도 했다. 세계는 한국을 위험국가로 지정하며 입국금지까지 강행했다. 그런데 불과 일주일 새 확진자 수가 반으로 줄고 그 다음 날엔 또 반으로 줄어들었다. 그러는 동안 미국 및 유럽은 비상이 걸렸고 이탈리아는 사망자가 하루에 수백명을 기록했다.


바이러스는 초기진압이 다한다

도시를 봉쇄하는 등 가혹한 대책을 시행한 중국과 달리, 우리는 지극히 민주적인 방법, 사재기는 찾아볼 수 없을 정도로 (상대적으로)침착하게 팬데믹에 대응했다. 이것이 가능했던 이유, 바로 초기 진압과 접촉자 추적에 대한 투명성이 있었다.

 corona map


국내 한 대학생이 최초로 코로나맵을 내놨다. 입소문이 퍼졌고 사람들은 확진자 동선을 파악하며 해당 지역을 최대한 피했다. 그런데 정부 관계자도, 대기업도 아닌 일반인이 어떻게 방대한 데이터에 접근할 수 있었던 걸까? 바로 데이터셋 개방과 공유가 활발해졌기 때문에 가능한 상황이었다.

 AI 시대, 가장 중요한 과제는 데이터 확보다. 리카이프가 저서 <AI 슈퍼파워>에서 ‘인공지능 실행 시대에 중국이 미국을 넘어설 것’이라고 주장한 근거가, 중국이 방대한 데이터를 확보하고 있기 때문이다. (민주주의보다는 사회주의가 국민 데이터 확보에 더 쉽…)

우리나라는 어떤가. 개인정보보호 규제 강도가 최상위권 국가로 분류됐다. 대한상공회의소 지속성장이니셔티브(SGI) 에 따르면, 작년 12월 기준 4대 신산업(AI, 드론, 바이오헬스, 핀테크) 19개 분야에서 12개가 데이터 3법(개인정보보호법, 정보통신망법, 신용정보법)에 막혀있는 것으로 조사됐다.

이를 개선하고자 부단한 노력이 있었고, 마침내 ‘데이터3법’ 개정안이 1월 9일 국회 본회의에서 통과됐다. 개인 식별이 불가능한 ‘가명 정보’를 데이터로 활용하고, 분산된 개인정보보호 체계를 일원화하는 것이 골자다. 다행(?)히도 코로나19가 본격 발발하기 직전 통과돼, 바이러스 확산 방지에 크게 기여했으니… 확진자 동선파악을 위한 다양한 민간 앱이 빠르고 정확하게 개발될 수 있었던 것이다.

 

4차 산업혁명을 꽃피울 씨앗, 데이터

공공이 개방한 데이터셋(AI 머신러닝 등에 활용할 데이터를 분야별 혹은 주제별로 모아놓은 데이터 집합체)은 코로나19 사태에 그 가능성을 입증했다. 코로나맵은 평균 일 방문자수 100만명, 누적 조회수 1300만회를 돌파할 정도로 폭발적 인기를 끌었다.

코로나맵 이동훈 대표는 “데이터 분석 스타트업의 애로사항이면서 가장 큰 진입장벽은 데이터인데 질병관리본부에서 지속적으로 데이터를 공급해줬기 때문에 좋은 서비스를 만들 수 있었다”고 밝혔으니. 국가재난상황 시, 유의미한 데이터 공유는 재난 확산을 막을 수 있는 무기가 될 수 있다는 방증이다.

뿐만 아니다. AI 개발자들의 최대 온라인 커뮤니티이자 빅데이터 경진대회가 수시로 열리는 플랫폼, ‘캐글’에서도 난리가 났다. 김지후 한양대 연구원이 이곳에 코로나19 데이터셋을 등록하자 2주 만에 누적 다운로드 5000회를 돌파했다. 이용자 13만명이 넘는 캐글에서 ‘가장 인기 있는 데이터’로 선정되기도 했다. 어떤 콘텐츠길래?

질본의 공식 자료를 바탕으로, 확진자 동선에 따른 위도·경도 등 지리 정보를 추가해 구성한 데이터셋, 그렇다. 코로나맵처럼 정부의 공유 데이터를 이용해 탄생했다. 확진자·사망자 중심인 미국 존스홉킨스대 데이터셋보다 정밀하다는 평가를 받았다. 세계 데이터 과학자와 공유하기 위해 영문버전도 내놨다.

https://www.kaggle.com/kimjihoo

정부에서도 공신력있는 정보 전달을 위해 발빠르게 움직였다. 행정안전부, 보건복지부, 한국정보화진흥원, 건강보험심사평가원이 손을 맞잡고 공공데이터포털에 정보를 오픈한 것. 공적 마스크 판매 데이터(3.11, API), 국민안심병원 및 선별 진료소 데이터(3.4, 파일 / 3.20, API) 등은 물론, 코로나19관련 데이터도 개방했다. 코로나19 관련 정확한 정보는 모두 여기서 확인하라는 취지다.

 

<초기진압, NO.2는 다음 편에서>