6
Ⅰ. 보건의료 빅데이터 동향
1. 들어가는 글
●● �딥러닝(Deep� learning)을�필두로�하는�인공지능이�영상�분석,�음성인식�등�다양한�분야에서�
우수한�성과를�보이며,�보건의료�분야에서도�인공지능에�대한�기대감이�높아짐
●● �실제로�의학�논문�검색�엔진인�PubMed1)�에서�인공지능�관련�키워드로�검색되는�논문들은�그림�1과��
같이�증가하고�있음
보건의료 분야에서의 인공지능과
기계학습 활용 및 전망윤덕용�교수�
아주대학교�의료정보학과
[그림 1]��연도별�인공지능�관련�키워드를�가진�논문의�수(~2018년)
The
num
ber o
f pub
licat
ions
7000
6000
5000
4000
3000
2000
1000
0
1950 1960 1970 1980 1990 2000 2010 2020
Deep learing Machine learing Artificial learing
●● �특히�알파고�등장�시점인�2015년을�기점으로�딥러닝�관련�논문들이�급속하게�늘어나고�있음
76
HIRA 빅데이터 브리프
●● �하지만�인공지능을�공부하는데�있어서의�높은�학습�장벽�때문에�아직�보건의료�분야의�많은�
연구자들은�인공지능에�대해�막연한�기대감만을�갖고�있는�경우가�많음
●● �따라서,�본�고에서는�인공지능,�기계학습,�딥러닝에�대한�기본적인�개념을�간단히�설명하고,�보건�
의료�분야에서�활용된�사례와�향후�전망에�대해�살펴보고자�함
2. 인공지능과 기계학습
[그림 2]��인공지능,�기계학습,�딥러닝�간의�관계�도식도
2.1 인공지능
●● �딥러닝이�인공지능�분야의�대표적인�알고리즘으로�자리잡으면서,�딥러닝이�곧�인공지능으로�
표현되는�경우가�많으나,�인공지능은�훨씬�광범위한�개념임
�▶ 전통적인�정의에�따르면�인간의�지능을�흉내내는�모든�프로그램을�인공지능이라고�할�수�있음2)�
●● �현재�과학�기술로는�실제�지능의�원리에�대해서도�자세하게�밝히지�못하고�있기�때문에,�이를�
인공적으로�만든다는�것은�불가능함�
8
Ⅰ. 보건의료 빅데이터 동향
�▶ �따라서�지능의�원리는�따지지�않고�프로그램의�결과가�인간의�지능과�유사한�결과를�보인다면�
인공지능이라고�할�수�있어,�의사결정나무,�Support�vector�machine,�인공�신경망�등�다양한�
알고리즘이�존재함
�▶ �예를�들어,�어떤�전문가의�경험을�바탕으로�작성된�단순한�순서도(flowchart)�기반의�프로그램도�
입력에�대한�결과�반응이�인간의�반응과�유사하다면�인공지능이�될�수�있음
2.2 기계학습
●● �기계학습(machine�learning,�ML)은�인공지능의�여러�분야�중�한�분야에�속함(그림�2)
�▶ �기계학습은�다양한�방법을�이용해서�데이터에�존재하는�어떤�패턴을�찾아가는�특징이�있어�‘학습’�
이라는�단어가�붙음�
●● �기계학습은�비지도학습(unsupervised� learning),�지도학습(supervised� learning),�강화학습
(reinforcement�learning)으로�분류됨
�▶ �비지도학습�:�학습하는�데이터에�특정�그룹에�대한�정보(label)�없이�데이터�내에�존재하는�
패턴을�찾는�방법으로,�그림�3의�좌측�데이터를�x,�y축의�값을�기반으로�하여�우측과�같이�두�
그룹으로�나눌�수�있음�
[그림 3]��비지도학습�결과�예시
98
HIRA 빅데이터 브리프
�▶ �지도학습�:�지도학습은�학습하는�데이터에�특정�그룹에�대한�정보(label)가�있어�주어진�정보에�
맞춰�패턴을�찾는�방법으로,�그룹에�대한�정보를�바탕으로�그림�3과�동일한�데이터를�분석한다면�
결과는�그림�4와�같이�달라짐(화살표)
�▶ �강화학습�:�강화학습은�시행착오를�겪으며�가장�높은�보상을�받는�행동의�정책을�학습하는�분야로,�
그림�5에서�오른쪽으로�가능�행동은�+10점의�보상,�왼쪽으로�가는�행동은�-10점의�패널티를�
준다면�여러�번의�시행착오를�겪은�후,�오른쪽으로�가는�행동이�좋다는�것을�학습하게�됨
�▶ �딥러닝�:�딥러닝은�패턴을�학습하는�방법,�즉�알고리즘에�대한�이름으로�그림�2에서�제시된�
바와�같이�비지도�학습,�지도�학습,�강화�학습에�모두�사용될�수�있음.�인공�신경망�알고리즘을�
여러�겹(깊게)�붙여�사용하여�딥러닝이라고�불리움
[그림 5]��강화학습�결과�예시
정책수립�
→�오른쪽�선택
강화�학습
경험(행동,�보상)
-10 +10
[그림 4]��지도학습�결과�예시
10
Ⅰ. 보건의료 빅데이터 동향
3. 인공지능과 데이터
●● �앞서�살펴본�바와�같이,�인공지능의�개념은�매우�광범위하지만�현재�가장�주목받고�있는�분야는�
데이터에�기반한�방법인�기계학습이며,�그�중에서도�딥러닝이�비지도,�지도,�강화학습�분야에서�
가장�활발하게�사용되고�있음
�▶ �기계학습�알고리즘은�데이터로부터�패턴을�학습하여�데이터가�많을수록�좋은�성능을�보이며,�
특히�딥러닝�기반�모델의�경우�모델의�복잡성이�높아�더�많은�데이터가�필요함
●● �대부분의�산업�분야에서�정보화가�이루어지고,�데이터�저장에�필요한�비용이�급격하게�감소하면서�
가용�데이터의�양이�급속하게�증가함
�▶ �2010년대�초반,�전�세계의�데이터�양은�5zettabytes�미만이었지만�2018년도에는�33zettabytes,�
2025년도에는�175zettabytes에�이를�것으로�예상되고�있음3)�
●● �데이터의�양이�급속하게�증가하면서�특히�많은�데이터가�요구되는�딥러닝의�성능이�월등하게�
좋아짐에�따라�딥러닝에�대한�기대가�커짐
�▶ �하지만�한�사람이�생산하는�수많은�정보�중�병원에서는�아주�일부만이�수집되고�있어,�보건의료�
분야에서�충분한�데이터가�수집되고�있는지�고민이�필요함
[그림 6]��데이터와�기계학습�알고리즘의�성능�간의�관계
Deep learning
Most other algorithms
Perfo
rman
ce
Amount of Data
1110
HIRA 빅데이터 브리프
[그림 8]��아주대학교병원�생체신호�데이터�수집�인프라�구축�현황
●● �아주대학교�병원에서는�이러한�문제를�해결하기�위해�병원에서�수집이�가능한�데이터이지만,�
놓치고�있는�데이터들을�최대한�자동적으로�수집할�수�있는�인프라�확충에�노력하고�있음
�▶ �대표적인�예로�중환자실�및�수술실에서�측정되는�생체신호(심전도,�연속측정�동맥혈압,�호흡�
등)를�파형데이터�원본�그대로�실시간으로�수집하는�인프라를�구축하여�운영�중
[그림 7]��한�사람으로부터�수집�가능한�데이터�중�수집�여부에�따른�분포
Data not recorded
Data recorded outside the hospital
Data recorded in the hospital
12
Ⅰ. 보건의료 빅데이터 동향
�▶ �2019년� 3월�현재�기준,� 약� 11,000여명의�환자로부터�생체신호�데이터를�수집하였으며,�
수집된�모든�파형데이터의�총�길이는�약�650년에�달함
[그림 9]��생체신호�데이터�수집�인프라�구축을�위한�작업�현장�사진
1312
HIRA 빅데이터 브리프
4. 보건의료 분야에서의 활용 사례
4.1 비지도학습 : 의학용어 유사도 계산 사례
●● �의학용어들간의�유사도를�계산하기�위해서는�개별�용어들을�계산�가능하도록�수치화하는�과정이�
필요한데,�이를�위해�의학용어들의�사용�패턴을�학습하게�하면�각�개념들을�수치화하여�표현할�
수�있음
[그림 10]��Med2Vec을�이용한�의학용어의�수치화�예시
�▶ �각�의학용어들은�사용된�기록만�있고,�어떠한�개념인지에�대한�label은�사용되지�않았으며,�
단순히�전자의무기록�내에서�사용된�패턴만을�보고�학습하였기�때문에�비지도학습에�해당됨
�▶ �이렇게�수치화된�개념들은�유사한�의학용어를�추천해�주거나,�유사한�환자들을�찾는데�활용될�
수�있음
14
Ⅰ. 보건의료 빅데이터 동향
●● �그림�11은�임상시험�대상자를�찾는�프로그램에�응용된�사례로�특정�약물을�검색하면�비슷한�
사용�패턴을�보였던�약물들을,� 일부�환자군을�선택하면�유사한�환자군들을�추천해줌으로써�
분석과정을�지원함
●● �이렇게�비지도학습을�통해�추출된�패턴은�원본의�고차원�데이터에서�의미�있는�인자들이�추출된
(추상화된)�결과이기�때문에,�지도학습이나�강화학습의�입력�데이터로�유용하게�사용될�수�있음
4.2 지도학습 : 중환자실 내 패혈증 발생 예측 모델 개발 사례
●● �본�연구진은�패혈증이�발생한�환자군에서�패혈증이�발생하기�1시간�전의�생체신호�데이터와�
패혈증이�발생하지�않은�환자의�생체신호�데이터를�분석하여,�패혈증을�조기에�예측할�수�있는�
모델을�개발하였음
[그림 11]��Metformin과�유사한�사용�패턴을�보이는�약물을�추천해주는�화면
[그림 12]��패혈증�예측�모델�개발�연구�모식도
1514
HIRA 빅데이터 브리프
[그림 13]��패혈증�예측�모델�구조
[그림 14]��패혈증�발생�예측�모델�기반�패혈증�위험도�분석�결과�예시
�▶ �예측�모델의�구조는�그림�13과�같이�심전도(ECG),�맥박�파형(PPG),�호흡�파형(RESPIMP)�
데이터를�분석한�후,�패혈증�발생에�대한�예측�여부를�결과로�내도록�되어�있음
�▶ �실제�임상데이터에�적용ㆍ평가하여�현재�약�85%의�정확도를�확보하였으며,�그림�14과�같이�
시간별로�특정�환자의�패혈증�발생�위험도를�계산할�수�있음
16
Ⅰ. 보건의료 빅데이터 동향
4.3 강화학습 : 패혈증 환자에 대한 승압제 및 수액 치료 전략
수립 사례
●● �최근�Nature�medicine지에�발표된�논문에�따르면,�중환자실에서�치료했던�데이터를�기반으로�
가상의�임상�환경을�마련해�두고,�그�안에서�시행착오를�경험하며�적절한�승압제와�수액치료를�할�
수�있도록�인공지능�모델을�학습시킴5)�
�▶ �그�결과,�실제�의료진의�치료�정책보다�인공지능의�치료�정책이�더�많은�환자를�살릴�수�있을�
것이라고�평가됨
[그림 15]��Nature�medicine지에�소개된�AI�clinician�논문�
(https://www.nature.com/articles/s41591-018-0213-5)
1716
HIRA 빅데이터 브리프
5. 미래 전망
●● �앞서�살펴본�내용들을�바탕으로�보건의료�분야의�빅데이터에서�인공지능�및�기계학습이�적용되는�
과정을�보면�그림�16과�같음
[그림 16]��보건의료�빅데이터�기반�인공지능�적용�프로세스�개요
�▶ �보건의료�분야에서�기계학습의�적용을�위해서는�의료현장에서�의미�있는�데이터를�정확히,�
많이�수집하려는�노력이�필요함�
�▶ �이렇게�수집된�원본�데이터는�매우�고차원이며�복잡하기�때문에�중요한�특징을�추출하는�
과정이�필요함(비지도학습)
�▶ �이후�질병의�여부�등을�판단하거나�예측모델의�개발을�위해서�질병에�대한�정보가�포함된�
데이터�학습이�필요함(지도학습)
�▶ �또한�다양한�임상�상황에�맞는�최적의�치료�전략을�수립하는�일도�중요함(강화학습)
18
Ⅰ. 보건의료 빅데이터 동향
●● �현재�앞서�나열한�프로세스의�각�부분들�혹은�몇몇�부분들이�연계된�형태의�연구들이�활발하게�
진행되고�있음
�▶ �각�부분의�연구들에서�우수한�연구�성과들이�도출되고�있어,�향후�가까운�미래에서는�모든�
프로세스가�연계되어�궁극적인�AI�clinician이�등장할�수�있을�것으로�기대됨
●● �AI�clinician은�다음과�같은�점에서�인간보다�우수한�능력을�보여줄�것으로�예상됨
�▶ 환자로부터�필요한�데이터를�보다�효율적으로�수집함
�▶ 환자로부터�수집한�데이터를�보다�적절하게�추상화함
�▶ 정확한�진단을�먼저�내릴�수�있음
�▶ 효과적인�치료�전략을�수립할�수�있음
�▶ 데이터�및�문헌을�참고하여�새로운�지식을�보다�빠르게�습득
●● �따라서�보건의료�분야에서�활용될�인공지능�기술에�대한�관심을�넘어,�향후�개발될�AI�clinician
과의�공존�방향에�대해서도�고민이�필요함
1918
HIRA 빅데이터 브리프
참고문헌
1.��PubMed.�https://www.ncbi.nlm.nih.gov/pubmed/.
2.��Russell�SJN,�Peter.�Artificial�Intelligence�:�A�Modern�Approach��
(3rd�ed.�:�Upper�Saddle�River,�New�Jersey�:�Prentice�Hall;�2009.
3.��Rydning�DRJGJ.�The�Digitization�of�the�World�From�Edge�to�Core.�2018.
4.��Sun�ECMTBESCCJ.�Multi-layer�Representation�Learning�for�Medical�Concepts.�
CoRR.�2016.
5.��Komorowski�M,�Celi�LA,�Badawi�O,�Gordon�AC,�Faisal�AA.�The�Artificial�
Intelligence�Clinician�learns�optimal�treatment�strategies�for�sepsis�in�intensive�
care.�Nat�Med.�2018;24(11)�:�1716-1720.
Top Related