[204호 과학학술: 가능성과 개연성] 불확실성을 다루는 수학, 확률론과 개연론

세상은 불확실하다. 임의적으로 발생하는 어떤 현상을 예측하기란 거의 불가능하다. 뿐만 아니라 현상에 대한 우리의 인식이 불명확할 수도 있다. 예를 들어 의사의 진단이 잘못되면 오히려 환자의 생명이나 건강이 손상되는 일이 발생할 수도 있다. 이러한 일들은 불확실성으로 인하여 발생하는데, 불확실성을 다룰 수 있는 수학으로 확률론과 개연론이 있다. 인공지능과 전문가시스템 등을 포함한 다양한 분야에서 이들 수학의 응용이 확대되고 있다.

 

물이 가득 찬 물병 하나와 빈 물병 하나가 들어 있는 냉장고에서 물병 하나를 꺼내자. 꺼낸 물병에 물이 가득 차 있겠는가? 이 질문에 어떤 사람들은“가능성이 1/2 이다.”란 답을 할지 모르겠다. 이 답은 무슨 의미일까?

P씨는 전날 밤 돼지가 새끼를 낳는 꿈을 꾸었다. 그래서 혹시나 하는 행운을 기대하며 아침 일찍 복권을 샀다. “당첨될까?”그는 흥분을 감추지 못하며 친구에게 물었다.“ 가능하지, 하지만 가능할까?”친구의 답이었다. 이 답은 무슨 의미일까?

우리는 일상생활에서 의미가 불확실한 언어를 자주 사용하면서도 별로 불편을 느끼지 않는다. 그러한 언어의 사용이 우리의 생활에 큰 영향을 미치지 않기 때문이다. 그러나 의사가 의료진단을 하거나 경영인이 사업과 관련된 의사결정을 해야할 때처럼 결과가 미치는 영향이 지대한 경우에 불확실한 언어의 사용은 자칫 위험을 초래할 수도 있다.

 

찬바람이 불던 늦가을 아침, K씨는 오전 중에 있을 중요 회의에 늦지 않으려고 일찍부터 서두르는 중이었다. 몸이 무거웠다. 열이 나는 듯도 하고 머리가 아픈 듯도 했다. 게다가 조바심까지 겹쳐선지 토할 것 같은 느낌마저 들었다. 감기인가, 아니면 독감? 그러다 그는 최근 외국인 바이어를 만났던 기억과 에볼라출혈열 뉴스를 떠올렸다. 혹시 에볼라? 발열과 두통, 구토는 감기와 독감 그리고 에볼라출혈열이 보이는 공통 증상이었다. 심지어 그가 만났던 외국인 바이어는 아프리카 출장을 다녀온 사람이었다.

 

이와 같은 상황에서 K씨는 에볼라출혈열에 감염되지 않았음을 확신할 수 있을까? 한국에서 에볼라출혈열에 감염될 확률은 매우 낮지만, 정말 감염됐다면 빨리 치료를 받지 않으면 목숨까지도 위태로운 일이다. 이와 같이 병의 진단은 확률에만 의존할 수는 없을 일이다.

 

예를 들어, 인기리에 방영되었던 드라마 <닥터 하우스>의 주된 이야기도 병의 진단에 따른 해프닝이다. 한 환자의 진단에 두 명의 의사만 손을 든 장면 <그림 1>에서 보듯이 <닥터 하우스>에 나오는 의사들의 진단 의견은 곧잘, 아니, 매번 갈린다. 의사의 진단에 따라 병을 치료하기 위해 큰 수술이 필요하다거나 부작용이 큰 치료가 불가피할 때, 바른 진단을 하지 못하면 병의 치료가 오히려 큰 화를 부를 수도 있다. 이와 같이 판단 결과가 미치는 영향이 큰 경우 신중한 판단이 요구되지만, 불확실한 상황에서의 판단은 매우 어렵다. 그래서 우리는 불확실성에 대한 분석과 그에 따른 이해방법을 필요로 한다.

 204-6·7-1

 

불확실성과 수학의 엄밀성

 

우리는 살아가면서 무수히 많은 선택을 하게 된다. 무엇인가 선택을 할 때는 나름의 선택 동기와 이유가 있기 마련이며 선택의 결과 또한 어느 정도 예상된다. 그럼에도 불구하고 우리의 선택이 항상 바른 선택이기를 기대할 수 있을까? 그렇지만은 않은 것 같다. 이유가 뭘까? 바로 불확실성(uncertainty)때문이다.

불확실성은 경제학, 물리학, 통계학, 철학, 심리학 등 다양한 학문 분야에서 제각기 다른 방식으로 다루어지는 개념이다. 불확실성은, 의사결정론과 통계학 전문가의 정의에 따르면, ‘지식의 부족으로 인해 발생하는 현 상태나, 미래에 발생할 결과를 설명하지 못하는 상태’를 뜻한다. 이러한 불확실성으로 우리는 예측 불가능성을 담고 있는 임의성(randomness)과 뜻의 명확한 경계의 부족을 뜻하는 모호성(vagueness)을 지목하고자 한다.

물이 가득 찬 물병 하나와 빈 물병 하나가 들어 있는 냉장고에서 꺼낸 물병에 물이 가득 차 있을까라는 질문에 “그럴 수도 있고, 아닐 수도 있다”라는 답을 할 수도 있다. 하지만 그답은 “모른다”와 별반 다르지 않다. 이는 어떤 물병이 선택될지 모르는 임의성으로 인해 발생하는 불확실성이다. 주사위를 던졌을 때 눈의 수가 얼마가 나올까라는 문제도 똑같다. 나올 눈의 수에 대한 기댓값이 3.5이긴 하지만, 실제로 3.5라는 눈의 수는 결코 나올 수 없다. 단지 반복 시행에 따른 결과의 평균이 3.5정도가 되리란 예상을 할 수 있을 뿐, 주사위를 단 한번만 던졌을 때 눈의 수가 얼마가 될지 우리는 전혀 알 수 없다. 이런 것이 임의성에 기인한 불확실성이다.

모호성은 상황이나 상태 또는 개념 등의 경계나 적용범위가 명확하지 않아서 발생하는 불확실성을 말한다. 예를 들어, ‘ 작다’라는 술어는 의미의 경계가 모호하여 불확실성을 발생시킨다. 그러한 불확실성을 고려하지 않는다면 ‘모든 모래더미는 작다.’라는 삼단논법적 역설을 주장할 수도 있다. 다시 말해, 작은 모래더미에 모래 한 알을 더해 만들어진 모래더미는 작다. 그런데 모든 모래더미는 하나의 모래알로 만들어진 ‘작은’ 모래더미에 모래알이 더해지길 반복하여 만들어진다. 그래서 모든 모래더미는 작다. 이와 같은 역설적 주장은 모래알이 더해짐에 따라 발생하는 ‘작다’의 의미의 퇴색을 무시해서 발생한다.

의료분야에서는 특히 이러한 의미의 경계가 모호한 술어로 빈번히 사용된다. 환자가 ‘늙었다’든가 ‘약하다’와 같은 술어가 그러하다. ‘혈압이 높다’고 할 때도 단지 수치가 높은 것만으로 혈압이 높다고 할 수는 없다. 평소 저혈압인 사람의 ‘혈압이 높다’와 평소 고혈압인 사람의‘혈압이 높다’는 분명 다른 의미일 것이고, 건강한 사람과 당뇨병 환자의 혈압을 같은정도로 ‘높다’라는 용어를 사용하는 것도 부적절할 것이기 때문이다. 또 수술환자에 투여할 마취제의 양도 환자의 나이나 체격조건, 건강 정도 등에 따라 적정량이 다를 수 있다.

이러한 불확실성의 원인으로 지목되는 임의성과 모호성을 포함하는 개념을 수학으로 다루기 위해서는 이들 개념을 수학화할 필요가 있다. 확률론은 반복 시행에 따라 발생하는 결과의 임의성에서 생기는 불확실성을 모델링한다. 불확실성을 다루는 수학 모델로서 확률론은 상당한 성공을 거두었다고 평가된다. 그럼에도 불구하고, 문제에 내재된 어떤 성질은 확률론으로는 잘 설명되지 않을 때가 있다. 복권의 당첨 가능성을 묻는 질문에 “가능(possible)하지, 하지만 가능(probable)할까”라는 답이 말하듯이, 복권에 당첨되는 일은 발생 가능하다. 하지만 확률이 너무 작아 발생한다고 믿기 어렵다. 그럼에도 불구하고 사건의 발생에 의한 영향이 매우 크다면 그 사건을 그냥 무시할 수는 없을 것이다.

미국 캘리포니아 주립대학교(버클리 소재) 전기공학과 교수 자데(L. Zadeh)는 모호함으로 인해 발생하는 불확실성을 다루기 위한 방법으로 1965년에 퍼지 집합을 소개하고, 1978년에 퍼지 집합을 기초로 한 개연론(蓋然論, possibility theory)을 소개하였다. 자데는 ‘자연 언어에 내재되어 있는 부정확함은 본질적으로 확률론보다는 개연론으로 다루어져야 한다.’고 주장하면서, 자연 언어에 담긴 의미를 개연론을 이용하여 양적으로 표현하고자 하였다.

 

확률론

 

확률은 어떤 사건의 발생 가능성 정도나 불확실한 사실에 대한 주장의 확신 정도 등을 측정하려는 방법으로 고안되었다. 확률론(probability theory)은 수학뿐만 아니라 물리학을 포함한 과학, 통계, 경제 및 금융, 인공지능을 포함한 컴퓨터 과학, 철학 등의 분야에서 복잡한 현상을 이해하기 위한 중요수단으로 널리 응용된다.

확률론은 17세기에 페르마(P. Fermat)와 파스칼(B. Pascal)에 의해 처음 개발된 것으로 알려져 있다. 하지만 유사한 개념이 이전에도 거론되었고, 수학적인 접근은 18세기에 베르누이(J. Bernoulli)와 드무아브르(A. deMoivre) 등에 의해 전개되었으며, 현대적 확률론은 20세기 초반에 콜모고로프(A. Kolmogorov)에 의하여 정립되었다.

확률론의 개념적 기본 구조는 간단하다. 특히 확률의 기본개념은 ‘전체’에 대한 ‘부분’의 비교라고 말할 수 있다. 주어진 문제 상황에서 발생 가능한 모든 상태의 집합을‘전체’로 잡는데, 그 집합을 표본공간이라 부르고 Ω로 나타내기로 하자. 그리고 ‘부분’은 Ω의 부분집합을 의미하며 ‘사건’이라고 부른다. 사건 Α의 발생 확률은 Ω위에 정의된 확률분포함수ƒ:Ω→[0,1]을 이용하여 설명할 수 있다. 이해의 편의를 위해 Ω를 유한집합으로 한정하기로 하자. 그러면 함수ƒ는 모든 x∈Ω에 대하여 0≤ƒ(x)≤1과 Σƒ(x)=1을 만족시키는 함수로 주어진다. 이때 ƒ(x)가 상태 x의 발생 가능성, 즉 확률을 의미한다. 그러면 사건 Α의 발생 확률은

 05-1

로 정의된다. 확률분포함수의 조건으로부터 각 사건 Α의 발생 확률이 0≤Ρ(Α)≤1이고, Ρ(ø)=0, Ρ(Ω)=1, 그리고 Α와 Β가 배반사건, 즉 Α∩Β=ø 일 경우, 확률의 합의 공식 

Ρ(Α∪Β)=Ρ(Α)+Ρ(Β)

를 만족시킴을 확인할 수 있다. 여기서 Β를 Α의 여사건 A로 두면, 이 성질은

 05-2

로 표현되는데, 이는 배중률, 즉 ‘사건 Α와 여사건 Α는 결코동시에 발생할 수 없음’을 의미한다. 연못의 물 표면의 물 분자가 때로는 수증기가 되어 연못물에 속하기도 하고 그렇지 않기도 하듯이 경계가 모호한 상황은 배중률이 잘 들어맞지 않아 확률론으로 다루기에는 부적합하다.

 5-6

 

 개연론: 개연성과 필연성

 

임의성으로 인한 불확실성을 다루기 위해 고안된 수학이 확률론이라면, 개연론은 모호성으로 인한 불확실성을 다루기 위한 수학이라 할 수 있다. 반복 시행에 따른 사건의 발생 빈도 보다 하나의 개별 사건에 대한 의미를 파악하기 위해서는 그사건이 가지는 의미의 정도를 아는 것이 더 바람직할 수 있다. 개연론이 바로 그 역할을 제공한다.

개연론은 완성된 이론이라기보다는 연구가 진행 중인 이론이다. 1978년에 자데가 개연론을 소개한 이후 드부아(D. Dubois)와 프라데(H. Prade)가 개연성(possibility) 외에 필연성(necessity)의 개념을 소개하였고, 보다 체계적인 이론확립을 위한 학자들의 연구가 계속되고 있다.

개연론은 모호한 지식을 수치로 표현하기 위해 개연성과 필연성으로 불리는 두 개의 집합 함수를 도입한다. 확률론에서처럼 어떤 ‘의미’를 주기 위해 필요한, 가능한 상태들의 전체 집합을 Ω로 나타낸다. 여기서도 편의상, Ω를 표본공간이라 부르고, 그의 부분집합 Α를 사건이라 부르자. 먼저 각 상태 x∈Ω에 의한 개연성의 정도를 0≤π(x)≤1로 주는 개연성분포함수 π:Ω→[0,1]를 정의한다. 그리고 사건 Α의 개연성을

Π(Α)=max{π(x)|x∈Α}

로, Π(ø)=0으로 정의한다. 또한 개연론의 이해를 쉽게 하기 위해, π(x0)=1을 만족시키는 상태 x0∈Ω가 존재한다고 가정하자. 그러면 개연성의 최댓값 공리

 Π(Α∪Β)=max{Π(Α), Π(Β)}

가 성립되고, Π(Ω)=1이 된다.

개연성의 쌍대적(dual) 개념인 사건 Α의 필연성은

 05-3

로 정의된다. 그러면 필연성은 결국

Ν(Α∩Β)=min{Ν(Α), Ν(Β)}

와 같은 성질을 만족시킨다. 사건 Α의 개연성과 필연성은 각각 Α의 주어진‘의미’에 대한 낙관적 믿음 정도와 회의적 믿음 정도를 나타낸다.

개연론에서는 확률론과는 달리 Π(Α)와 Π(Α)가 독립적으로 결정되어 한 사건과 여사건이 동시에 발생함도 가능하게 된다. 실제로 개연론의 이 성질은 합의 성질에 제약을 받지 않기 때문에 불확실성에 대한 인식이나 믿음을 양적으로 표현할 때 매우 유용하다.

 

개연론의 적용 사례: 의료 진단

 

개연성과 필연성의 의미를 보다 구체적으로 이해할 수 있도록, 앞에서 언급했던 K씨의 사례에 개연론을 적용해보기로 하자. K씨는 열이 나고 두통이 느껴지며 심지어 구토감까지 있다는 생각에 에볼라출혈열의 감염을 의심하였다. 에볼라 감염의 개연성과 필연성을 구하기 위해 표본공간 Ω를

 05-4

와 같이 설정하자. 그리고 에볼라출혈열의 감염에 대한 개연성분포함수 π:Ω→[0,1]를

 

π(ø)=0, π({두통})=0.1,

π({열})=0.2, π({구토})=0.3

π({열, 두통})=0.4, π(두통, 구토})=0.6,

π({열, 구토})=0.8, π(열, 두통, 구토})=1

 

로 잡자. 이때 π(x)는 x가 에볼라출혈열의 증상으로 믿어지는 정도를 의미한다. 또 {열}과{두통}의 증상과 {열, 두통}의 증상의 차이는 일종의 동시성에 의한 차이로 이해하자. 열과 두통의 증상이 따로 발생한 것으로 여겨지면 따로 쓰고, 열과 두통이 하나의 원인에 의한 증상으로 여겨지면 같이 묶어 쓴다. K씨의 경우, 열과 두통이 같이 온 듯도 하고 아닌 듯도 하며, 구토감은 따로 느낀 듯하기에, K씨의 증상을 하나의 사건 Α로

Α=({열}), {두통}, {구토감}, {열, 두통})

 과 같이 설정한다. 그러면

 05-5

이 나온다. 그러므로 K씨의 에볼라출혈열의 감염에 대한 개연성은 0.4이지만 필연성은 0으로, K씨가 에볼라에 감염되지 않았을 것으로 추정 또는 진단함이 적절해 보인다.

 

서로 돕는 확률론과 개연론

 

어떤 사건의 발생 빈도 또는 발생 가능성의 정도보다는 아무리 드물게 발생한다고 해도 그 사건의 발생 자체가 중요한 경우에는, 이를 진단하는 것이 매우 중요한 문제가 될 수 있다. 의사가 증상에 따라 병을 진단하거나 프로파일러가 흔적을 조사하여 범인을 진단하는 것 등이 이에 해당한다. 이러한 경우, 증상이나 흔적이 주는‘의미’가 모호하기에 개연론의 적용이 바람직하다. 개연론이 확률론을 대치한다거나 더 좋은 수학이라는 말은 아니다. 확률론은 이미 불확실성에 대한 훌륭한 이해 방법을 성공적으로 제공해 왔다. 그러나 확률론은 모호성에 의한 불확실성에 대한 인식 문제의 해결에는 다소 제한을 갖는다. 확률론과 개연론은 서로의 부족함을 보완하는 서로 돕는 수단으로 볼 수 있다.

개연론을 적용하거나 응용하기 위해 문제에 따른 표본공간을 설정하고 개연성분포함수를 결정하는 데에는 상당한 전문 지식이 요구된다. 빅데이터의 활용과 고성능 컴퓨터를 이용한 정보시스템으로 인하여 의사결정이나 인공지능, 전문가시스템의 개발 등에 개연론의 효과적인 활용이 점차 확대될 것으로 여겨진다.

 확률론과 개연론 그리고 통계학까지 함께 이용하여 불확실성의 문제를 이해하고‘의미’를 진단하며 문제를 해결하는 훌륭한 수학과 그의 응용이 더욱 잘 개발되기를 기대한다.

 

고영미 / 수원대학교 수학과

*그림 및 사진 설명

<그림 1> 병의 진단을 위한 의사들의 논의 장면-<닥터 하우스> 중에서

<표 1> 확률론과 개연론의 비교(Ω를 유한집합임으로 가정)

작성자: khugnews

이글 공유

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다