본문 바로가기
  • Fearless
수학/통계학

[확률론] (5) Conditional Independence

by Albatross 2022. 2. 1.
반응형

조건부확률과 관련하여 보편적으로 저지르는 실수 세가지를 확인해보자. 

첫째, P(A|B)와 P(B|A)를 헷갈리는 것이다. 이를 '검사의 오류'라 부른다. 여담으로 변호사도 저지른다. 

대표적인 사례를 통해 이해하는 것이 빠르다. 20세기 영국에 Sally Clark라는 여성이 있었는데 그녀의 두 아이들이 죽었고 그녀는 살해죄로 기소당했다. 검사는 그녀가 결백하다고 가정했을 때, 두 아이가 미스테리하게 죽을 확률이 1/8500이라고 주장했다. 게다가 두 아이 모두 죽었으니 그 확률은 P(dead|innocent)=1/8500의 제곱이니 극히 드물다고 말했다.

그러나 이는 두가지의 오류를 범하고 있는 것이다. 첫째, 우리는 그녀의 두 아이가 죽은 상황에서, 그녀가 무죄일 확률, 즉 P(innocent|dead)를 구해야한다. 이는 Bayes Thm에 의하면, P(innocent|dead) = P(dead|innocent)P(innocent)/P(dead)로 풀이된다. P(dead|innocent)가 검사의 주장대로 매우 낮지만, P(innocent)가 이를 상쇄할 정도로 매우 높기 때문에 P(innocent|dead)는 매우 높은 확률이었을 것이다. 이렇게 조건부확률을 계산할 때 사건간 선후관계를 잘 판단해야 원하는 값을 얻을 수 있다. 

여담으로 그녀는 이러한 검사의 논증을 바탕으로 징역형을 선고받았으나 그녀는 무죄였고 수년간의 옥살이 후 석방되었으나 죽게되었다. 

 

둘째, 사전확률인 P(A)와 사후확률인 P(A|B)를 혼동하는 경우다. 가령 event A가 발생했다는 확률을 P(A)=1로 적는 이들이 존재한다. 이는 conditional prob에서의 조건으로써 작용하는 것이 아니기 때문에 P(A)는 1이 아니다. 만약 P(A|A)을 얘기한다면 이는 1이 맞다. 

 

셋째, Conditional Independence와 Independence를 혼동하는 경우다. 

우선 Conditional independence의 정의를 확인할 필요가 있다. event C가 주어졌을 때 event A, B는 위 식을 충족할 때 t상호간의 조건부 독립 관계라 일컫는다. 

조건부독립을 둘러싼 혼돈은 다음과 같다. event A,B가 조건부독립 관계면 이들은 독립인가? 답은 아니요다. 

만약 상대전적과 기량을 알 수 없는 낯선이와 체스를 둔다고 가정해보자. 그와 여러판 붙어봤고 이전 판이 다음판의 결과에 미치는 영향력은 없다(indepent and identically distributed)고 가정한다. 만약 내가 내리 3판을 이겼다면(event C), 상대의 실력을 어느정도 가늠할 수 있게되고 따라서 그 이후로의 게임들에서 내가 이길 확률은 서로 조건부 독립의 관계에 놓인다. 그러나 3판을 하면서는 independent라고 할 수 없는 것이 이 사람이 첫판 진것이 실수해서 진건지 실력이 없어 진건지 잘 모르기 때문이다. 따라서 이 사람과 게임해서 내가 이길 승률을 명확히 판단할 수 없다. 

다음 질문은 독립적이면 항상 조건부 독립적인가?라는 질문이다. 답은 아니요다. event A가 화재알람이 울리는 경우로, F는 실제 화재가 발생한 경우, C는 팝콘 튀기다 울리는 경우로 설정하자. F와 C는 서로 independent하다고 가정하고 서로 complement의 관계에 놓여있다. 이 때 P(F and C | A) != P(F|A)P(C|A)이기 때문에 둘이 독립적이더라도 항상 조건부 독립인 것은 아니라고 말할 수 있다. 

 

Bayes Thm은 다음 이전 포스팅(https://alba-tross.tistory.com/58)으로 대체한다. 

 

Bayes Thm의 핵심은 반복을 통해 실제확률에 다가선다는 점이다. 이 또한 예전에 다룬 포스팅(https://alba-tross.tistory.com/60)으로 대체한다. 

반응형