확률을 바라보는 베이지언과 빈도주의학파간의 관점 차이를 예시를 통해 알아보자.
외관상 구분이 불가능한 항아리 A, B가 있다. A에는 9개의 하얀공, 1개의 검정공이, B에는 8개의 검정공, 2개의 하얀공이 들어있다. 특정 항아리에서 공을 꺼냈을 때 그것이 검정공이었다면 그 항아리는 A인가 B인가?
이 질문에 대한 빈도주의자의 답은 다음과 같다. 아 그들은 시작전에 이 명제를 깔고 들어간다. "만약 특정 수준을 만족한다면 틀린 추정을 할 리스크를 감내한다" 이들의 선택은 그 자체가 확정적인 리스크는 아니지만 방법론이 리스크를 내포하고 있다.
그들은 당연히 해당 항아리가 B라고 말한다. 만약 B에서 우리가 10번 공을 뽑는데, 8개의 검정공과 2개의 하얀공이 나왔다고 가정하자. 우리는 검정공이 나올때는 B라고, 하얀공이 나올때는 A라고 추론할 것이다. 그러면 우리의 추론이 틀릴 가능성은 20%다. 빈도주의자들은 추론에 있어서 틀릴 확률을 감내한다. 그들의 추론 프로세스는 다음과 같다.
첫째, 귀무가설 A를 설정한다. 해당 사례에선 "항아리 A다"이다.
둘째, 대립가설 B를 설정한다. "항이라 B다"이다.
셋째, 귀무가설 A를 채택하느 경우 검정색 공이 뽑이는 사건은 그 확률이 매우 낮다. 우리는 이 확률 정도로 유의수준을 설정한다. 참고로 유의수준은 1종오류의 확률이기도 하다.
넷째, 만약 검정공이 뽑혔다면 이는 유의수준에 어긋나는 상황이기 때문에 귀무가설을 기각하고 대립가설을 채택한다.
다섯째, 만약 흰색 공이 뽑혔다면 유의수준에 걸리지 않기 때문에 귀무가설을 채택한다.
가령 실제로는 A 항아리인데, 거기서 검정공이 10%의 확률로 뽑혀 10%의 유의수준을 넘어서는 일이 발생했다고 가정하자. 이 경우 우리는 네번째 단계에 의거해 B 항아리라고 추정하게 된다. 그러나 그 추정은 그릇된 것이기 때문에 1종오류를 저지른게 된다. 따라서 빈도주의적 관점에서 추론은 방법론적 차원에서 리스크를 감내한다고 말할 수 있다.
해당 예시를 이제 베이지언 관점을 통해 확인해보자.
공을 뽑아서 확인하는 행위(data) 없이는 A인지 B인지 알 수 없다. 따라서 prior prob P(A)를 0.5로 설정한다. 만약 data = black ball 이라면 우리는 white의 가능세계를 제외시켜버린다. 이 때 P(B|Black)는 89%, P(A|Black)은 11%다. 항아리가 B라고 추론하는 것이 더 합리적으로 보인다.
베이지언은 결코 "항아리 B다"라고 단정적으로 말하지 않는다. 그저 given data black일때 B일 확률이 89%라고 말할 뿐이다. 그 선택은 시장에 달려있다. 그러나 B를 선택할 경우 선택하자마자 11%의 확률로 틀릴 가능성이 생긴다. 빈도주의학파와는 달리 선택과 동시에 리스크가 발생하는 것이다.
몬티홀 문제도 베이지언의 관점에서 해결할 수 있다.
내가 A를 선택했을 때, 실제 자동차의 위치를 A,B,C로 나눠 수형도를 그려보면 4가지의 가능세계가 존재한다.
만약 호스트가 B를 열었다면(data), 가능세계는 (A&B)와 (C&B)로 좁혀진다. 그런데 전자와 후자의 비율이 1 : 2니까 나는 C로 선택지를 변경하는 것이 더 합리적이다.
'수학 > 통계학' 카테고리의 다른 글
[확률론] (1) Probability and Counting (0) | 2022.01.31 |
---|---|
[베이즈통계] (3) 베이즈추정은 정보를 얻을수록 더 정확해진다 (0) | 2022.01.26 |
[베이즈통계] (1) 정보의 획득이 확률을 바꾼다 (0) | 2022.01.26 |
[경제수리통계학] 8. Large Sample Theory (0) | 2021.12.21 |
[경제수리통계학] 7. Sampling distribution: univariate (0) | 2021.12.09 |