이전 글에 이어서 Counting을 얘기해보자.
10명의 사람을 4명, 6명으로 그룹화짓는 짓는 경우의수는 몇가지인가? 이는 10C4(=10C6)이다. 왜냐하면 첫번째 그룹을 선택함으로 인해 그 나머지가 두번째 그룹으로 자동 형성되기 때문이다. 그러나 5명, 5명으로 나누는 경우는 다르다. 첫번째 그룹의 5명을 선택할 때 마찬가지로 두번째 그룹이 생성되는데, 이 그룹은 서로 차별점이 없다.
예를 들어 ABCDE를 고르면 나머지 FGHIJ는 두번째 그룹으로 자동생성되는데, 이 때 첫번째 그룹을 고르기 위한 10C5에 FGHIJ가 그대로 포함되기 때문에 double-counting의 이슈가 발생한다. 따라서 우리는 10C5 / 2를 해줌으로서 double counting을 해소할 수 있다.
이제 이 표에서 다루지 않은 것은 우측상단의 복원추출 & 순서상관X 의 경우 밖에 없다. 이를 살펴보자.
k=0이라면 우리는 n개의 물건 중 그 아무것도 뽑지 않는 경우다. '뽑지 않는 경우'는 한 가지이니 n-1C0=1이다.
k=1이라면 n개의 물건을 한 번 추출하는 경우니 nC1=n임을 알 수 있다. 극단적인 case를 통해 이 문제에 대한 감을 잡아가는 과정이지만 이 두 극단적 case는 그닥 좋은 직관을 주진 못하고 있다. 다음을 살펴보자
n=2인 경우를 살피면 k+1Ck=k+1이 나온다. 이는 잘 생각해보면 2개의 물건이 존재하는데 이 물건을 복원추출하여 k번 뽑는 경우이다. 가령 검은공, 흰공이 들어있는 상자가 있는데 이 상자에서 우리는 k번 복원추출을 진행한다. 그리고 그 순서는 중요하지 않고 무슨공이 몇개 나왔는지만 고려하는 경우다. 이 때 우리는 이 문제를 다음과 같이 치환하여 직관적으로 받아들일 수 있다.
이 문제는 사실 공이 k개가 존재하고 이 공을 서로 구분되는 두개의 박스에 집어넣는 경우와 똑같다.
복원추출이기 때문에 흰공, 검정공은 최대 k번, 최소 0번만큼 뽑힐 수 있고, 그 순서는 전혀 상관이 없기 때문에 '횟수'를 class인 Black/White에 분배하는 것과 똑같다.
이는 한번 더 생각해보면 k개의 dot이 존재하고 n-1개의 bar이 존재하여 이들의 순서를 배열하는 것과 똑같다. 가령 상자 속에 빨/주/노/초의 공이 존재하고, 이를 6번 복원추출하여 각 공이 나오는 횟수를 기록하여 그 경우의 수를 따지고 싶다고 가정하자. 우리는 3(4-1)개의 bar과 6개의 dot을 순서에 맞게 잘 배분하는 경우를 푸는것과 똑같기 때문에 9C6이 그 경우의수로 도출된다.
이처럼 복잡한 경우의수 문제도 대수적으로 풀어내는 것이 아니라 특정 사건을 가정하여 이야기로 풀어내면 직관적으로 이해하기 편하다. 위 그림의 ex2의 경우 직관적으로 와닿지 않는데 concrete한 예시와 함께라면 이해가 쉽다.
nCk는 n명 중 k명을 추출하는 경우의 수다. 그리고 k는 추출된 인원 중 한명을 의장으로 내세우는 경우의 수이니 둘을 곱하면 경우의수가 도출된다. 그런데 사실 이는 n명 중 한명을 의장으로 뽑고, 나머지 n-1명 중 k-1명의 인원을 추출하는 사건과 동일한 것이다.
또한 m+nCk는 ∑mCj nCk-j와 같다. 이를 우리는 Vandermonde라 부르며 자주 활용한다.
이 또한 직관적으론 이해가 쉽지 않은데 예시와 함께라면 이해가 편하다. m=3인 그룹과 n=5인 그룹을 합하여 k=5명을 선발하는 경우의 수는 3+5C5다. 그런데 이는 m=3 그룹에서 j=0,1,2,3을 선발하고 n=5그룹에서 k=2,3,4,5명을 선출하는 경우의 각 합들과 같은 것이다.
이전 글에서 확률에 대한 naive한 정의를 살펴봤다. 그 때 우리가 정의한 확률이란 특정사건 / 모든사건 이었다.
이젠 확률에 대해 non-naive하게 정의내려보자. 확률이란 Sample Space와 함께 Probability Space를 구성하는 한 요소다. 이 때 확률(P)는 Sample Space의 부분집합인 특정 event A를 input으로 수용하고, [0,1] 사이의 수를 output으로 도출하는 함수가 된다.
이 P는 다음의 조건을 충족해야만 '확률'이 된다.
첫째, P(ø)=0, P(S)=1이다. ø는 사건이 발생하지 않았음을 뜻하기 때문에 그 확률이 0이 됨은 자명하다. P(S) 또한 전사건 중 전사건의 확률이기 때문에 1이 되는 것은 자명하다.
둘째, 만약 Sample Space의 Subspace로서의 event들이 서로소집합이라면, 모든 event의 합집합 즉 가산무한합사건의 확률은 그 각각의 확률을 더한 값과 같다.
'수학 > 통계학' 카테고리의 다른 글
[확률론] (4) Conditional Probability (0) | 2022.01.31 |
---|---|
[확률론] (3) Birthday Problem, Properties of Probability (0) | 2022.01.31 |
[확률론] (1) Probability and Counting (0) | 2022.01.31 |
[베이즈통계] (3) 베이즈추정은 정보를 얻을수록 더 정확해진다 (0) | 2022.01.26 |
[베이즈통계] (2) 방법론의 리스크 vs 선택의 리스크 (0) | 2022.01.26 |