어떤 내기
평경장: 고니야, 우리 심심한데 내기 한번 할까? 여기 주사위를 던져서 짝수가 나오면 네가 백 원을 가져가는 거야. 나도 그냥 잃기만 할 수는 없으니까 입장료로 백 원만 받자.
고니: 입장료가 너무 비싼 거 같은데요.
평경장: 그래? 얼마를 받으면 좋겠니?
고니: 한 십 원만 받으세요.
평경장: 그건 안 될 말이지… 이렇게 하면 공평하지 않을까? 짝수가 나왔을 때 네가 받을 돈이 \(S\)원이라고 해두고 나는 입장료로 \(pS\)를 받을 거야. 이 비율 \(p\)는 네가 정하고 \(S\)는 내가 정한다. 그다음에 주사위를 던지자.
고니: 그럼 제 말은 \(S=100\)인 상황에서 전 \(p=0.1\)이라는 거죠.
평경장: 고니 네가 \(p\)를 정하고 나면 그때 내가 \(S\)를 정할 거야. \(S\)는 음수일 수도 있어. 마이너스 백 원처럼.
고니: 마이너스는 무슨 뜻인데요?
평경장: 주고받는 사람이 바뀐다는 뜻이지. \(S=-100\)일 때 짝수가 나오면 네가 나한테 \(|S|=100\)원을 주는 거야. 나는 입장료로 너에게 \(|pS|=10\)원을 주는 거고.
고니: 무슨 내기를 그렇게 복잡하게 해요?
평경장: 돈으로 돈 먹는 거는 똑같은 원리다. 자, 어떻게 할래?
글쎄, 어떻게 하는 것이 좋을까? 사실 정답이 없는 문제이다. 주사위가 공평하게 구를 거라는 보장도 없고 말이다. 그렇지만 어떤 선택은 확실히 손해를 끼친다. 예컨대 \(p\)가 1보다 크면 안 된다는 건 분명해 보인다. 입장료 천 원을 내고 기껏 백 원을 노리겠다는 건 이상하니까 말이다. \(p\)를 음수로 택할 수도 있을까? 그렇다. 하지만 좋은 결정이 아닌 것이, 예컨대 \(p=-0.1\)일 때 평경장도 \(S=-100\)으로 음수를 택하는 경우를 상상해보자. 입장료는 \(pS=+10\)이어서 양수이므로 원래대로 고니가 평경장에게 10원을 지불하면서 내기에 들어가고, 여기에 짝수가 나오면 \(S=-100\)여서 고니가 평경장에게 100원을 더 줘야 한다. 그러니까 홀수가 나오면 평경장이 10원을 받고 짝수가 나오면 110원을 받는, 일방적으로 한쪽에 유리한 내기란 뜻이다.
주사위를 던져서 7이 나오는 경우에 돈을 받는 내기라면? 이런 내기에는 \(p=0\)을 할당하여 입장료를 한 푼도 내지 않는 쪽이 합당해 보인다. 마찬가지 논리로, 확실히 일어날 사건에는 \(p=1\)을 주어서 본전을 지켜야 할 것이다.
좀 더 일반적으로 여러 개의 사건을 두고 내기를 설계할 수도 있다. 간단한 예로 어떤 특정한 눈이 나오는 사건이 \(E\), 그 이외의 눈이 나오는 사건이 \(\overline{E}\)라 하고 각 사건이 일어났을 때의 상금을 \(S_{E}\)과 \(S_{\overline{E}}\)라고 하자. 내기의 입장료는 \(p(E) S_{E} + p(\overline{E}) S_{\overline{E}}\)로서, \(p(E)\)과 \(p(\overline{E})\)는 고니가 결정하고 \(S_E\)와 \(S_{\overline{E}}\)는 평경장이 결정한다. 주사위를 던졌을 때 나오는 경우는 이렇게 두 가지뿐이다:
- \(E\): 지정해놓은 눈이 나옴. 고니가 얻는 액수는 \(G_{E} = S_{E} – p(E) S_{E} – p(\overline{E}) S_{\overline{E}}\).
- \(\overline{E}\): 다른 눈이 나옴. 고니가 얻는 액수는 \(G_{\overline{E}} = S_{\overline{E}} – p(E) S_{E} – p(\overline{E}) S_{\overline{E}}\).
위의 이야기를 행렬로 표현하면 다음과 같다:\[
\begin{pmatrix}
G_{E} \\ G_{\overline{E}}
\end{pmatrix}
=
\begin{pmatrix}
1-p(E) & -p(\overline{E})\\
-p(E) & 1-p(\overline{E})
\end{pmatrix}
\begin{pmatrix}
S_{E} \\ S_{\overline{E}}
\end{pmatrix}
=P \begin{pmatrix}
S_{E} \\ S_{\overline{E}}
\end{pmatrix}.
\]이 식의 의미는 상당히 무시무시한데, 고니가 정한 \(p(E)\)와 \(p(\overline{E})\)가 있을 때, 평경장이 마음대로 좌변을 음수로 정한 다음 (예를 들어 \(G_{E}=-100\)과 \(G_{\overline{E}} = -200\)처럼) 그에 해당하는 \(S_E\)와 \(S_{\overline{E}}\)를 계산해서 부르면 고니로부터 늘 100원 또는 200원을 야금야금 빼앗아올 수 있다는 뜻이다. 단, 여기에는 예외가 있는데 위 \(2\times 2\) 행렬 \(P\)의 역행렬이 존재하지 않을 때이다. 따라서 고니는 평경장이 \(S_E\)와 \(S_{\overline{E}}\)를 계산할 수 없도록 하기 위해 다음 조건을 만족하는 \(p(E)\)과 \(p(\overline{E})\)를 택해야 한다:\[ \det P = 1-p(E)-p(\overline{E}) = 0. \]다시 말해 \(p(E)\)와 \(p(\overline{E})\)로 무슨 값을 넣든 둘의 합이 1이 되지 않으면 고니에게 굉장히 불운한 일이 벌어질 것이다. 위 논법을 조금 확장함으로써, 함께 일어날 수 없는 사건 \(E_1\)과 \(E_2\), 그리고 둘 중의 뭐라도 일어나는 사건 \(E=E_1 \cup E_2\)에 대해 내기가 걸려있다면 내기의 참가자는 \(p(E) = p(E_1) + p(E_2)\)를 만족시켜야만 한다는 결론도 얻을 수 있다.
함께 일어날 수 있는 사건들에 대해서도 뭔가 말할 수 있을까? 사건 \(A\)와 \(B\)가 있을 때 다음의 세 가지를 두고 내기를 만들어보자:
- 사건 \(B\)가 일어날지의 여부
- \(B\)가 이미 일어난 조건 하에서 \(A\)가 일어날지의 여부 (\(A|B\)로 표시)
- \(A\)와 \(B\)가 둘 다 일어날지의 여부 (\(A \cap B\)로 표시)
각 경우의 상금 \(S_B\)와 \(S_{A|B}\), 그리고 \(S_{A\cap B}\)이 있고, 이 내기에 응하기 위한 입장료가 \(p(B)\)와 \(p(A|B)\), 그리고 \(p(A\cap B)\)에 의해 정해진다고 하자.
- 첫째, 만일 사건 \(B\)가 일어나지 않으면 \(A|B\)에 대해선 내기가 성립하지 않아서 해당 입장료 \(p(A|B) S_{A|B}\)를 고니에게 돌려준다. 그래서 이때 고니는 나머지 두 부분에 대해서만 지출을 했기 때문에 \[ G_{\overline{B}} = -p(B) S_B – p(A\cap B) S_{A \cap B} \] 처럼 쓸 수 있다.
- 둘째, \(B\)는 일어났지만 \(A\)가 일어나지 않았다고 해보자. 그럼 \[ G_{\overline{A}|B} = S_B – p(B) S_B – p(A|B) S_{A|B} – p(A\cap B) S_{A \cap B} \]만큼을 가져갈 것이다.
- 마지막으로, \(A\)와 \(B\)가 둘 다 일어난다면, 고니의 몫은 이렇다: \[ G_{A \cap B} = S_B + S_{A|B} + S_{A\cap B} -p(B) S_B -p(A|B) S_{A|B} -p(A\cap B) S_{A \cap B}.\]
위에서 했던 것처럼 이 식을 \(3 \times 3\) 행렬 \(P\)를 써서 정리하고 \(P\)의 역행렬이 존재하지 않게끔 하면 이런 관계식을 얻는다: \[ 0 = \det P = p(A|B) p(B) – p(A\cap B).\]
내기의 교훈
그러고 보니 이런 종류의 내기에서 언제나 손해 보는 일을 피하려면 입장료를 결정하는 \(p\)라는 양이 다음의 조건들을 만족해야만 하는 모양이다:
- \(0 \le p \le 1\): 0부터 1까지의 값을 가질 수 있어서, 확실하게 일어난다고 보는 사건에는 1, 불가능하다고 보는 사건에는 0을 지정한다.
- \(p(E_1 \cup E_2) = p(E_1) + p(E_2)\): 같이 일어나지 않는 사건들에 대해서는 더해지고
- \(p(A \cap B) = p(A|B) p(B)\): 같이 일어날 수 있는 사건들에 대해서는 하나를 조건으로 사용해 곱으로 쪼갤 수 있다.
이는 우리가 확률이라 부르는 대상도 가지고 있는 성질들이다. 그러나 우리가 보통 아는 확률 개념하고도 조금 다른 게, 이 \(p\)는 자기 마음 내키는 대로 부르는 값이기 때문에 (위에서 이야기한 몇 가지 주의사항만 지킨다면) 하나의 사건에 대해 사람마다 다른 값을 부른다고 해서 잘못된 일이 아니다. 또 주사위를 여러 번 던져보고 평균빈도를 세어 정의하는 양이 아니기 때문에, 다시는 반복되지 않을 단 한 번의 내기에 대해서도 무리 없이 정의된다. 그래서 이것을 전통적인 확률과는 구분을 해주기 위해 ‘주관적’ 확률이라고도 부른다.
지금까지 소개한 것은 내기의 관점에서 확률론의 규칙들을 유도할 수 있다고 드 피네티Bruno de Finetti가 제시한 ‘네덜란드식 마권Dutch book‘ 논법이다.1 여기에서 말하고자 하는 바는, 확률론이 실은 손해 보지 않는 베팅을 위해 지켜야 할 규칙에 다름 아니며 그런 의미에선 논리학의 확장판으로도 볼 수 있다는 것이다.2
그럼 거꾸로 확률론의 기본 규칙을 따라서 내기에 응하는 사람에게는 일방적으로 손해를 입히는 일이 정말 불가능할까? 그렇다고 알려져 있다. 이것이 소위 ‘역逆 네덜란드식 마권 논법’인데 일반적인 증명 대신 앞의 예들을 가져와 보자.
- 어떤 일이 일어나는 사건 \(E\)와 일어나지 않는 사건 \(\overline{E}\)에 내기가 걸려있고 고니가 얻을 수 있는 액수는 각 경우에 \(G_E\)와 \(G_{\overline{E}}\)일 때, 고니가 \(p(E)+p(\overline{E})=1\)을 유지하면서 베팅한다면 언제나 \(p(E) G_E + [1-p(E)] G_{\overline{E}} = 0\)라는 관계식이 성립함을 보일 수 있다 (계산은 생략). 따라서 \(p(E)\)가 0과 1 사이에 존재하는 한, \(G(E)\)와 \(G(\overline{E})\)가 동시에 음수일 수는 없다.
- 역시 계산은 생략하지만, 마찬가지의 방법으로 다음을 보일 수 있다: 사건 \(A\)와 \(B\)에 대해 \(p(A\cap B)=p(A|B)P(B)\)의 관계를 지키고 모든 \(p\)가 0부터 1까지의 값을 가지게끔 베팅하는 사람에게는 \(G_{\overline{B}}\), \(G_{\overline{A}|B}\), \(G_{A\cap B}\)를 모두 음수로 만드는 것이 불가능하다.
본 것으로부터 추론하기
이제 앞에서 얻은 식 하나를 조금 활용해보자. 위에서 두 사건 \(A\)와 \(B\)에 대해
\[ p(A|B) = \frac{p(A\cap B)}{p(B)} \]라는 식을 적었는데, 우변의 분자에서 \(A \cap B\)는 \(B \cap A\)와 같은 말이다. ‘\(A\)와 \(B\)가 둘 다 일어나는 사건’은 ‘\(B\)와 \(A\)가 둘 다 일어나는 사건’과 같은 것이니까. 그리고 \(p(B \cap A)\)에 대해서는, \(A\)를 조건으로 사용해서 \(p(B \cap A) = p(B|A) p(A)\)처럼 쓸 수 있다. 즉,
\( p(A|B) = \frac{p(B|A) p(A)}{p(B)}. \)
로서 이를 ‘베이즈Bayes의 규칙’이라 부르자. 이 식을 쓰면 관찰 결과를 추론 안에 정량적으로 집어넣을 수 있다: 예를 들어 고니는 평경장의 주사위가 조작된 것인지 아닌지 궁금하다. 고니가 평경장의 평소 성향으로 미루어보건대, 이 주사위가 공평한 것일 수도 있지만 자신을 놀리려 홀수만 나오는 주사위를 가지고 왔을 가능성도 절반은 되는 것 같다. 평경장은 이게 ‘교과서적인’ 주사위라고 주장하지만 이후 고니는 5번 연속 홀수가 나오는 것을 보고 평경장이 자신을 놀리고 있다는 심증을 굳혀간다.
베이즈의 규칙을 사용하여 기술하면, 고니의 처음 생각에는 평경장이 공평한 주사위를 들고나왔을 가능성이 \(p(A=\text{공평})=50\%\), 장난을 치고 있을 가능성이 \(p(A=\text{속임})=50\%\)였다. 그런데 5번 연속 홀수가 나온 사건 \(B\)가 벌어졌다. 평범한 주사위에서도 5번 연속 홀수가 나올 수도 있긴 하다. 다만 그 사건은 상당히 드물어서 평경장이 주장하는 이론을 따르더라도 \(p(B=\text{다섯 번 홀수}|A=\text{공평}) = 1/32\)에 불과하다. 반면 애초에 홀수만 나오는 주사위였다면 \(p(B=\text{다섯 번 홀수}|A=\text{속임})\)는 \(100\%\)다. 고니의 머릿속에서 5번 연속 홀수라는 사건 \(B\)는
- 주사위가 공평하고 5번 연속 홀수: 확률 \(50\% \times 1/32 = 1/64\)
- 또는 주사위가 속임수이고 5번 연속 홀수: 확률 \(50\% \times 100\% = 1/2\)
라는 두 가지 경우만 있고 둘은 함께 일어날 수 없는 사건이기 때문에 분모의 \(p(B)\)는 \(1/64 + 1/2\)이다. 따라서 5번의 관찰 후 고니는
\begin{eqnarray*}
p(A=\text{공평}|B=\text{다섯 번 홀수}) &=& \frac{1/64}{1/64 + 1/2} = 1/33\\
p(A=\text{속임}|B=\text{다섯 번 홀수}) &=& \frac{1/2}{1/64 + 1/2} = 32/33
\end{eqnarray*}
로 평경장이 속임수를 쓰고 있음을 이제 32배 더 그럴듯한 시나리오로 여긴다. 그런데 고니가 처음에 \(p(A=\text{공평})=90\%\), \(p(A=\text{속임})=10\%\)라는 추측에서 시작했더라도 홀수 5번을 보고 마찬가지의 계산을 하고 나면 약 8:2의 비율로 속임수 쪽에 무게를 두게 된다. 사실 이 주사위는 속임수였고, 고니가 처음에 평경장을 얼마나 믿었던지 간에 (속임수를 쓸 가능성을 완전히 0으로 놓지만 않는다면) 관찰이 쌓여감에 따라 같은 결론에 수렴할 것이다. 다시 말해 ‘주관적’ 확률이더라도 관찰 결과를 합리적으로 그 주관에 반영해 나간다면 모든 관찰자가 상당 부분 동의하는 결론에 접근할 수 있다. 이것이 베이즈의 규칙에 근거한 베이지언 추론Bayesian
inference의 아이디어이다.
어쨌든 이야기는 계속 이어져서, 열 번 연달아 홀수가 나온 후 마침내 고니는 참지
못하고 평경장의 손목을 붙들었다.
고니: 선생님, 너무한 거 아닙니까?
평경장: 응? 내가 뭘?
고니: 선생님 말씀대로 주사위에 아무 속임수가 없는데 이렇게 될 확률은 천 분의 일밖에 안 되잖아요. 사실상 0이란 말입니다. ‘속임수가 없다면 이런 일이 벌어지지 않는다’라는 말의 대우 명제는 ‘이런 일이 벌어진다면 속임수다’라는 건데, 벌어졌잖아요? 그럼 속임수라는 얘기밖에 더 돼요?
평경장: 너 말은 국회의원이네?
고니: 그분들이랑 비교하지 마시고요.
평경장: 고니야, 너는 지금 \(p(B=\text{다섯 번 홀수}|A=\text{공평})\)이 작기 때문에 \(p(A=\text{공평}|B=\text{다섯 번 홀수})\)이 0이라고 우기는 게야. 그런데 사실 둘은 다른 거지. 베이즈의 규칙을 다시 보라우: \[ p(A|B) = p(B|A) \times \frac{p(A)}{p(B)}. \] 만약 \(p(A)/p(B)\)가 네 짐작보다 훨씬 크면? 이건 네가 배운 정도의 논리학으로 넘겨짚을 수 있는 게 아니야.
고니: …
평경장: 자, 계속 간다? 아수라발발타…
입씨름할 시간에 이 내기의 입장료를 낮추는 것이 급선무일 듯싶다. 재미가 적어지면 장난은 자연스레 수그러들 테니까.
마무리하며
평경장: 이만하면 잘 놀았다. 이제 털고 일어나자.
고니: 선생님, 타짜가 되기 위해 베이지언 확률론까지 알아야 됩니까?
평경장: 머리로 아는 건 이미 늦지. 내가 확률이고 확률이 나인 물아일체의 경지! 이게 없이 어설프게 운 같은 거 믿고 달려들다가는 눈뜬 채로도 코 베이는 데가 여기다.3 또 그 사실을 알고 있는 사람들을 상대로 네가 언제나 이기기란 원칙적으로 불가능하다는 거야. 이 세상에 안전한 도박판은 없어!