조던 엘렌버그 - 『틀리지 않는 법』
이 책을 다시 읽으며
고등학생 때, 수학 쌤이 추천해주셔서 읽었던 책인데, 책 정리를 하다가 우연히 다시 보게 되었다. 대학에서 수학을 복수 전공하면서 왜 수학 쌤이 이 책을 그토록 좋아했는지 조금은 알게 된 것 같다.
귀류법과 귀무 가설
“바이블 코드가 최소한 첫눈에는 설득력 있게 느껴지는 이유가 무엇일까? 토라가 미래를 예언할 수 없다는 귀무가설 아래에서는 위츠툼이 발견한 암호들이 등장할 확률이 대단히 낮기 때문이다. 저명 랍비들의 생몰 정보를 그토록 정확하게 맞히는 등거리 문자열들이 그토록 많이 발견될 확률, 즉 $p$값은 0에 가깝다.”
“우리는 탐색적인 방식으로 거짓 가설을 잠정적으로 <받아들였을> 뿐이다. 가정이 참인 조건법적 세상을 머릿속에 세운 뒤, 그 세상이 현실의 압력에 무너지는 모습을 지켜본 것이다.”
“귀무가설의 유의성 검정도 일종의 애매한 형태의 귀류법이다.”
- 귀무가설 $H$가 참이라고 가정하자.
- $H$가 참이라면, O라는 결과가 나올 확률은 대단히 낮다는 결론이 유도된다. (0.05 알파 기준을 넘지 못 한다.)
- 하지만 OOO는 실제로 관찰되었다.
- 따라서 $H$는 참일 가능성이 대단히 낮다!
“이 경우에는 모순에 의한 증명이 아니라, 말하자면 낮은 가능성에 의한 증명이라고 할 수 있겠다.”
“그러나 무언가가 불가능하다는 것과 확률이 대단히 낮다는 것은 전혀 같지 않다. 비슷하지도 않다. 불가능한 일은 절대 벌어지지 않지만, 확률이 낮은 일은 많이 벌어진다. 이것은 곧 우리가 <낮은 가능성으로 귀결하여 증명하는 기법>처럼 확률이 낮은 어떤 현상에 대한 관찰로부터 추론을 끌어내려고 시도할 때 우리의 논리적 발판이 흔들린다는 뜻이다.”
소수에 대한 논증
“소수는 수론을 구성하는 원자들이다. 더 이상 쪼개지지 않는 기본 개체들, 다른 모든 수들을 만들어 내는 재료들이다. 그렇기 때문에 소수는 수론이 탄생한 이래 늘 집중적인 연구 대상이었다.”
“2의 거듭제곱수는 비록 무한히 많긴 해도 아주 드물게만 나타난다. 첫 천 개의 수 중에서 2의 거듭제곱수는 10개 뿐이다. 반면에 짝수는 역시 무한히 많지만 훨씬 더 자주 나타난다. 첫 천 개의 수 중에서 정확히 500개가 짝수다. 소수는 알고 보니 그 중간이었다. 소수는 2의 거듭제곱수보다는 흔하지만 짝수보다는 드물다. 첫 $N$개의 수 중에서 소수는 약 $N / \log N$개이다. 이것이 바로 19세기 말에 수론학자 자크 아다마르와 샤를 장 드 라발레 푸생이 증명한 <소수 정리>의 골자이다.”
“소수는 전혀 무작위적이지 않다! 소수에게는 임의적이거나 우연에 좌우되는 성질 따위는 전혀 없다. 오히려 정반대다. … 소수는 무작위적이지 않다. 하지만 알고 보니 많은 측면에서 마치 무작위적인 것처럼 행동했다.”
“연속된 두 소수 사이의 간격은 어떨까? 수가 커질수록 소수는 점점 더 드물어지니까 그들 사이의 간격도 점점 더 벌어지리라 예상할지 모른다. 평균적으로는 맞는 말이다. 하지만 장의 증명에 따르면, 간격이 최대 7,000만인 소수 쌍이 무한히 많이 존재한다. 달리 말해, 한 소수와 다음 소수의 간격이 7,000만으로 한계 지어지는 경우는 수가 아무리 커지더라도 늘 등장한다. 그래서 <간격 한계> 추측이라고 부르는 것이다.”
“소수들이 만일 무작위 수처럼 행동한다면, 푸생이 증명한 바로 그런 행동을 보일 것이라는 사실은 계산하기 어렵지 않다. 그 경우에는 심지어 3과 5나 11과 13처럼 간격이 2에 불과한 소수 쌍들로 무한히 많이 볼 수 있으리라고 기대할 수 있다. 이것이 바로 쌍둥이 소수이며, 이런 소수 쌍들이 무한히 많을 것이라는 생각은 아직 추측에 불과하다.”
“우리는 오히려 소수들이 모래알처럼 무작위로 뿌려져 있기를 기대한다. 만일 쌍둥이 소수 추측이 거짓이라면, 그것이야말로 기적일 것이다. 이제까지 알려지지 않은 모종의 힘이 존재하여 소수 쌍들을 서로 멀찍이 떨어뜨리고 있다는 뜻일 테니까.”
“푸생은 소수들이 서로 간의 간격이라는 측면에서도 무작위처럼 행동한다는 사실을 보여 주었다. 무작위성이 무작위적인 것이다!”
유의성 검정의 허점
“요컨대, 논문에 보고된 큰 효과는 틀림없이 대체로 혹은 완전히 신호의 잡음 탓이었을 것이다. 그러나 잡음은 진실을 좀 더 부풀리는 것 못지않게 진짜 효과로부터 멀어지는 반대 방향으로도 우리를 몰고 갈 수 있다. 그러니 통계적 유의성은 충분하지만 전혀 확신할 수 없는 결과 앞에서, 우리는 정말로 아무것도 알 수 없는 처지이다.”
“… 하지만 만일 20개 연구진이 20곳의 실험실에서 젤리빈을 20번 시험했다면? 그중 19개 실험실은 통계적 유의성이 있는 효과를 확인하지 못할 것이고, 그래서 결과를 발표하지 않는다. 한편 스무 번째 실험실의 운 좋은 과학자들은 통계적 유의성이 있는 효과를 확인한다. 왜냐하면 운이 좋기 때문에. 하지만 그들은 자신들이 운이 좋다는 사실을 모른다. 그들이 아는 한 젤리빈이 여드름을 일으킨다는 가설은 자신들이 딱 한 번 시험했을 뿐이고, 더구나 그 가설은 시험을 통과했다.”
“아브라함 발드가 지적했듯이, 상황을 제대로 보려면 돌아오지 못한 비행기들도 함께 고려해야 한다.”
”<데이터를 고문해서 자백 받아 내기>”
“통계학의 목적은 무엇을 믿을지 알려 주는 게 아니라 무엇을 할지를 알려 주는 것이었다. 통계는 질문에 답하는 학문이 아니라 결정을 내리는 학문이었다. 유의성 검정은 책임자에게 신약을 승인할지 말지, 경제 개혁안을 시행할지 말지, 웹사이트를 꾸밀지 말지에 대한 답을 알려 주는 규칙에 지나지 않았다.”
“반복 과정은 새로 도입된 대상에게 떼로 몰려가서 적절하지 않은 것을 골라 죽여버리는, 일종의 과학의 면역계여야 한다.”
베이즈 추론
“우리는 날씨에 대해서는 꽤 훌륭한 수학 모형을 갖고 있기 때문에, 비록 궁극적으로는 계의 혼돈성(카오스)이 우리를 이기고 말더라도 단기적으로는 더 많은 데이터만 주어진다면 더 정확한 예측을 해낼 수 있다.”
“… 우리가 씨름하는 문제는, ‘Y일 때 X일 확률’과 ‘X일 때 Y일 확률’이 같지 않다는 점이다.”
”‘사전 확률‘이 증거를 보기 전에 품은 믿음을 뜻한다면, ‘사후 확률‘은 증거를 본 뒤의 믿음을 뜻한다.”
“사후 확률은 우리가 접하는 ‘증거’의 영향을 받는다. 그런데 사전 확률의 영향도 받는다!”
“베이즈 추론의 사고방식에서, 당신이 증거를 본 뒤에 무언가를 얼마나 믿게 되었느냐 하는 것은 증거가 제공하는 정보에만 달린 게 아니라 당신이 애초에 그 무언가를 얼마나 믿었느냐에도 달려 있다.”
-> 개인적으로 “베이즈 추론”에 대해 아주 좋은 지적이라고 생각한다!!
“… 결국 문제는 우리가 <확률>이라고 말할 때 그 말이 정확히 무슨 뜻인가 하는 까다로운 질문으로 귀결된다. … 우리가 <빨강> 이론이 참일 확률이 5%라고 말할 때, 그것은 편향된 룰렛 바퀴들의 전체 분포에 관한 명제를 진술하는 게 아니라(그걸 우리가 어떻게 알겠는가?) 자신의 마음 상태를 말하는 것이다. 5%는 우리 앞의 룰렛 바퀴가 ‘빨강에 편향된 바퀴’라고 우리가 믿는 정도를 뜻한다.”
복권 문제
“기대값은 개 경주에 돈을 거는 행위처럼 진정한 가치를 확실히 알 수 없는 대상에 대해서 올바른 값을 매기도록 도와주는 훌륭한 방법이다.”
“물론 요즘은 아무도 개 경주를 하지 않지만, 기대값의 원리는 경주 티켓 가격을 매길 때만이 아니라 스톡옵션, 복권, 생명 보험에 대해서도 똑같이 적용된다.”
“… 연금을 구입한 사람들은 자신이 금방 죽진 않을 거라는 내기에 거는 셈이었다. … 한마디로, 기대 수명이 더 짧은 할아버지는 기대 수명이 더 긴 어린아이보다 연금에 돈을 덜 내야 한다는 것이다.”
“… 따라서 복권을 사는 것은 결국 괜찮은 생각인 거처럼 보인다. 단 당첨금이 충분히 클 때만 사기로 한다면. … 당첨금이 그보다도 더 크다면 기대값이 <해볼 만함> 영역으로 기울 수도 있겠지만, 어쩌면 그 경우에도 그렇지 않을 수도 있다. 큰 당첨금 때문에 티켓 판매가 훨씬 더 많아진다면 말이다.”
“분명히 할 점이 있다. 복권의 기대값에 대한 계산은 2달러를 투자하면 반드시 돈을 딸 수 있다는 뜻이 아니다. … 기대값은 우리가 기대하는 값이 아닌 것이다! 하지만 이월 회차에는, 비록 가능성은 낮지만 만일 당첨된다면 상금이 더 크다. 훨씬 더 크다. 기대값의 마술은 티켓 100장, 혹은 1,000장 혹은 10,000장의 평균 보수가 5.33달러에 가까울 가능성이 커진다는 데 있다. 티켓 한 장이라면 아마도 가치가 없겠지만, 티켓 1,000장이라면 거의 확실하케 쓴 돈을 다 돌려 받고 심지어 더 벌 수 있다!”
-> 마치 “큰 수의 법칙“과도 비슷한 느낌이다!
뷔퐁의 바늘
확률론을 이용해 원주율 $\pi$의 값을 구하는 방법이다. suhak님의 블로그의 “뷔퐁의 바늘문제”에서 그 과정이 잘 나와있다. 결국 요약하면,
\[P(A) = \frac{2L}{D \pi}\]이때, 충분히 많은 시뮬레이션으로 $P(A)$의 값을 구하고, $L$, $D$ 값은 사전에 정해진 상수값이다. 이들을 이용해 원주율 $\pi$를 구한다.