책 《숫자에 약한 사람들을 위한 통계학 수업》과 《똑똑하게 생존하기》 슬기로운 숫자 생활
숫자로 만든 함정에서 벗어나기
《숫자에 약한 사람들을 위한 통계학 수업》
데이비드 스피겔할터 지음 | 권혜승, 김영훈 옮김 | 웅진지식하우스
2015년 세계보건기구는 햄과 소시지, 베이컨 같은 가공육을 1군 발암 물질로 분류했다. 담배·석면 등과 같은 군으로 묶었다. 50g의 가공육을 매일 먹으면 대장암에 걸릴 위험이 18% 증가하는 것으로 나타났다. 세계는 발칵 뒤집혔다. 대장암 발병 확률이 18% 증가한다니 무시무시하게 들린다. 실상은 이렇다. 가공육을 매일 먹지 않은 사람은 100명 중 6명꼴로 대장암에 걸리는데, 매일 먹은 사람은 100명 중 7명꼴로 대장암에 걸린다는 뜻이다. 표현을 달리했을 뿐인데 느낌이 상당히 다르다. 숫자는 객관적이지 않다. 어떻게 보여주느냐에 따라 사람들이 받는 인상이 달라진다. 2011년 영국 지하철에 이런 광고가 내걸렸다. “영국 청년 99%는 중범죄를 저지르지 않습니다.” 이를 “영국 청년 1%는 중범죄를 저지릅니다”라거나 “영국 청년 1만 명은 중범죄를 저지릅니다”라 고 했다면 어떨까. 안도감 아니라 불안감이 커졌을 것이다.
표나 그래프도 마찬가지다. 각 병원의 ‘수술 후 30일 생존율’을 보여 주는 막대그래프가 있다. 가장 낮은 병원은 96.3%, 가장 높은 병원은 99.0%다. y축이 0%로 시작하면 모든 병원이 우수한 것처럼 보인다. y 축이 95%로 시작한다면 사실은 별 차이 안 나는데, 엄청나게 차이가 나는 것처럼 과장될 것이다. 선 그래프도 y축이 어디에서 시작하는지, x축의 기간을 어느 범위로 잡느냐에 따라 모양이 달라진다. 나쁜 의도를 갖고 있다면 자기가 원하는 모양의 그래프를 얼마든지 만들어낼 수 있다. 숫자를 다룰 때 주의를 기울이지 않으면 쉽게 함정에 빠진다. 2011년 BBC는 영국의 대장암 사망률이 지역에 따라 최대 3배까지 차이가 난다고 보도했다. 영국 로센데일에선 10만 명당 9명이 대장암으로 사망 했는데, 글래스고에서는 10만 명당 31명이었다. 17명가량인 국가 평균에 크게 벗어난다. 로센데일은 인구가 7만 명에 불과한 탓이었다. 표본이 적으면 튀는 결괏값이 나오기 쉽다. 실제로 도시 인구가 많아질수록 국가 평균에 가까운 사망률로 수렴했다. 인구 63만 명인 글래스고는 정말 예외적 사례였는데, 몇 년 뒤 조사에선 평균치로 복귀했다. 《숫자에 약한 사람들을 위한 통계학 수업》은 단순히 숫자가 오용된 사례만 나열하지 않는다. 저자는 영국 케임브리지 대학교 교수와 왕립통 계학회장을 지낸 저명한 통계학자다. 그만큼 정통 통계학의 정수를 맛볼 수 있다. 회귀 분석, 신뢰 구간, 가설 검정, 통계적 유의성 등 통계학의 핵심 개념을 어려운 수식 없이 설명하는 솜씨가 놀랍다.
헛소리에 대하여
《똑똑하게 생존하기》 | 칼 T. 벅스트롬, 제빈 웨스트 지음
박선령 옮김 | 안드로메디안
이 책은 직설적이다. “세상에 헛소리가 넘쳐난다”고 말한다. 그것도 숫자로 된 헛소리가. “신식 헛소리는 엄격하고 정확한 인상을 주려고 수학·과학·통계학의 언어를 사용한다. 의심스러운 주장을 숫자·그림·통계·데이터로 감싸 정당성의 허울을 덧씌운다.” 미국 워싱턴 대학교 교수인 두 저자는 학생들에게 했던 ‘헛소리 까발리기’라는 수업 내용을 토대로, 숫자의 탈을 쓴 거짓과 기만을 파헤친다.
저자들이 주는 한 가지 팁은 “뭔가가 너무 좋거나 너무 나빠서 도저히 사실일 것 같지 않다면 아마 그 생각이 맞을 것”이라는 점이다. 2015년 ‘음악 장르별 음악가들의 평균 사망 연령’을 나타낸 그래프가 화제가 됐다. 블루스·재즈·가스펠처럼 역사가 오랜 음악 장르에서 활동하는 음악가는 평균 60세 이상 살았다. 펑크·메탈·힙합 등 새로운 장르 내 음악가는 평균 40세에 못 미쳤다. 그럴듯해 보이지만, 그래도 너무 충격적인 수치다. 왜 이런 결과가 나왔느냐면 조사 대상에서 살아 있는 사람은 제외했기 때문이다. 신생 장르에선 자연스럽게 사고 또는 폭력으로 일찍 생을 마감한 음악가가 다수를 차지할 수밖에 없다.
다음 문제다. A라는 대학은 평균 강좌 규모가 18명으로, 각종 대학 평가에서도 높은 점수를 받았다. 하지만 이 학교 학생들은 “평균 18명이라고? 말도 안 된다”며 황당해한다. 여기에 어떤 비밀이 숨어 있는 걸까. 이런 광고도 있다. 미국 자동차보험사인 가이코는 “다른 보험사에서 가이코로 갈아탄 신규 고객은 연간 평균 500달러 이상 보험료를 아낄 수 있었다”고 했다. 이 말은 사실일까.
헛소리는 만들기 쉽다. 비용도 적게 든다. 그에 반해 헛소리를 반박하는 데에는 상당한 노력과 에너지가 든다. 《걸리버 여행기》를 쓴 조너선 스위프트는 “거짓은 날아가고 진실은 그 뒤를 절룩거리며 쫓아간다”고 했다. 인터넷과 스마트폰, 소셜미디어는 거짓이 날아가는 속도를 더 높여줬다. 누구나 헛소리를 만들고 널리 퍼뜨릴 수 있게 했다. 이런 행태에 편승한 것은 언론·정치·기업·학계도 마찬가지다. 특히 숫자를 앞세우면서 헛소리는 더욱 교묘해지고, 반박하기도 쉽지 않아졌다. 우리에게 승산은 있는 걸까. 《똑똑하게 생존하기》는 정보의 원천을 파악하라거나, 불공평한 비교를 조심하라는 등의 방어책을 제시한다. 하지만 각종 미디어에 대한 노출을 줄이지 않는 한 쉴 새 없이 쏟아지는 헛소리의 공습을 막기란 쉽지 않아 보인다.
글 임근호 《한국경제신문》 기자 | 사진 제공 웅진지식하우스, 안드로메디안