미국 대선 여론조사의 흑역사엔 프랭클린 루스벨트 전 대통령이 끼어 있다. 그가 재선에 도전한 1936년 대선 당시 선거 족집게 매체인 ‘리터러리 다이제스트’는 루스벨트의 대패를 예상했다. 240만 명을 우편 조사해 내린 결론이었지만 결과는 루스벨트의 압승이었다. 우편 조사 대상이 시간적 여유가 있는 중상류층에 치우쳐 루스벨트 지지층인 서민 여론을 헤아리지 못한 탓이었다. 이에 따라 리터러리 다이제스트는 폐간했고, 루스벨트의 승리를 예측한 신생 여론조사 업체 갤럽이 승승장구하기 시작했다.
그러다가 갤럽도 12년 후 ‘루스벨트의 함정’에 빠져 홍역을 치렀다. 루스벨트 급사 후 치러진 1948년 대선에서 루스벨트를 승계한 해리 트루먼 당시 부통령의 참패를 점쳤지만, 정반대 결과가 나왔다. 여론조사와 달리 선거일에 루스벨트 지지세가 트루먼 표로 고스란히 이어지리라고 생각지 못해서였다.
이런 역사는 도널드 트럼프 대통령 당선인의 출현에 맞춰 반복되고 있다. 2016년과 2020년에 이어 올해까지 트럼프가 출마한 대선마다 미국 여론조사 업체들은 체면을 구겼다. 힐러리 클린턴 후보가 이긴다던 2016년 대선은 트럼프 당선으로 끝났고, 트럼프가 완패한다던 2020년 대선은 끝까지 접전이었다. 이번 대선도 카멀라 해리스 부통령이 경합 주에서 승리할 것이란 조사를 뒤엎고 트럼프의 전승으로 막을 내렸다. 시골 출신 공화당원들이 여론조사를 꺼리고 ‘샤이 트럼프’ 정도가 커졌기 때문이란 분석이다. 해리스 같은 유색인종 후보는 여론조사보다 실제 득표율이 낮다는 이른바 ‘브래들리 효과’로 설명하는 이들도 있다.
하지만 업체들은 가장 큰 이유로 독특한 미국 대선 방식을 꼽는다. 여론조사는 미국 전역의 평균적 의견을 반영하는데 미국 대선은 경합주 유권자들의 1~2%포인트 표차로 결정나 오류가 있을 수밖에 없다는 얘기다. 매번 조사 방식을 개선했지만, 트럼프 출현 이후 미국 대선 여론조사의 성적표는 일기예보 수준을 뛰어넘지 못하고 있다. 샤이 트럼프도 없고 미국에 비해 선거 방식이 단순한 한국에서도 여론조사가 자주 틀리는데 이건 어떻게 설명해야 할까?
한국갤럽이 11월 1일 발표한 정례 여론조사 결과에서 윤 대통령 직무 수행 긍정 평가는 19%로, 이 조사에서 최저치를 기록했다. 갤럽 조사에서 긍정 평가가 20% 아래로 떨어진 건 이번이 처음이고, 부정 평가는 72%로, 현 정부 출범 이후 최고치였다고 발표했다.
그런데, ‘보수의 심장’으로 불리는 대구·경북의 민심마저 싸늘해졌다고 했다. 9월 둘째 주 35%였던 이 지역의 윤 대통령 긍정 평가는 2주 뒤 31%로, 10월 넷째 주 26%로 주저앉은 데 이어 이번엔 일주일 만에 8%포인트 하락한 18%로 집계됐다고 했다. 전국 평균보다 낮은 수치로, 전례가 드문 일이다. 이것은 아주 잘못된 결과일 것이다. 전화조사원 인터뷰(CATI)로 진행했다는데, 조사 대상: 전국 만 18세 이상 1,002명인데 응답률은 총통화 8,525명 중 1,002명인 11.8%가 응답 완료) 했다는 것이다. 게다가 TK지역의 샘플을 보니 전체 1,002명 중 97명이다. 97명의 응답을 가지고 마치 TK지역 전체의 지지율인 것처럼 발표하고 있다. 아주 잘못된 것이다. 11월 8일에는 TK지역 지지율이 18%에서 23%로 5%로 증가했다는 것이다. 샘플이 작으니 이렇게 차이가 나는 것이다. 제가 보기에는 적어도 TK지역에서는 30-40%정도는 나올 것으로 판단된다.
·
일반적으로 여론조사는 약 1,000명의 샘플을 추출하여 이들의 의견을 바탕으로 전체 유권자의 의견을 유추한다. 하지만 이 샘플이 실제로 대표성을 가질지는 불확실하다. 많은 사람들이 낯선 번호의 전화를 받지 않고, 받더라도 정치적 성향에 따라 답변이 편향될 수 있다는 점에서 여론조사는 그리 쉽게 이루어지지 않는다. 그래서 한번 셈플링을 해 놓으면 그 사람들에게 묻는 경우가 많다. 그래서 문제라는 것이다. 최근 한국갤럽의 여론조사에서도 약 7,000명이나 전화를 받지 않았다고 발표했다.
여론조사는 어떤 방법을 쓰든 완벽하지 않다. 우리나라 주민들의 정치 성향은 지역에 따라 다르고, 성별, 종교, 나이, 학력, 소득수준에 따라 다르기 때문에 편향이 개입할 수밖에 없다. 특히 지금처럼 정치 양극화가 극단적일 때는 국민의힘과 민주당 어느 쪽으로 기운 샘플이냐에 따라 결과가 크게 달라진다. 이런 모든 변수를 조정하지 않고 평면적인 수치만을 내놓는다면 절름발이 결과가 될 것이다.
한국갤럽은 대구경북인구 250만명 중 샘플 97명을 조사한 결과를 마치 대구경북의 대통령 지지율 인양 발표하는 행태는 잘못된 것이다. 1,000여명 전체의 조사결과는 유의미 할 수도 있지만, 대구경북 전체 인구 중 97명을 조사하여 마치 TK지역 지지율인것 같이 발표하는 것은 잘못된 것이다. 유의미한 것을 나타내기 위해서는 대구경북주민 약 600명이상 조사한 결과를 발표해야 할 것이다.
최근 우리나라의 대통령 지지율을 갤럽한 곳에서만 계속하여 발표하는데 이에도 문제가 있다. 다른 여론조사업체도 샘플을 달리하여 조사한 결과를 최소 3곳 이상의 업체에서 발표해야 한다. 그런데 우리나라의 경우 갤럽 한곳에서만 계속 발표하는 것은 문제가 있다. 저는 개인적으로 갤럽조사 자체를 크게 믿지를 않는다. 갤럽은 최근 상당부문 정치 편향적인 경우도 있다고 본다. 따라서 다른 여론조사업체들도 달리 표본을 달리하여 조사한 결과를 발표할 필요가 있다. 대구·경북 지역의 매일신문과 영남일보, 또는 다른 여론조사기관들도 최근 대통령 지지율 조사를 하여 발표해 주길 바랍니다.
참고 자료; 한국경제, 2024.11.8./ 한국일보, 2024.11.6/ 한국갤럽 여론조사 2024.11.8. 및 11.1.
https://www.youtube.com/watch?v=lB0kbX8jzkY