매일같이 난무하던 여론조사 결과를 지금은 공표하지 못한다. 후보들의 지지율은 어떻게 되어 있을까? 투표일 전 1주일 동안 여론조사 결과를 공표하지 못하게 한 것은 잘한 일이다. 정확한 정보를 전달하지 않거나 왜곡된 정보로 주권자의 선택에 영향을 미치는 행위는 차단하는 게 맞다. 답답하고 궁금하더라도 지금은 선관위가 보내준 공보물을 찬찬히 읽어보면서 생각을 정리할 때다.
서울신문이 한국갤럽에 의뢰해 지난 25~26일 조사한 결과에 따르면, 이재명 후보와 윤석열 후보의 지지율이 각각 37.2%와 42.3%로 5.1% 차이였다. 갤럽은 야권 후보 단일화를 가정한 조사도 했는데, 그 결과 격차는 더 적었다. 단일화를 하면 0.1%라도 더 벌어져야지 줄어드는 게 말이 되는가? 게다가 25일 TV 토론에서 안철수 후보가 단일화는 결렬되었다고 재삼 확인한 마당에 이런 조사를 왜 한단 말인가?
그 답이 나왔다. 결국 안철수는 윤석열과 단일화에 합의하고 후보를 사퇴했다. 결렬 선언 이후에도 집요하게 단일화 조사를 한 이유가 있었다. 단일화 압박. 여론조사는 이렇게 부실할 뿐만 아니라 음흉한 정치적 의도를 담고 있는 것이다. 그러나 끝까지 안철수 후보를 지지했던 유권자들이 순순히 따르지는 않을 것이다.
한국사회여론연구소(KSOI)는 같은 기간에 ARS와 전화면접 조사를 동시에 했다. ARS 조사는 윤 후보가 45.0%로 이 후보(43.2%)에 1.8% 앞섰으나, 전화면접조사에서는 이 후보(43.8%)가 윤 후보(36.1%)를 오차범위 밖에서 앞선 것으로 나타났다. 그동안 지적되어 온 ARS 조사의 부실함을 증명해준 조사였다. 그렇다고 해서 전화면접 조사가 바닥 민심을 정확하게 짚어내는 것은 아니다. ARS보다야 낫지만, 여론조사의 원천적인 한계를 극복한 것은 아니기 때문이다.
바닥 민심을 읽어내는 데는 구글 트렌드와 네이버 트렌드 등에 축적된 빅 데이터 분석이 믿을만하다. 구글 트렌드의 신뢰도에 대해서는, 거의 모든 언론사와 조사기관 및 전문가라는 사람들이 힐러리의 당선을 예측했지만 트럼프가 당선됐던 2016년 미국 대통령 선거를 예로 든다. 구글은 트럼프의 당선을 예측했던 것이다. 국내 사례도 꽤 있다.
정하웅 KAIST 물리학과 교수는 박원순 대 나경원의 서울시장 선거 등 여러 사례를 소개하면서 “구글 신은 뭐든지 알고 계십니다. 선거 결과 정도는 그냥 미리미리 알려 주십니다.” 라며 구글 트렌드에 대한 신뢰를 보여주었다.(『구글 신은 모든 것을 알고 있다』) 한국사회여론연구소의 전화면접 조사결과는 빅 데이터 전문가의 구글 트레이드 분석과 매우 근접했다.
시사평론가 박성민은 서울신문 2월 19일 자 구글 트렌드를 다룬 기사에서 여론조사 결과와 다르게 이재명 후보가 윤석열 후보보다 검색량이 많게 나타난 데 대해 “구글 트렌드는 단순 언급량을 보여주는 거고 부정적인 게 더 많기 때문에 관심이라고 얘기할 수 없다.”고 단정적으로 잘라 말했다. 무지의 소치다. 단순히 검색수만 세는 게 아니라 과학적으로 내용분석까지 하는 빅 데이터 분석인 것이다.
사회과학이 과학이라는 이름에 값하는 최소한의 도구가 통계조사 방법론이다. 그것도 겉으로 드러난 현상을 파악할 뿐이다. 그 방법론을 선거에 적용한 것이 여론조사다. 그런데, 사람들은 다른 사람을 의식하면서 태도를 정하고 행동하는 본성을 가지고 있기 때문에 정치적 의사 표현에 소극적이다.
게다가 선거 시기 여론조사는 투표 날 실제 투표에 참여한 유권자들의 모집단을 미리 특정할 수 없기 때문에 원천적으로 정확할 수가 없다. 특히 정권교체 프레임이 기승을 부리는 가운데 여당 지지자들은 전화받기를 거부하거나, 받아도 제대로 답을 하지 않을 가능성이 있다. 이른바 ‘샤이 이재명’의 정체다.
이 원천적인 한계를 인정한다면, 여론조사에만 의존하는 타성에서 벗어나야 한다. 구글 트렌드 검색수에 대한 빅 데이터 분석을 병존하라는 것이다. 모바일 미디어와 빅 데이터를 키워드로 하는 21세기 제4차 산업혁명 시대에 조작이 가능한 부정확한 여론조사에만 의존한다는 것은 난센스다. 말로만 선거는 과학이라고 허풍떨지 말고 과학적 방법을 수용해야 할 것이다.