【特朗普当选.博评】民调错得离谱?还是我们错读民调?
美国大选,很多人错估了结果。
于是很多人又说,那些民调和根据民调来做的预测,继英国脱欧之后又遇滑铁卢。
已经有不少文章分析那些错误的起因可以是什么,但我想反过来问,民调真的错得很离谱吗?
是民调错得离谱,还是我们对民调的阅读和理解错了?
特朗普真的毫无胜选?
大选当天,《纽约时报》指希拉里得胜机会达 85%。有朋友说:“又话八成几机会赢,咁都错。”但想想,《纽约时报》其实没有错。如果它说希拉莉 100% 赢,然后特朗普赢了,那么它就是错。
但事实上,它早就告诉你,特朗普的赢面也有 15%。
你可能觉得这样说有点取巧,但举个例,现在有人要掷骰子,你问我,他掷出 6 的机会是多少,很简单,6 分之 1,即 16.7%,掷出来不是 6 的机会是 6 分之 5,即 83.3%,超过八成机会不是 6。
然后那个人掷骰,掷出来真的是 6。很出奇吗?这代表之前的或然率错了吗?
与其说《纽约时报》估算错误,不如说很多人(包括笔者自己)都因各种各样原因,事前没有想清楚“15% 机会”是什么意思。
15% 当然不代表机会很高,但其实也绝不代表机会微乎其微。
这两天,翻看了诺贝尔经济学奖得主 Daniel Kahneman 的科普书籍《Thinking Fast and Slow》里的一些段落。Kahneman 指出,面对一些发生机会不大的事情时,人们总会要不就夸大事情发生的可能性,要不就将事情发生的可能性完全忽略掉。如果人们不太在意去把一件可能发生的事在脑海中形像化,以及人们过往没有经验过那件事,人们就很可能把事情发生的可能性完全忽略。这可能就是选前很多民众和专家低估特朗普胜算时的心理写照。
预测与实际结果分差不算大
除了得胜机会的评估之外,民调结果本身的错误又有多大?
《纽约时报》在 11 月 8 日公布的最后全国民调平均数字,希拉里和特朗普的全国总得票,是 45.9% 对 42.8%,希拉莉赢 3.1%。执笔这篇文章之时,希拉里和特朗普的全国总得票是 47.8% 对 47.3%,希拉莉赢 0.5%。预测和实际结果的差异,只是 2.6% 而已。
这 2.6% 的差异从何而来,已经有很多人提出了多个合理解释。除了一般抽样误差之外,可能原因还包括:因回应率低而做成的样本偏差;民调中说自己很可能会投票的人和真正投票者之间的差异;少数人在民调中不愿意承认自己支持特朗普;民调中那些“仍未决定者”最后的选票分布不一定很平均等等。
要搞清楚,这些问题都是无法完全避免。所以我跟朋友半开玩笑说,有那么多可能的误差来源,最后只差不足 3%,不是说明了那些民调已做得很好吗?
事实上,翻查美国政治网站 RealClearPolitics,网站从 2004 年大选开始有进行民调整合。结果如下表所示,在 2004 和 2008 年,民调预测和实际结果的差异均在 1% 之内。但在上一届,民调预测和实际结果其实有 3.2% 的差异,比今届还要大一点,只是那差异没有影响最后得胜者是谁,所以没有人为意。
调查误差乃无可避免
顺带一提,美国全国性民调在这次选举的表现,其实好过英国脱欧一役。英国脱欧公投前,Bloomberg 的最后民调统合,留欧赢 1.9%,最后脱欧赢 3.8%,两者差异是 5.7%。
当然,美国大选要计选举人票,当民调机构在个别州分进行民调时,民调结果跟最后的选举结果,在个别州分可以较大。
如 YouGov 于 10 月底及 11 月初在重要摇摆州分进行的民调,在北卡罗来纳、俄亥俄,和威斯康辛跟实际结果有 5% 至 8% 的差异。这 3 个州都“出乎意料”地由特朗普胜出,而 3 个州加起来有 43 张选举人票,如果都是希拉莉赢,正好足以让她当选。但无论如何,在这点上,民调误差是配上选举制度,才出现使人错估的效果。
Daniel Kahneman 在《Thinking Fast and Slow》里说:
“预测出现误差是无可避免的,因为世事本身就难以预测。”(Errors of prediction are inevitable because the world is unpredictable.)
但这也不代表民调完全没有预测能力,问题是误差的大小。从过去两次美国大选以及英国公投看,在一些极具争议的问题上,全国性民调和实际结果相差 3% 至 5%,不是罕有的事。很多时候,3% 至 5% 的误差不会影响大局。但如果双方支持度本来就差别不大,再加上一些制度因素,3% 误差就已经可以使民调说不准谁能胜出。
民调和天气预测一样,用尽了科学方法,仍然会有局限。对市民来说,重点不是信或不信,而是了解这种局限,从而对民调结果作更小心的解读。
(本文纯属作者意见,不代表香港01立场。)