【特朗普当选.博评】对不起,我们错了
在开始讨论大选结果之前,请容许我在这儿说一句:对不起,我们错了。
本栏一直引用美国评论界基于人口学和民调统计研究的分析,推算这次大选胜出者应为希拉里,结果却是特朗普爆冷胜出。错就要认,打就企定,我在这儿先和各位读者道歉。
开票的早上,我在电视台做直播点评。特朗普胜出所带出的震撼,直接击中了直播室内的每一位。
当天早上 7 时我到达电视台的大门,还在说笑应该 12 时前就会有结果。本来剧本是这样的:只要希拉里保住民主党铁票区,再在北卡罗莱纳州和佛罗里达州之间随便赢一个,便可以出来发表胜选感言,我们也可以提早完场去吃午饭了。这条进路,也是美国评论界选前共识。
然而开票不久,我看着面前电脑传来的数据,发现维珍尼亚州的结果和预计的很不一样。须知道,维珍尼亚州被理解为民主党的铁票区。一旦失去了维珍尼亚州,希拉里几无胜算。这时候,我趁播广告时间和主持人说:
维珍尼亚州的表现很不正常,有大事可能会发生。
接下来的,就是大家都知道的事情了。虽然希拉里最后成功保住了维珍尼亚州。但既然此州也出问题,也暗示了她在宾夕法尼亚州、密歇根州和威斯康星州所架起的“防火墙”可能其实不堪一击。
到了中午前后的时间,已知希拉里在这 3 个州之间只要输掉其中一个便会输掉(结果是 3 个都输掉),大家只是等死期来临。不过电视直播还是要做下去,幸得工作人员买了三文治进来录影厂给我们顶肚,尽管自问看着这样的结果,也没有什么心情吃下去。
“防火墙”州份民调 超出正常误差范围
为什么评论界这次会错得这样离谱?要做“马后砲”,戏谑某评论人是“灯神”很简单,但要说清楚到底错在什么地方却不容易。如果说全国票的话,选前民调的平均值是希拉里胜3.3%,结果是希拉里胜0.5%,可算是在误差范围之内,不能说是完全失败。但美国的总统是按各州的选举人票算出来的,而真正出意外的是各州的民意调查。当有些地方例如俄亥俄州的民主党支持度被明显高估,而有些地方如新墨西哥州明显低估时,加起来的总数也可以是“误差不大”,但对结果的影响却差之千里。再细看各州的数据,这次的误差程度是足以写进教科书的。按《纽约时报》就主要州份的统计,今届的平均误差是3.9%,而上两届分别是1.7%和2.3%。
这平均误差也不算很大吧?我们再重点看看属于“防火墙”的州份。前面提到的这个概念,是指按选举人票推算,就算希拉里输掉最重要的几个战场州,即是北卡罗莱纳州、佛罗里达州和俄亥俄州,只要这“防火墙”守得住,再加上西部的一些小州份,也足以阻挡特朗普当选。这儿的关键,在于“防火墙”能守得住。那为什么之前的评论会对此有无比信心呢?因为自暑假以来,这三个州的民调平均值一直都是希拉里领先,从来没有试过由特朗普领先。有网站统计了宾夕法尼亚州由六月以来的47次民调,当中希拉里胜出44次,结果特朗普却以1.2%胜出。差距最远的是威斯康星州,选举前夕的平均值是希拉里以6.5%胜出,结果却是特朗普以1%反胜。这种差距,已明确超出了正常民调的误差范围。不要说什么专家学者,就算是平常人看到这样的数据,也会误以为希拉里是稳胜的。
评论界集体失误 思考数据才是正事
基于这些错误的数据,今次美国评论界出现罕见的集体失误。以著名数据达人 Nate Silver 为例,他在 2008 年成功预测 49 个州份的结果, 2012 年更成功预测全数 50 个州份的结果,这次他就预测希拉里有 71% 的机会当选。其他的推算比他还要进取,例如纽约时报的预测是 85% ,普林斯顿大学的是 93% ,最极端的 Huffington Post 是 98% 。值得一提,到了选举后段,不同推算者之间还互相攻击,Nate Silver 的数字被评为过于保守,引来他大怒以粗口回应。事过境迁,原来所有人都错了,难说谁比谁高尚。
倒是普林斯顿大学的 Sam Wang 选前下注,如果特朗普拿得多于 240 票便会吞一只虫下肚。结果特朗普拿得超过 300 票,他做了“找数真汉子”,在电视镜头面前吞了一只虫。但在他表演吃虫之前,还是向主持和观众提醒了很重要的一点:吃虫或个人荣辱不是最重要的问题,思考数据和公共议题才是我们的正事。
为响应他的呼吁,我也做了一点赛后分析。选前我们只得有限的调查样本,选后却有完整每一个人的数据,可以很实事求是地逐张票去点算。
我发现特朗普当选后很多人(包括我自己)都把原因放在“沉默的白人”跑了出来支持他,但这说法和投票数字并不完全吻合。更有可能的解释,是民主党没有输给特朗普,而是输在希拉里自己手上。篇幅所限,我们下篇再谈。
(本文纯属作者意见,不代表香港01立场。)