拜登料压倒性大胜 美国大选民调可信吗?

撰文: 叶德豪
出版:更新:

民主党总统候选人拜登在全国民调上一直领先特朗普,经过数个月来的新冠疫情与反种族歧视示威冲击更让此等情况难见转寰之机。路透社更曾引述共和党消息人士指惯常在Twitter上批评“假民调”的特朗普曾私下承认自己落后拜登。

无论是根据美国选情网站270toWin、RealClearPolitics等的大选地图、《金融时报》按照民调的各州分类,还是《经济学人》企图预测大选胜负或然率的复杂模型,拜登都呈现出几乎“躺着赢”的形势。

然而,有过2016年民调与模型都指向希拉里大胜,而特朗普却“黑马跑出”的惨痛教训,美国选民对民调似乎是“一笑置之”,心中仍有对“特朗普奇迹”再次出现的预期。根据过去数月的民调,虽然拜登民望稳定领先特朗普,可是较多选民依然认为特朗普会再次证明民调为错,反胜拜登。

到底在“特朗普奇迹”的阴影下,民调(以及以民调为基础的预测)还可以相信吗?

新冠疫情与“黑人的命也是命”(Black Lives Matter)示威的处理,一方面使特朗普失分,另一方面也使拜登民望上涨。(美联社)

首先,由于没有任何民调可访问一个地方的每一个人,因此民调的直接结果不能不加以权重分配,以使得民调采得的样本能反映当地人口的特征。例如以固网电话进行的民调,很可能会使民调样本集中在中年女性之上,因此民调得来的结果就要给予其他年龄层和性别更多的权重,以反映这些群组在民调当地的人口比例。

然而,要选择什么特征去作权重,则是一个争议不止的难题。

学历高低成民调权重关键

第一,由于没有人能够为所有人口分类去作权重,我们必须选择一些与投票结果相关的特征去作衡量。例如,如果一个人的工作地区与他的投票倾向几乎没有关系的话,民调就不会以工作地区作为特征去作权重分配。可是,要筛选出有意义的权重特征却非易事——这更造成了2016年选举民调的一大失误。

路透社曾报道,如果特朗普民望未见起息,参议院多数党领袖麦康奈尔(Mitch McConnell)有可能会建议共和党参议院候选人与特朗普保持距离。(美联社)

当年的全国性民调显示希拉里会胜出普选票大约3%,最终希拉里的普选票的确比特朗普多2%,其准确度其实不低。同时,美国大选民调对普选票的预估与实际结果误差,已从1936年的12个百分点,跌至2016年的两个百分点左右,属史上一大低点。其实,当年估计失误的主要问题不是出于全国民调,而是出于各州民调

在2016年大选以前,民调机构普遍认为学历高低并不是影响投票倾向的主要因素,因此即使学历高低与民调访问回应率有正向关系,不少州份的民调机构也没有将学历作为权重分配的一部份。这在2012年的选举中影响不大,因为当年占人口比例较高的本科毕业人士小规模倾向投票给共和党,而占人口比例较低的硕士或以上毕业人士则明显倾向支持民主党,两者相减之后,即使高学历人士更愿意接受民调访问,这现象也不会构成太大影响。

然而,到了2016年的选举,学历高低与会否投票支持民主党却成为了明显的正向关系,无论是在全美国的层面,还是在当年特朗普胜选的关键州份宾夕法尼亚州(Pennsylvania)、密歇根州(Michigan)、威斯康星州(Wisconsin)亦是如此。然而,当年选举之前,民调机构当然也没有“先见之明”,在上述三州有将学历高低作权重分配的民调只占总数18%至33%不等,而在全国层面,有近半民调也没有计算这个因素。最后,当然是大大失算收场。

特朗普对于不利自己的民调经常作出毫无根据的批评,除了《纽约时报》以外,连一直力挺特朗普的福克斯新闻也不放过。(Twitter@realDonaldTrump)

汲取了这个教训,本年不少民调机构也将学历采用为权重特征之一,相信2016年之误该可解决。

特朗普支持者拒绝回应民调 或造成误差

不过,在如今特朗普终日大骂(对他不利的)民调“造假”之际,特朗普的支持者也许会更倾向拒绝民调访问,民调机构在权重分配问题上似将遇上另一难题:到底“党派认同”应否作为权重分配的人口特征之一?

此权重的根本问题在于,与年龄、性别、学历等相对固定的人口特征不同,党派认同并不能从官方人口普查的数据中得到确切数字,因此民调机构若要以党派认同作权重分配的话,也只能自行估算,或者依赖前次选举的票站调查数据作准。对此,美国全国民调评议会(NCPP)就批评以党派认同作权重“是个猜测游戏多于好的理论”。

虽然根据美国民意研究学会(AAPOR)对2016年大选民调的详细研究,他们惊讶地发现其实民调即使没有权重分配,也没有压抑特朗普支持者的民意;然而,这会否因为特朗普大骂民调而改变,则尚属未知之数——如果共和党人因特朗普的言论而拒绝回应民调的话,党派认同的权重争议也可能会构成民调结果与现实之间的落差。

特朗普在2016年的竞选成功,得益于人们对类似他的对手希拉里(Hillary Clinton)式政客的厌恶。图为2016年两人在总统竞选阶段的电视辩论。(路透社)

选民拿不定主意的难题

除了难解的权重问题之外,2016年的民调错估,还有“选民到最后一刻才作出投票决定”的问题。

回顾当年,到了两党选情炽热的8月底,根据当时一项《经济学人》与YouGov的大选民调,支持第三党候选人或其他人、不确定投票选择,以及可能不投票的受访者占所有受访者高达21%。而根据上述美国民意研究学会的报告,美国全国有13%选民到选前最后一个星期才作出投票决定,此类选民投票给特朗普的比例比投给希拉里的高出3个百分点,而在左右大选的宾夕法尼亚州、密歇根州和威斯康星州,这个差距更分别高达17、11和29个百分点。

两党之间投票意向不明的选民比例如此高,当然促成了当年民调预测失准。然而,如今美国两党分裂成风,选民投票意向的确定性就远较2016年为高。根据《经济学人》与YouGov在本年同在8月底进行的民调,表示将投票给其他人、不确定或不投票的受访者比例只得8%,比上述数字低一倍以上。因此,可以预见,本年的民调预测的准确度,至少在此层面而言,会比2016年为高。

在大选民调较普遍加入学历水平权重、选民投票意向较早确定的情况下,本年的美国大选民调原则上应该会比2016年更有参考价值。不过,这次大选民调的一大变数却是网上民调的冒起。

网上民调大行其道

过去,民调通常透过固网或手提电话号码随机抽样进行,然而由于人们的回应率比过去大幅下滑——根据皮尤研究中心(Pew Research Center)的数字,其在1997年的回应率为36%,到了2019年底则只余6%——使用电话进行民调的成本愈来愈高。于是,随着互联网的普及,网上民调就大行其道,目前常被引用的美国选举民调机构,诸如YouGov、哈里斯民调(Harris Poll)、莫宁咨询(Morning Consult)也有将民调移至网上。

根据《纽约时报》5月的一篇文章统计所得,本年4月期间美国有半数进行特定州份大选民调的机构皆使用网上民调;相较之下,在2018年中期选举最后三周,只有10%期间有进行选举民调的机构使用网上民调。

当然,网上民调也是种类繁多、可靠度不一。例如皮尤研究中心就会以传统手法随机拣选目标受访者,再通知他们回应网上民调问题,并为不能作回应网上民调的目标受访者提供“网下”的选项。

美国新冠疫情迟迟未除,人们宣誓入籍美国也要做足安全措施。(美联社)

可是,不少机构为减省成本,则采用“主动选择加入”(opt-in)的网上民调手法,再透过背后的各种人口数据,以复杂的权重分配方式,去用低成本的手段试图做到传统民调反映关乎全体民众现象的目标——YouGov就是此中的表表者。

然而,由于要求受访者“主动选择加入”使民调失去了抽样的随机性,此等民调的准确度也未必能有保障。皮尤研究中心一项2016年公布的研究就显示,网上民调的误差,与全国性联邦调查作比较的话,可高达6至10个百分点。网上民调涌现会否导致本年大选民调再次失准,确实值得观察。

上文分析完大选民调的各种准确性考量后,我们也许可以回到原来的问题:到底此刻的大选民调还可以相信吗?

答案当然是:可以信,但不能尽信。说到底,民调其实只是以简单的数字去呈现复杂现象的尝试。正如我们用一纸大学文凭去代表一个人的知识水平一般,没有简单的呈现,我们难以有效了解世事,然而简单的呈现本身却不能被等同于复杂的现象。

更重要的是,选举民调本身其实就是选战之中的其中一个能够左右选情的力量,能够左右候选人整个竞选工程的走向。试问一个牌局内的人又怎能确切地反映整个牌局?大选民调的参与价值确有高低之别,可是它们只能是选举的一个侧面,永远不能观照全局。