天风证券:为什么美国大选民调总测不准?

智通财经

1周前

民调机构在加权时需要考虑更多的变量来减少抽样误差,比如TheNewYorkTimes/SienaCollegePoll在对样本数据加权时考虑了12个变量,包括党派、年龄、性别、种族、教育、按照大学或非大学教育水平划分的白人/非白人、婚姻状况、房屋所有权、国家地区、投票历史、2020年选举的投票方式、城市/乡村和人口普查区教育水平。

美国选举民调是针对总统选举和国会选举等投票活动进行的公众意见调查,通常在选举前进行,目的是捕捉选民对候选人和相关议题的态度。许多美国新闻机构和民意调查组织会进行这些调查,并将调查结果发布在网站等媒体上。选民可以通过这些数据了解候选人的支持度和政策立场,从而做出自己的投票选择。

以盖洛普为例,进行全国民调的过程中,调查机构首先采用随机抽样方法,确保样本能够较大程度反映整个选民群体的特征。随后,机构通过电话、手机等方式,从抽样选出的受访者那里获取他们对问卷的答复。数据收集完毕后,机构会对数据进行处理和加权,最终计算出候选人的支持率等关键指标。

但是民众对选举民调的信心在2016年和2020年的美国大选中受到了重大打击。选举民调的准确性可以通过对比预测值与差距进行判断。在这两次大选中,大多数民调机构都未能准确预测特朗普在实际选举结果中的支持率,尤其是2020年。

因此,2020年选举结束后,美国公共舆论研究协会对选举民调进行了复审,发现在2016年和2020年特朗普成为候选人时,全国民调的误差较大。其中,2020年总统选举是近40年来全国民调误差最大的一次,高估了拜登全国选举支持率领先特朗普的幅度达到了3.9个百分点。

1729208872858.png

较大的民调误差往往会让选民无法确定哪位候选人处于领先位置,甚至可能会影响到一些“投同情票”的中间选民的投票决定,因此当特朗普再次成为候选人时,民调机构必须尽力提高调查的准确性。

一般来说,民调误差有四种来源,抽样误差只是其中一种,其余三种民调误差包括未覆盖误差、无响应误差和测量误差。而民调机构在披露误差范围时,往往只提及抽样误差,忽略了其他潜在的误差因素。这种做法可能会误导公众,让人们误以为其他类型的误差并不存在。

1729208886739.png

根据Pew Research Center在2000年至2022年间对78家美国民意调查机构的调查分析报告,为了减少误差,37%的民意调查机构在2020年之后调整了抽样方法或采访方式,或者同时调整两者。

民调机构倾向于采取多种方法,包括多个样本来源和多种调查方式,来减少未覆盖误差和无应答误差。

民调机构使用的抽样方法有几种,比如基于注册选民档案的抽样、随机拨打电话号码、基于美国邮政服务数据库中的住宅地址抽样等方式。调查方式以在线调查、电话访谈和抽样访谈为主,还包括邮件、短信等。

近年来民调机构使用的抽样方法越来越多,2022年39%的民调机构使用两种以上抽样方法,17%的民调机构采用三种以上方法。以Pew Research Center为例,该机构在2014年前仅依赖随机拨号电话采访,之后引入了基于概率抽样的访谈和基于地址抽样的在线或邮件访谈。

1729208898990.png

民意调查大都通过对样本数据进行加权,以确保样本在关键特征上与总体人口保持一致。但是仅依赖年龄、种族和性别等几个特征无法确保结果的准确性,比如2016年民意调查误差的一个疑似因素是未能按教育程度加权。因此,民调机构在加权时需要考虑更多的变量来减少抽样误差,比如The New York Times/Siena College Poll在对样本数据加权时考虑了12个变量,包括党派、年龄、性别、种族、教育、按照大学或非大学教育水平划分的白人/非白人、婚姻状况、房屋所有权、国家地区、投票历史、2020年选举的投票方式、城市/乡村和人口普查区教育水平。

测量误差主要由于问卷设计不当,除了优化问卷设计外,民调机构还采取了其他措施来降低误差。例如,YouGov持续追踪了同一组受访者,观察他们的态度在竞选活动过程中是如何演变的。

虽然民调机构在优化调查方法,但是民调的准确性仍面临两大挑战。

最大的挑战是民调机构难以预测哪些人会参与总统选举投票。特朗普在那些只参加总统选举投票但不参与中期选举投票的群体中,有着较高的支持率。民调机构往往依据选民过去的投票行为来预测谁会参与投票,而预测那些不经常投票的人何时会参与投票是一个挑战。

另一个挑战是与民主党人相比,共和党人参与民调的意愿略有下降,这种现象被称为“党派性的无应答误差”。过去八年,由于政治极化的加剧,保守派对民意调查机构的信任度下降,导致民调结果更有利于民主党候选人。

近期的一些研究也表明民调的平均误差可能是抽样误差的两倍。约1000名受访者样本的抽样误差范围大约在正负3个百分点,因此平均误差大概是正负6个百分点。这意味着当两个候选人的支持率相差不大时,预测胜负变得更加困难。

根据FiveThirtyEight,2020年拜登的全国民调支持率为53.4%,比特朗普高8个百分点,但结果也仅仅是险胜。截至2024年10月14日,哈里斯在全国范围内的民调支持率达到了48.5%,超过了特朗普的46.1%,但是领先幅度远小于拜登入主白宫的2020年。而从七大关键摇摆州的民调来看,哈里斯对特朗普并没有领先优势,这让本就偏向于民主党候选人的民调结果事实上更加支持特朗普当选。至少目前为止,大选整体还是处于难分胜负的胶着状态。

1729208916667.png

1729208931642.png

风险提示

共和党支持人士参与民调的意愿超预期上升;预测投票参与者超预期;平均民调误差减少超预期

本文转载自雪涛宏观笔记,智通财经编辑:陈雯芳。

民调机构在加权时需要考虑更多的变量来减少抽样误差,比如TheNewYorkTimes/SienaCollegePoll在对样本数据加权时考虑了12个变量,包括党派、年龄、性别、种族、教育、按照大学或非大学教育水平划分的白人/非白人、婚姻状况、房屋所有权、国家地区、投票历史、2020年选举的投票方式、城市/乡村和人口普查区教育水平。

美国选举民调是针对总统选举和国会选举等投票活动进行的公众意见调查,通常在选举前进行,目的是捕捉选民对候选人和相关议题的态度。许多美国新闻机构和民意调查组织会进行这些调查,并将调查结果发布在网站等媒体上。选民可以通过这些数据了解候选人的支持度和政策立场,从而做出自己的投票选择。

以盖洛普为例,进行全国民调的过程中,调查机构首先采用随机抽样方法,确保样本能够较大程度反映整个选民群体的特征。随后,机构通过电话、手机等方式,从抽样选出的受访者那里获取他们对问卷的答复。数据收集完毕后,机构会对数据进行处理和加权,最终计算出候选人的支持率等关键指标。

但是民众对选举民调的信心在2016年和2020年的美国大选中受到了重大打击。选举民调的准确性可以通过对比预测值与差距进行判断。在这两次大选中,大多数民调机构都未能准确预测特朗普在实际选举结果中的支持率,尤其是2020年。

因此,2020年选举结束后,美国公共舆论研究协会对选举民调进行了复审,发现在2016年和2020年特朗普成为候选人时,全国民调的误差较大。其中,2020年总统选举是近40年来全国民调误差最大的一次,高估了拜登全国选举支持率领先特朗普的幅度达到了3.9个百分点。

1729208872858.png

较大的民调误差往往会让选民无法确定哪位候选人处于领先位置,甚至可能会影响到一些“投同情票”的中间选民的投票决定,因此当特朗普再次成为候选人时,民调机构必须尽力提高调查的准确性。

一般来说,民调误差有四种来源,抽样误差只是其中一种,其余三种民调误差包括未覆盖误差、无响应误差和测量误差。而民调机构在披露误差范围时,往往只提及抽样误差,忽略了其他潜在的误差因素。这种做法可能会误导公众,让人们误以为其他类型的误差并不存在。

1729208886739.png

根据Pew Research Center在2000年至2022年间对78家美国民意调查机构的调查分析报告,为了减少误差,37%的民意调查机构在2020年之后调整了抽样方法或采访方式,或者同时调整两者。

民调机构倾向于采取多种方法,包括多个样本来源和多种调查方式,来减少未覆盖误差和无应答误差。

民调机构使用的抽样方法有几种,比如基于注册选民档案的抽样、随机拨打电话号码、基于美国邮政服务数据库中的住宅地址抽样等方式。调查方式以在线调查、电话访谈和抽样访谈为主,还包括邮件、短信等。

近年来民调机构使用的抽样方法越来越多,2022年39%的民调机构使用两种以上抽样方法,17%的民调机构采用三种以上方法。以Pew Research Center为例,该机构在2014年前仅依赖随机拨号电话采访,之后引入了基于概率抽样的访谈和基于地址抽样的在线或邮件访谈。

1729208898990.png

民意调查大都通过对样本数据进行加权,以确保样本在关键特征上与总体人口保持一致。但是仅依赖年龄、种族和性别等几个特征无法确保结果的准确性,比如2016年民意调查误差的一个疑似因素是未能按教育程度加权。因此,民调机构在加权时需要考虑更多的变量来减少抽样误差,比如The New York Times/Siena College Poll在对样本数据加权时考虑了12个变量,包括党派、年龄、性别、种族、教育、按照大学或非大学教育水平划分的白人/非白人、婚姻状况、房屋所有权、国家地区、投票历史、2020年选举的投票方式、城市/乡村和人口普查区教育水平。

测量误差主要由于问卷设计不当,除了优化问卷设计外,民调机构还采取了其他措施来降低误差。例如,YouGov持续追踪了同一组受访者,观察他们的态度在竞选活动过程中是如何演变的。

虽然民调机构在优化调查方法,但是民调的准确性仍面临两大挑战。

最大的挑战是民调机构难以预测哪些人会参与总统选举投票。特朗普在那些只参加总统选举投票但不参与中期选举投票的群体中,有着较高的支持率。民调机构往往依据选民过去的投票行为来预测谁会参与投票,而预测那些不经常投票的人何时会参与投票是一个挑战。

另一个挑战是与民主党人相比,共和党人参与民调的意愿略有下降,这种现象被称为“党派性的无应答误差”。过去八年,由于政治极化的加剧,保守派对民意调查机构的信任度下降,导致民调结果更有利于民主党候选人。

近期的一些研究也表明民调的平均误差可能是抽样误差的两倍。约1000名受访者样本的抽样误差范围大约在正负3个百分点,因此平均误差大概是正负6个百分点。这意味着当两个候选人的支持率相差不大时,预测胜负变得更加困难。

根据FiveThirtyEight,2020年拜登的全国民调支持率为53.4%,比特朗普高8个百分点,但结果也仅仅是险胜。截至2024年10月14日,哈里斯在全国范围内的民调支持率达到了48.5%,超过了特朗普的46.1%,但是领先幅度远小于拜登入主白宫的2020年。而从七大关键摇摆州的民调来看,哈里斯对特朗普并没有领先优势,这让本就偏向于民主党候选人的民调结果事实上更加支持特朗普当选。至少目前为止,大选整体还是处于难分胜负的胶着状态。

1729208916667.png

1729208931642.png

风险提示

共和党支持人士参与民调的意愿超预期上升;预测投票参与者超预期;平均民调误差减少超预期

本文转载自雪涛宏观笔记,智通财经编辑:陈雯芳。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开