美国大选民调到底准不准?普选阶段怎么围观?

欧柏拉微博   欧柏拉   2016-08-27 12:49  

内行看门道,外行看热闹。比起封面上这种花花绿绿的选举人票地图,一般人,特别是国内的大选围观党,日常跟踪选情还是更愿意看方便又直观的民意调查结果。但每当民调结果不利于自己中意的候选人时,总有人会跳出来说民调不准,或者媒体作假。特别今年的候选人川普,不断强调媒体对他不公,并且说民调有问题,很多人也很相信他。那么问题来了,撇开媒体的公平性不谈,单看各大台时不时放出的民调,这些数据到底准不准呢?有没有必要关注?

一、首先必须了解下什么是大选民调

我们平时看到的民调,一般是由专门的民调机构,各种报章/杂志/电视/网络/媒体,以及大学研究机构搞得。而美国大选的民调,主要是各大媒体独立展开,或与民调机构合作进行的。比如,在今年的大选民调中,CBS News和Fox News就是独立展开的,而选择合作的有:CNN与ORC,ABC News与《华盛顿邮报》,NBC News分别与《华尔街日报》和网络调查公司SurveyMonke建立了合作。这几个都是我们在媒体上经常看到的引用数据来源。除了这些以外,还有其他很多大选民调,虽然没具体数过,但二三十个是跑不掉的。

从作用上讲,国内很多大选围观党似乎将大选民调简单地看做是对大选结果的预测,这种看法其实是错误的。实际上,针对最终结果进行预测的民调,是投票日前几天,甚至投票前几小时内展开的那些。更早阶段的民调,都是为了跟踪选情,以及识别确认能对选情产生影响的各种问题。

除了上述机构媒体的展开的民调外,还有一种是由竞选双方团队搞的。而对民调投入最大的,往往就是后者。因为他们需要民调结果来了解选民,确定目标群体,选择议题,制定竞选策略。当团队发现了新问题,候选人就能据此及时有效地作出调整。所以,竞选团队展开的民调,往往更加细致全面,有时甚至会细化到具体街道。 但这些民调我们是看不到的。为防止对受访者产生干扰,这种民调一般不会透露自己的身份背景,有些民调机构在协助展开调查时,他们的调查员也不知道是在为谁做什么民调。当然,各候选人团队也会选择性地公布对自己有利的民调结果,但这种结果虽然有着很高的质量,但却不能全面地反映现状。

二、那么民调数据是怎么得出来的?

其实大选民调和普通民调一样,都是通过采样统计得出的。简单说来,就是随机挑选一批选民,了解他们的投票倾向,最后统计一下就能得出结果。但说是这么说,实际操作起来,中间会有很多问题。

首先是采样。

从理论上讲,应该对所有选民进行随机采样,查一下选民登记,就能知道哪些人是注册过的。但是,受技术和资源的限制,民调机构无法保证每个被抽中的人是否都能联系的上,也无法保证每个被联系上的人是否都愿意参加调查,更加确定不了他们最后会不会去投票(比如在纽约这种深蓝左州,亲共和党选民大概只占20%,由于赢者通吃的选举人票制度,他们去不去投票,对这个州的最终结果影响都不大,所以很多亲右选民干脆就不去投票了)。因为这些原因,民调机构只能把潜在样本限制在能力所及的一定范围内,并希望找到的人可以代表整个目标选民群体。但如果这些人代表不了,那结果就会出错。

举两个例子:

上世纪30年代,在罗斯福对阿尔夫·兰登的选战中,曾有个杂志社向家里有电话的人寄明信片,并邀请收信者回电话,告诉他们自己都支持谁,结果有200多万人回了电话。于是杂志社根据反馈,得出了兰登将赢得大选的结论。我们现在都知道这个预测是错的了。但原因是什么呢?答案就是采样。200万个样本虽然数量巨大,但却不是随机的,这些样本的先决条件就是必须拥有电话。而罗斯福的支持者大多是低收入者,他们没有电话,因此收不到明信片,就算收到了也不太可能主动去回复。但另一个家刚成立了一年的民调公司盖洛普(Gallup),只用了5万样本,得出了完全相反的结果。盖洛普也因此一战成名。

另一个例子是最近ABC News搞得线上调查(下图)。他们8月12日,在自家网站上搞了个“你会投给谁”的网上民调,参加的人大概有11万+,但却得出了与当时大多数民调完全相反的结果:川普支持率为70%,而希拉里只有6%,位列第三。但当时,川普正因其对牺牲穆斯林士兵家庭的攻击,以及乱讲话等问题备受批评,民调下滑的十分厉害。这种明显不对劲的数据,问题也是出在采样上——谁都能参加的投票是没有办法对样本进行控制的。

8月12日ABC News线上民调结果                 8月12日ABC News线上民调结果

确定采样后就到了调查询问阶段,这一部分要从两方面来讲:调查手段和询问手段。

先看调查手段。上文中曾提到过,早期民调有寄明信片的。而现在一般都是直接打电话。传统电话调查都是打座机,但随着社会不断发展,一方面绝大多数人都用手机了,另一方面越来越多的人都放弃了座机(在人手一部手机的今天你家还有座机吗(⊙_⊙;)…)。同时,这种方式也容易产生采样偏差问题,比如打座机号容易调查到年长人士,他们通常都偏向共和党,而打手机号则容易抽到年轻人,他们大多是民主党选民。当然,这只是电话调查的弊端之一,这种调查方式还会因拨打时段,号码地区范围等因素导致很多问题。因此,调查手段只会随着科技和社会进步不断发展,例如,比起2000年,今年的大选中,网上民调就有了显著增长,每家大媒体网站上都能找到相关调查。

除了这些常见方法外,民调机构还想出了一些奇葩招数,比如2012年的大选就出现了通过x-box来搞民调(我猜下一步该植入Pokemon GO了,让玩家直接到调查点,完成调查任务就发稀有宠物神马的)。但这样做也有问题。首先是玩家群体固定,采样不具普遍性。但有坏处就一定有好处(咦?这话好像不是这么说的?),这样的样本能用来做长期跟踪调查,可以研究一段时间内特定群体的民意变化。

再来看看询问手段。这部分就比较复杂了,可操作性和错误发生率也是最高的。以电话调查来说,一般民调电话都是周一至周五晚上,如果没人接,调查员第二天一般会再打一遍来降低采样误差。如果接电话的不讲英语,还会配上双语调查员。虽然做了许多提升沟通效率的工作,但实际询问过程中,也不一定就能得到真实有效的数据。

从选民方面来看:在被问到的时候,有些人可能还没下决定,有些人则是不愿表态。对于后者,最著名的例子就是布莱德利效应(Bradley effect)。汤姆·布拉德利(Tom Bradley)是80年代的洛杉矶市长,他曾两次参选加州州长,均已失败告终。

但在竞选过程中,布拉德利的民调数据始终领先对手 5个百分点,但最终投票结果却往往落后6个百分点,这一进一出,误差就达到了10个百分点左右。同样的情况在后来其它几个城市的地方选举中也出现过,社会学家对此做出的解释是,当一个选举中有黑人候选人的时候,民意测验的调查对象,尤其是白人,不愿意表现出自己种族歧视的一面,通常会向民意测验撒谎,表示会支持黑人候选者,但是到了该投票的时候,这些人则会从白人候选者中挑选投票的对象。

以上摘自百度百科。简言之,布莱德利效应就是说,选民在民调中往往不愿意说出“政治不正确”的答案,但投票时却做出相反的选择。在这个问题上,国内外的川普粉都寄予了很大的希望,很多人甚至指望着靠它来翻盘。但对于各大民调机构而言,如果出现这种情况,会对他们造成很严重的影响,至于为什么,将在下一节准确率部分进行解答。

从调查员的角度来说:正是因为存在这样或那样的问题,调查员在提问时就必须注意掌控节奏,调整提问方式。能不能问出个所以然来,关键还要看个人的经验。另外,在第一部分我们提到过,前期民调的作用不是预测选举结果,而是跟踪选情和发现问题。因此,除了“你支持谁”这种问题,调查员还需要了解选民的更多个人信息,比如种族、年龄、性别、收入、教育背景等。除了这些信息,还有两个国内网友不太熟悉,但民调中经常会被问到的问题——党派倾向和投票意愿。党派倾向不是指受访者登记的是哪个党,而是针对在当前选举中,受访者支持哪个党。今年的大选民调就经常涉及这个问题。两党选民对各自党派和对方党派的候选人都十分不满意,有很多人因各种理由转而支持对方党派的候选人了,比如民主党内原来支持桑德斯的人,以及共和党内受不了川普的那些。当然也有很多人因为太失望,表示这次大选最后可能不会去投票的,而这就是投票意愿。这个问题是没有“标准答案”的,随时可能产生变化。但因为属于关键问题,调查员还是得问,民调机构最后会用自己的模型来判断选民会不会去投票。

经过复杂的采样和调查,最后就是数据的整理和分析。

从表面上看,大家把上面得到的结果归类整理一下就可以了。但因为上文中提到的各种问题,这个归类整理也会变得复杂。因为民调机构在平时的调查中都积累了很多选民数据,所以为了消除随机出现的非正常波动,他们会对种族、年龄、性别、教育背景等短期不会发生变化的信息进行检查。如果某些群体的数据与已知数据出现偏差,就通过加权等方式进行调整,以便得出正确结果。大部分民调到这里就完了,但也有些机构会考虑对其他因素进行调整,比如上面提到的党派倾向。但大部分民调认为,党派倾向和投票意愿在短时间内可能反复发生变化,导致数据波动,反而不利于得出真实结果。

三、所以准确率到底有多高?

啰嗦了那么多,而且都是说民调结果很容易出错,这听起来好像更不可信了?恰恰相反,对普通人而言,民调反而是值得信任的。

从采样上看

以今年为例,7天以下民调的样本数大多为800-2000人,绝大部分都在1000-1300人上下浮动。一开始提到过的NBC News和SurveyMonke合作的网络调查,因其网络采样特性,样本数一般都在1万人以上。这样的样本容量并不高,很多人都会怀疑,难道八九百个人的意见就能代表整个州,乃至全国的民意了吗?还真是这样。

在一般统计中,的确是样本数越大,结论越精确。但想知道的越详细,采样标准就越多。所以重点不是问了多少人,而是采样的方法和采出了哪些人。举个栗子:如果民调执行时间是9:00-17:00,那么基本上就采不到上班族。而如果只通过电台来采样,那么受访者本身就是经过挑选的——电台听众,而喜欢看电视、上网或看杂志的人就采不到。在这些情况中,愿意参加民调的人,他们的答案很可能与其他人的不一样。

至于八九百个人能不能代表2亿美国人民的意见,这个问题涉及到统计学的基本知识。在统计学中,统计可靠性的根本就是概率,即:随机得到特定结果的几率。比如抛硬币,抛一次只可能得到2种结果:要么正面,要么反面,两种结果的几率都是50%。连续抛2次则可能得到4种结果:正正,正反,反正,反反。此时,连续出现正面(或反面)的几率只有25%。随着抛硬币的次数增加,这种连续出现相同结果的几率会不断下降,并无限接近于零。(注意,民调需要的正是减少这种连续出现相同结果的几率,让数据达到“随机”的效果。这不是做数学题,让你算出现某种特定结果的概率,别被绕进去了。 )

抽样调查可靠性的原理也是一样的,当抽样数达到一定量后,会无限接近于真实结果。假设对全国所有人进行调查,得出40%的人会给希拉里投票的结论。那么以1000人为样本的抽样调查为例,其结果会有95%的几率出现在37%-43%这个区间内,而这个区间叫做置信区间。1000样本量抽样调查的置信区间一般是±3%。也就是说1000人的抽样调查,就能有95%的几率得出与真实民意误差不超过±3%的结果。

现实情况是,没有固定的理想样本量。任何样本量的抽样调查都有一定的准确性。而民调统计要考虑的问题,是这个准确性是否足以得出与统计公式计算得出一样的结果。

从调查和数据分析上看:

根据上一节调查询问手段的介绍,我们对民调实际操作中的复杂性能有一个大概了解。正是因为复杂,所以调查员的个人能力和经验,问题的设计,甚至受访者的心情,都能对结果产生影响,但这种影响大部分时候是可以忽略不计的。因为调查员得到的数据,最终还需要通过加权等方式进行调整,而受访者也不可能全都心情特别好,或者特别不好。理论上说,以下几种情况可能导致民调数据出现重大失误:民调机构有意或无意地使用了单一样本,问题设计明显有误,大部分调查员的能力都差到掉渣。但这基本上是不太可能出现,除非这家民调公司或媒体以后不想做生意了。

同时,因为调查和分析方法不同,各家民调数据也会略有差异。各大网站甚至会把主要民调的结果综合一下,做成自己的独家大选预测。这种综合的方法有求平均值的,也有加权计算的。花样繁多。

从媒体和民调机构上看:

前面讲到布莱德利效应时曾提过,如果出现这种情况,会对民调公司产生很严重的影响。现在就来谈谈为什么会这样。

说到底,大选民调只是市场调查的一个分支。对专业民调公司而言,大选民调本身是赚不到什么钱的,因为数据都是免费发布。虽然这些企业会再此过程中收集数据,以后卖给政客什么的,但这项业务本身主要起的还是一个宣传作用。反之,数据如果出错,就会砸招牌。

上次大选就曾出现这种情况。有很多大型民调机构的数据都显示罗姆尼会赢,但最后他输了。前面提到过的老牌公司盖洛普(Gallup)就遭遇过这种滑铁卢。2000年小布什对战戈尔时,盖洛普的民调产生过大幅波动,并且与最终结果不符。而2012年奥巴马对战罗姆尼时,也出现了同样的失误,罗姆尼的数据甚至比其他民调公司的更高,而且被媒体反复引用,结果罗姆尼输了。本来就是为了宣传自己怎么牛逼才搞得东西,最后居然打了自己的脸?还不止一次?于是今年的大选盖洛普干脆就没参与。

另外还有家叫拉斯穆森报告(Rasmussen Reports)的公司,他们的故事则从另一个方面证明了大家为什么可以相信民调数据。这家公司也很有名,天天都有民调发布。但在他们的数据里,共和党的数据总是比其他民调的要好一点,偏差太明显,以至于FOX News在上次大选时决定不再采用他们的民调,毕竟媒体的影响力是要靠口碑累积出来的。今年拉斯穆森报告也参与了民调,还没注意到哪家媒体有引用过。

综上所述,大选民调是一项基于科学的统计调查,虽然因其复杂性导致结果不一定精确,但各大民调机构和媒体就算为了自己,也不会随便乱搞。而随着技术和民调行业的发展,其数据准确率在不断提高。现在的民调基本上已经相当靠谱了。普通人通过民调了解到的选情是能够反映真实情况的。

在结束民调科普前,容在下吐槽一句:赵薇真的没有操纵美国大选,同理,希拉里也没有操纵民调。想操纵几十家民调机构和媒体,想想那个难度吧。就算是某一家数据造假,也很容易被统计学家发现的,再说了,民众的眼睛是如此的雪亮。另外,如果最后真出现了布莱德利效应,那也怪不到民调头上,你给我了一堆假数据,难道还要指望我算出个真结果?

四、怎么围观普选阶段的民调?

终于了解完了民调(看到这里的都是小天使(づ ̄3 ̄)づ╭❤~),现在再来看看普选。大选只剩下70多天了,在这2个多月的时间里,民调还能有什么作用?为什么新闻上的全国民调少了?各州的民调多了?那几个州我都不认识,他们今天这个州明天那个州的报,到底什么意思?怎样才能更好的围观选战?要回答这些问题,还是必须回到封面上那张花花绿绿的选举人票地图上。

美国选举制度其实是很复杂的,而且也不是就像他们一直宣传的那样,大家一人一票来搞真·普选,最后看的还是各州普选胜出者拿到的总选举人票数(不懂什么是选举人票的自行百度吧)。简单说来,就是各州加起来一共有538张票,谁能拿到270票,谁就当选总统。说到这里,也许会有人问:“下面那张图里,希拉里都已经有273票了,还选什么?”,别急,马上就会讲到。

先来看图,下图是封面图的完整版,深红和深蓝分别代表已基本确定的州,意思是这些地方“几乎不可能再出现变化,立场非常明确,可以不用管了”。而粉红和粉蓝则表示“偏向于共和党”以及“偏向于民主党”的州,也就是说,这些州还有能再争取争取。最后5个黄色的就是摇摆州,又称战场州,游离州或紫州。而后面两者,就是接下来的看点。

目前的选举人票地图目前的选举人票地图

注:图片来源戳我→2016 CNN MAP←(别争论什么CNN不CNN的,这种地图各家都一样。另外,图里的票数可以左右加减,下文会用到,想玩儿的可以点这个链接,自备梯子。进去后点黑色按钮“begin”,然后选第一张图“2016 cnn map recommended”就能到这张图了。)

上图中黑框标出的是内布拉斯加州(红右)和缅因州(蓝左)。与其他州的“赢者通吃”得票制不一样(即:该州普选胜利者获得这个州的所有选举人票),这两个州是按普选得票比例来分配选举人票的。其中,缅因州共有4票,2票归赢了全州普选的人,赢了2个国会选区就再得2票。 布拉斯加州也是如此,共有5票,2票归全州普选胜利者,3个国会选区提供3票(上图用的标注逻辑有点不同,但大概意思一样) 。 现在,我们从图中可以看到,这两个州分别被标出成了深红和深蓝, 因此两个州可以不用再关注了。所以,现在能影响大选结果的,只剩下5个黄色的摇摆州,3个粉红州和6个粉蓝州。

那么接着我们来算算账。根据上图,让我们先假设川普赢了所有摇摆州,把全部(5个摇摆州的)74张票全加到他的头上,结果如下图所示,他依然只有265票,还是希拉里当选:

假设川普赢了所有摇摆州假设川普赢了所有摇摆州

这是不是意味着川普输定了呢?并没有。因为此时他只差5票,也就是说,只要他能争取到除新罕布什州(4票)以外的任何一个粉蓝州,就能取得胜利。当然,如果他争取到的恰好是新罕布什,就会出现269比269的平局,这时会导致一个相当特殊的情况:

根据目前《宪法第12条修正案》的规定,当没有候选人获得270票(共538票)时,将由众议院决定最终大选结果。众议院会给每个州1张选票,对最终得票数最多的3名候选人进行投票,胜者当选总统。美国历史上曾出现过2次这样的情况,而且涉及到的都是大家比较熟悉的总统:

1801年:托马斯·杰斐逊和艾伦·伯尔都是民主共和党人。尽管伯尔竞选的是副总统而不是总统,但两人获得的选举人票数相同。经过众议院连续36次投票,杰斐逊最终当选总统。1825年:安德鲁·杰克逊获得的选票数比约翰·昆西·亚当斯多,但两人都未能获得当时规定当选总统必需的131张选举人票。亚当斯在众议院的第一轮投票表决中获胜。

当然,上面说的是非常理想的情况,期待川普赢得所有摇摆州这种设定本来就不现实。

另一方面,希拉里的选情就简单多了。只要稳住自己的粉蓝州,基本就赢了。如果再拿下一两个摇摆州扩大领先优势,那当选简直不要太容易。

所以根据以上分析,在接下来70多天里,我们只用关注这几个摇摆州和可能发生变化的粉红粉蓝州民调就行了。附上8月24日的最新民调结果,格式为川普红/希拉里蓝

摇摆州:佛罗里达(43%/41%),爱荷华(40%/40%),内华达(42%/44%),北卡罗来纳(42%/44%),俄亥俄(39%/43%);

粉红州:亚利桑那(45%/38%),佐治亚 (43%/43%) ,犹他 (39%/24%) ;

粉蓝州:科罗拉多(33%/41%),密西根 (37%/44%) ,新罕布什 (36%/45%) ,宾夕法尼亚 (36%/45%) ,弗吉尼亚 (32%/48%) ,威斯康辛 (33%/42%) 。

其实最近两周,川普的数据是在回升的(还记得两党大会后他那惨淡的民调数据吗(@﹏@)~大雾),但从上面的数据可以看出,他在摇摆州的优势并不大。而在他自己的粉红州里,佐治亚的民调居然被追平了。根据上面的分析,如果他想赢,那就必须争取到希拉里的粉蓝州,但从数据上看,川普想在这些州上赢过希拉里还是很不容易的。当然,大选还剩70多天,也不是说希拉里就稳赢了,毕竟一两周前,大家也不会想到希拉里的邮件门和基金会事件能闹成这样(手动doge脸.jpg)。

最后,总统选举当然少不了总统辩论,表现的特别好(或特别不好)也能使选情发生变动。再加上今年的候选人都特别的能说会道且不受欢迎(再次手动doge脸.jpg),光脑补出的画面就让人无法不期待了。附上一张辩论时间表方便大家到时候围观:

总统及副总统辩论时间表总统及副总统辩论时间表

(呃,到时候辩论视频肯定会做,但大选辩论都很长,所以应该会和其他独立字幕菌还有字幕组合作吧……敬请期待!)

文章来源于网络,仅代表作者观点。欢迎关注独家网(www.dooo.cc)

发表评论



返回顶部