美国大选媒体民调“玩脱”?警惕数据陷阱!

一天一堂舆情课   2016-11-10 11:16  

2016年美国总统大选于今日尘埃落定,70岁的地产大亨、政治门外汉唐纳德•特朗普(中文网民更倾向于使用“川普”)击败69岁的前第一夫人、国务卿希拉里•克林顿,狙击了后者成为美国第一位女总统的梦想。

在美国,今夜是几家欢喜几家愁,甚至加拿大移民局的官网都被失望的希拉里支持者们踩塌了,而在太平洋的这一边,隔岸观火的吃瓜群众们一边刷着各种段子,一边也露出了难以置信的表情。

舆情课的童鞋们,收拾收拾瓜子瓜皮准备上课了!今天的舆情课时间,舆情君要提出一个很严肃的问题:

美国大选,为什么主流非主流的民调预测全都失算了?

1

截至开票前一天(11月8日),几乎所有美国主流媒体的民意调查结果均显示希拉里完胜,几乎是躺赢的优势。

如果说媒体民调可能带有引导性,比如CNN因过度偏向希拉里而被网民调侃CNN=Clinton News Network(克林顿新闻网),那么像FiveThirtyEight这样通过搜集整理大范围的数据和各种层面的民意调查再通过数学算法得到大选胜率的大数据预测为何也出现如此大的偏差?

2

纽约时报网站的预测结果,以开票后不久为分水岭,画了一个漂(gan)亮(ga)的X。

3

今天美国大选的“翻盘”结果是不是有种熟悉的味道?

是的,吃瓜群众上一次跌碎一地眼镜就在2016年6月23日,英国举行“脱欧公投”。

4

英国人民在一片“留欧无悬念”的预测中,投出了脱欧51.9%比留欧48.1%的结果,搞了个大新闻。

那么回到舆情君的问题上来。民调不准了,大数据预测也不准了,WHY?

舆情君从事网络舆情分析工作多年,一直秉持“客观中立 实事求是”原则,一切结论都必须建立在真实的数据基础上。如果调查统计的样本量过小或者取样分布不平衡,都可能导致计算结果的失真。

这次美国大选民调的大面积失算,舆情君认为既有媒体站队引导的主观因素,也有错把网络舆论当成整个社会民意的失误。

首先,即使在互联网高度发达的美国,仍然有数量庞大的人群生活在网络社会之外,因此各种网络民调、大数据预测或多或少存在样本分布偏颇的问题;

第二,网民人口与现实人口在年龄分布、地域分布、教育程度分布等人口结构上也存在偏差。这一点从大选结果中也得到了印证,希拉里在许多城市获胜(蓝),而川普则赢下大片农村(红)。网民戏称“这是农村包围城市的胜利”。

5

第三,即使在网络上,也存在着“沉默的大多数”现象。当Facebook投资人Peter Thiel因为公开支持川普而面临“众叛亲离”甚至被人“开除Gay籍”,在这样的舆论环境下,谁也不知道究竟有多少川普支持者选择了在网络上保持沉默。这恐怕就是FiveThirtyEight这样的大数据计算难以攻克的Bug吧。

舆情君一直认为,舆情分析是一项需要科学严谨态度和方法论的专业工作,如何平衡样本分布,如何避开数据陷阱,都需要舆情分析师深厚的专业功底和与时俱进的学习能力。

文章来源于网络,仅代表作者观点。欢迎关注独家网(www.dooo.cc)
责任编辑:张幂 关键词: 美国大选 数据陷阱 美国大选民调

相关阅读

发表评论



返回顶部