第8期科学报道工作坊:别让数字吓到你2.0(上)

工作坊第8期网络海报

Scamp团队第一次到上海就被上海学员们的热情感动了!有提前一小时到场的学员,更多的是与Scamp一起共度4个多小时直到了6点一刻才恋恋不舍回家的学员!

趁热打铁,在此奉上本期科学报道工作坊的大礼包——陈丽云、李舰的演讲ppt&随堂手册,送给现场与远程学员。同时,我们也撰写好了活动回顾,也请学员写了他们的感想,第8期学员回顾  请大家多多指正!

陈丽云演讲

李舰演讲

随堂手册

导语

3 月3日的第五期科学报道工作坊,收到了与会学员令人惊喜的反馈。有人表示,数字好比前女友,曾经爱过但已没了感觉,通过参加这次活动,希望“和‘前女友’ 找点感觉。不打算‘复合’,但也不想成为‘最熟悉的陌生人’”;还有人说,希望自己能利用所学,写出高质量的新闻报道,成为以后可供他人研究的材料。 这样发自肺腑的感言给了科学报道工作坊团队最大的激励。这次第八期工作坊第一次走出北京,落地魔都,我们再次以“别让数字吓到你”为主题,从“数字让生活 更美好”和“道题图说”两方面揭开“数字”世界的冰山一角,希望听者领略更多数字图形之美。

数字,让报道更美好

讲者:陈丽云

第 一小节演讲由经济学硕士陈丽云完成。讲者毕业于巴塞罗那经济研究院,现从事IT和电信行业的经济咨询工作。拥有多年数据分析实践经验,擅长数据挖掘、商业 决策模型、计量经济分析、社会网络分析、大数据处理等。曾任上海R语言会议主席、并多次在国际国内会议上发表演讲,强调数字与直觉的联系。撰写独立博客达 6年之久,累计1000余篇博文、常年订阅读者亦已近千。微博:@cloudly

 

开场前,陈丽云问了大家一个问题,在座的60名学员中,有多少人能找到跟自己同月同日生的“同生缘”?请大家把自己认为的答案写在纸上,一会儿我们会请学员自报生日揭晓答案,猜对的同学会有小礼品。虽然正在阅读这段文字的你可能不在现场,但你也可以猜一猜,结果下文公布。

一定需要数字吗?

世界多彩斑斓,你可以用语言去描绘,也可以用数字去描述。但,一定要用到数字吗? 如果要描述以下三只土豆的大小,你会用什么方式呢?

clip_image001[6]

【你 会选择哪套标签?“中,大,超大”还是“100g,150g, 200g”?】 “中,大,超大”这套标签,其实已经足够应付日常生活中的描述需求,换做用100g,150g, 200g”,相比反而失去了直观性。这个例子说明,精确的数字描述并不一定适用于所有情境。

又比如说天气预报,每天都会预报最高温最低温,可是你对数字真的那么敏感吗?你能很明显地觉察到20°C与21°C的区别吗?恐怕也不是那么容易,所以说,人们对于数字,有时也并不敏感。

再看下面这张图,思考这位铜面老人被游人逗弄最多的部位是哪? clip_image002[6]

就算不告诉你老人各个部位被游人抚摸的次数的统计结果,相信你也能很快悟到答案,没错,是他闪闪发光的胡子。 以上几个例子分别指出数字描述有时并不需要那么精确;人们对数字的敏感度也很有限;甚至有时数字并不是描述事物的最理想角度。

统计常识,应用的基础

数字,原来并非万能,那为什么还要强调数字?

数 字并非人类凭空创造的,简单明了地描述世界。而指标,是根据需求创造的,是为了让人以一种更舒服的方式接受信息。新闻报道中的数字与指标,功用也在于此。 第一个问题,普查和调查。普查很简单,大家最熟悉的例子恐怕就是大学老师点名制。作为老师,希望每个人都到场,可以一个一个点名,把人都点一遍,这就是普 查。百密而无一疏,但操作时考虑时间和调查成本,不可能任何调查都这么做,有时也没有必要,而且考虑到普查进行时样本产生变化等等局限性,普查有时候反而 不如抽查。相应的,我们还有其他办法,就是抽查。很简单,想知道谁上课没来,随机抽几个学号,如果不在,那你就是没有来,老师可能认为你上一次也没有来。 抽查是以一定的概率认为这个事件是真的可能性,但样本要够大,要有足够的代表性。 调查常常要用到问卷,为了保证调查结果的可信性,在设计调查问卷的时候,应该保持一种基本的公平和客观。

以下是前阵子微博上爆出的某地的一 份民意调查。 如果按照上图的问卷去调查,那么即使得出100%的居民认为社区治安较好这样的结果也没有用。因为问卷的选项并没有涵盖所有可能的结果,而只是人为的设置 了两个,其调查结果也是没有意义的。如果这个问题的答案有五个选项,覆盖从高到低五个层次的满意度,才可能更加真实的反映回答问卷的人的想法。

clip_image003[6]

 

再 谈谈数据来源的问题。新闻报道中接触的数字,往往来源于其他机构或者个人的调查结果。比如最近几年,医药界研究人员认为“发表偏见”极大地影响了临床研 究,具体表现在:只有“有效”的结果才好被发表。 说到数据来源,不可回避的问题还有:相对可靠的信源有哪些?首先,权威学术期刊,要经过很多审稿人、流程的修订,对试验方法、得出的数字进行一系列检验; 专业机构的官方网站,他们网站上定期更新,一般这种数字来源是比较可信赖的;主流媒体,主流媒体比较难定义,可能对主流媒体的定义,也没那么清晰;微博, 每个人都可以发,很多东西没有经过人检验,只是一厢情愿的在那儿写,只注重煽动性,很容易引起群体呼应。看到微博上的信息,自己要先判断事件本身可不可 能,然后看微博发布者是不是值得信赖。

拿到了相对可靠的数字,处理时需要掌握哪些基本知识?

平均数。平均数作为一个非常常用的指标,常常被用来代表总体,但它有一个巨大的缺陷,就是容易被离群极值影响。

中 位数,即一组数据中从小到大排,位于中间的数。很多时候我们习惯于用平均数,但平均数字的概念不一定适用于所有情况。比如今年比较流行的是上海市白领的平 均工资7千多、8千多。平均收入并不能反映上海人整体收入情况。比如在场60人,平均月收入1万,这时比尔盖茨来了,诸位的平均收入可能一下子飙过了 1000万。显然,这样的“平均”,不能代表群体的大致水平。

平均数与方差,方差是用来描述群体分布特性的另一个概念。哈佛校长校内讨论时 说了一句话,原文:“there is relatively clear evidence that whatever the difference in means…there is a difference in the standard deviation, and variability of a male and a female population. (男性和女性的智力分布有一些不同,虽然平均值一样,但男性智力的方差要大于女性)”。可美国媒体直接解释为,男性智商平均高于女性。校长的这句话并没有 被当成一个科学问题来探讨,而是被当成性别歧视,最终迫使校长辞职。其实,原话的意思是:总体上讲,男人不比女人聪明,女人也不比男人聪明。但是女性智商 相对集中在平均值附近,男性则在低端和高端都散得比较开。

样本量。调查了多少人,对多少件事做了取样,样本量就是多少。1936年美国总统 选举调期间出现了一个经典的南辕北辙的民调。某媒体调查显示,57%的人支持竞选者阿尔夫.兰登,而只有43%的人支持罗斯福。所以预测罗斯福要下台。可 结果罗斯福得到了62%的选票,获得连任。为什么有这样的现象?之前的调查结果受到了很大质疑,该媒体也进一步挖掘了原因。结果发现,1936有线电话刚 刚兴起,他们采用固话进行调查,自认为比较高效。但当时能装电话的家庭是少数,这部分人往往是高收入、高学历的中高产阶级,由此得出的民调的结果实际反映 的是这些人的心愿,而忽略了装不起电话的人心里的想法。这样的选择性样本得出的调查结果极大的偏离了总体情况。 当你进行抽样调查的时候,抽查样本是要随机取的,抽样方法有简单抽样、分层抽样和系统抽样,这里就不展开了。用不够有代表性的样本来反映总体就好比盲人摸 象,每个人摸到象的一部分,然后告诉大家象就是这个样子。 clip_image005[6]

统计误导

你被“平均”了吗?

上 文提到平均值易受极值影响,杜蕾斯2004年全球调查就是个例子。调查显示结果是中国人平均性伴侣最多,达到19.3,而与此同时全球的平均数是 10.5。这个报道一出, 中国民众就哗然了,怎么可能呢? 很多人就感慨又一次被平均了。不但是被很多官方的报道平均,商业报道也会平均你。对于这个调查的争议是它的方法。因为调查者认为这 个问题比较敏感,所以采取网络调查的形式,而一般上网的人,可能年轻人多一点,本来就比较活跃,选择了一部分本来就会比较活跃的人来回答这么一个问题,调 查结果可能完全无法适用于大众群体。再一个问题,调查提供一个链接,愿意填就填,可能越是倾向于填这个调查的人,本身越是活跃。而且调查者的答案真的可信 吗?一些科学的研究发现,回答这类问题时,男性倾向于把数字说得多一点。人们心理上的强烈感知常常被利用,被灌输并非反映客观情况的结论。

有那么多巧合?

先看一则天蝎座的神话。李 彦宏、马化腾、周鸿祎等等IT大侠都是天蝎座,有人得出结论“天蝎座一统IT界”。这是真的吗?其实,中国人口按出生日期进行统计,最高的就是天蝎座,占 总人口的12%,而巨蟹座只有不到7%。这说明天蝎座本来人就多,IT界的人物比其他星座多也正常。 我们可以再看,其他星座就不出IT界的奇人了吗?实则不然。比如搜狐总裁兼首席运营官古永锵就是狮子座的,李开复是射手座的,乔布斯是双鱼座的,唐骏是巨 蟹座的,人人和千橡的陈一舟是狮子座的。再回过头来看,其实这条消息的信源也不可信,我搜了一下,发现马云是天枰座的,陈天桥是金牛座的。

再来看看传说中的87.53%这个神奇的数字, 它到底有多神奇呢? clip_image006[6]

被 网友们誉为神奇的87.53%。真的有那么多巧合吗?天蝎座已经很巧合了,为什么87.53%这么巧合呢?但搜索87.54、87.55、87.56,这 三个数字一样神奇。87.54%,60800个结果; 87.55%, 68000个结果。也就是说,这样的所谓的神奇其实并没有那么神奇,只是有一个很大的样本中的数个结果。你也可以再搜索87.52%或者87.57%试 试,实践出真理呀!

发改委打飞机这个案例也很火,上周一发改委降了一次油价,俄罗斯的飞机又失踪了。 09年3月25号发改委上调,美国掉了一架飞机,6月1日调油价,法国飞机掉下来了,时隔一个月发改委再次调价,也门的飞机也掉下来了,7月15号发改委 出了一个价格说明,说没有调整,但伊朗一架飞机又掉下来了。照这样看,发改委就快成为咱国防部的第一神器了。 但结合下图,这组数据最上面的点,是发改委上调油价的时间点集合,中间是发改委下调油价的时间,最下面一条线是通过维基百科搜集的飞机失事时间点。从 2001年到2012年, 根据飞机失事的记录,差不多每隔一两个月就有飞机失事。2010年到2011年到2012年期间,飞机失事概率明显密集起来,这样看,发改委上调油价飞机 掉,发改委下调油价飞机也掉,什么都没干飞机还是掉。所以说,发改委打飞机这样的叙述是在夸张一件事情,让读者觉得一个事情特别神奇,期间反映出的巧合, 并不是真正的巧合。

clip_image008[6]


另一个常见认知错误,把关联当作因果。 看新闻报道,很大程度上看到一件事情跟一件事情相关,很多媒体就会写是A导致了B,A和B之间是相连的因果关系。下面就是一个典型反面教材。 上世纪60、70年代很多经济学家做了200多个国家的调查,统计每个国家的外来直接投资和经济增长的关系,得出一个显著正相关:投资上涨,一个国家或地 区的经济增长。这一相关关系被FDI认为是一个很强的结论。联合国依据调查结论进行了一系列工作,对第三世界国家带去大量的外来直接投资,认为今天给钱, 明天经济就会增长,只要给钱,就很快的脱离贫困状态,成为一个发达国家。而事实上基本没有效果。现在联合国明白了不光要给钱,还要引导合理应用,比如做一 个资源的合理调配、各个产业之间的合理组合,然后产业内部合理升级,这样才会促进最终的经济增长、GDP的上升。

再看“以此类推”现象。首先,是从总体推到个体。比如很多培训机构会声称说一个单词背17遍,会终身牢记,再也不忘。所以很多人就连续背17遍,单词会一辈子在脑子里。真的这样吗?显然不会这么理想。“DO”这样的单词背一遍就记住了。而最长的单词数十个字母,估计背17遍也记不住。

反过来,从个体“以此类推”到总体也行不通。 比如泰坦尼克号沉没事件在电影里表现的是船要沉了,船员让人上船的时候说妇女、孩子优先上船。有人认为这展现了人性的光辉,想当然的认为海难中都会这样。 真的是这样吗?科学家针对包括泰坦尼克号以内的18起沉船事件进行调查后,分析的结论是18起沉船事故中只有两起显示出了女性生还的优势,其中一个就是泰 坦尼克号。英国人往往被认为是有绅士风度的,是不是女性生还率更高呢?事实上不是,女性生还率反而比男性低了几个百分点。这个报告的名称叫“人人为己”。 泰坦尼克号可能真的只是一个被演绎的个例。

新闻中常常要用到“风险”的概念,风险是什么?实际就是一个不好的或者有危险结果出现的可能性, 是一个概率的问题。除了绝对的风险,比如说致死率是多少,还有相对风险,比如说吸烟人群相对于不吸烟人群得肺癌的几率差多少。以塑化剂DEHP为例,当时 台湾大学食品研究所教授提出塑化剂的毒性是三聚氰胺毒20倍,大量媒体都 不假思索地引述了这个数字。 然而,DEHP和三聚氰胺的机理完全不同,不具备可比性,即使强行比较这两种化合物动物实验的半致死剂量(LD50),但也只 能得到4-5倍。

还 有同比、环比的概念。同比是什么呢?比如CPI,今年物价跟去年同期的比较,今年3月份和去年3月份比,猪肉价格同比增 长了10%,说明今年3月份的猪肉比去年贵了10%。如果环比10%,就是3月份比2月份贵了10%。这是两个大家平时不特别注意澄清的概念。实际是非常 不一样的。实际猪肉还比较稳定。但蔬菜季节性就非常明显,如果是同比结果,说价格上升,可能就真的在上升,而环比价格上升,可能季节上本身就有一个上升下 降的趋势,这样比较并不一定非常有意义。

数字,让报道更美好

在开始这部分讲解的时候,丽云带着大家一起揭晓了“同生 缘”的答案。在场学员一一报出自己的生日,听到别人生日跟自己相同的学员则相应站立起来。结果,我们听到一阵又一阵挪动桌椅的声响,最后,竟然有13名学 员找到了“同生缘”,而其中居然有3个人的生日是10月1日。然后⋯⋯松鼠会准备的礼物就没有发出去,因为最接近的学员,也只猜到了10。

看来,生活中的一些看似小概率的事件,实则不然。称之为巧合也好,数学规律也罢,最重要的,还是把数据相关的消息更好的传递给大家,以下就是丽云介绍的做数据新闻好门路。

新媒体出现后,传统媒体的报道重点将由“发生了什么”转变为“为什么会发生”。而探索数字背后的故事,为分析一个事件发生的原因提供了一个独特新颖的角度。来看一则简单的关于政府开支的报道。(注:数字均为杜撰!)

原始版:去年全国各地政府在回形针购买上一共花费了XX英镑。如果简单的平铺直叙这个开支,大家并不能看出什么。 这个开支数字是一个绝对量,没有给我们任何比较,所以你可能会说政府花了这些个钱买这么多回形针,跟我有什么关系? 那换一个方式报道。

百分比版: 去年,各地政府在回形针上的花销占所有文具预算的2/3。(相对量,强调同一类别中占比) 这一看,也许我们就看出问题来了。回形针这样小小的器材,怎么会占所有文具预算的2/3呢?这其中是不是有猫腻呢? 除了在同一类别中比较,我们还可以在不同类比中比,比如下面这两个版本。

内部比较版:去年,各地政府在回形针上花的钱比给老年人提供免费午餐还多!(强调政府两个不同项目的比较)

外部比较版:去年,各地政府在回形针上的花费是整个海外援助花费的两倍!(跟其他项目横向比较) 除了跟别的部门比,还可以跟往期比,看看这个花费跟以前比是不是有变化,再往下就可以分析这个变化背后的原因。

纵向比较版:在过去的四年中,各地政府在回形针上的花费翻了两番。(强调纵向的增长趋势)

最后,还可以用一下三个版本来展示数据。

人均版:B省在回形针上的人均花费远高于其他省份,更是全国平均水平的4倍。(考虑人口分布)

分类版:紫党控制的议会在回形针上的花费是黄党所属议会的150%(强调党派区别)

赞助商版:曾接受文具公司赞助的议员其所在议会在回形针上的花费更多,大概平均而言每多接受一镑的赞助、回形针花费会增加100镑。

最后,简单总结做和数字相关报道的步骤:

    1. 报道撰写步骤
    2. 先给出总体数字,构建场景
    3. 综合地理、历史等因素,进行比较

 

  1. 确保比较是公平的——比如使用人均值
  2. 考虑,还可以和其他的相对比么?
  3. 最后,提醒自己:相关性≠因果关系!证明因果关系,要么通过可重复的随机分组实验,要么需要深入的调查找到确凿的某个环节出问题的证据,而不仅仅是统计相关性。

由上面的这个例子可以看出,即便是一个小小的数字,不同的表述方式,不同的类比方法,都能给予读者不同的洞见,引发大家的思考。如果大家对数据新闻这方面感兴趣,那么给推荐大家推荐一本新闻学方面的好书 “Data Journalism Handbook”,此书将告诉你如何更好地做数据新闻的报道。

下接 第八期工作坊:别让数字吓到你(下)

发表评论

填写昵称和邮箱即可发表评论(邮箱不会公开)

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

分享按钮