统计

最近美国全国的很多大城市陷入了种族骚乱,不少地方陷入了打砸抢烧的局面,街头一片火光。这个事件的起因,是由于明尼苏达州一个黑人乔治弗洛伊德在被捕带上手铐之后,依然被一位白人警察用膝盖压颈长达 8 分钟,最后死亡的惨剧。

警告:这个视频,记录了这位黑人的生命从他身体中一点一点逝去的全过程,非常残忍,请谨慎打开。

黑人在美国司法体系中遭到不公正的对待,这是一个老话题了,也是困扰了美国长达半个世纪之久的一个社会肿瘤。

但是近年来也有很多持保守派观点的人也指出:警察滥用暴力或许是一个社会问题,但是和种族无关

今天的华盛顿邮报登载了一篇文章,对这两派观点和相关的统计数字做一个分析,我来归纳一下,并略作展开:

从保守派的观点看,从 2015 年以来的数据表明,警察在执法中击毙的白人数量是黑人的两倍。

这是否说明其实白人才是警察暴力的最大受害者呢?并非如此。

因为美国的白人人口是黑人的六倍,那么从比例而言,黑人遭到警察射杀的比例比白人大三倍。另外,由于美国少数民族的枪支拥有率远低于白人,如果只考虑在案发现场不持有武器的人,黑人和白人被警察击杀的数目是一样的。如此,黑人在无武装情况下遭到警察射杀的危险就是白人的六倍。

那么黑人遭到警察种族歧视的证据是否就实锤了呢?并非如此。

黑人的犯罪率要远远高于白人。根据 2010 年的监狱数据,在黑人群体中坐监率为 2.3%,白人是 0.45%,如果把坐监率当成是犯罪率的合理反映的话,这意味着黑人种族的犯罪率是白人的 5 倍。既然你有 5 倍高的犯罪可能,那么遭到警察枪击的可能也比别人高 6 倍,好像也冤枉不到哪去。

但是这能解释警察以更高概率对黑人祭出杀手吗?没有那么简单。

统计显示,绝大部分警察杀人事件,并非源于警察为了制止杀人等暴力犯罪,而是发生在常规的警察执法过程中,比如在逮捕嫌犯过程中,甚至是交通违章的执法中。比如,本次事件的受害人乔治弗洛伊德,他被报警和逮捕的理由是使用了一张 20 美元的伪钞;弗洛伊德死前呼叫:我不能呼吸!这个短句也是 6 年前一个叫 Eric Garner 的黑人在被警察锁喉时呼叫的最后一句话,也是他人生的最后一句话,他的罪名是:无照贩卖香烟。

谈到交通违章和被警察停车盘问的比率,种族之间的统计差异差异就更为明显了。一个最显著的例子,是共和党唯一的黑人参议员,Tim Scott,他在首都开车时曾经一年中 7 次被警察截停盘问。而我们的非黑人读者,如果扪心自问的话,绝大多数人恐怕是一次都没有,这位黑人参议员的白人同僚呢,更是如此。“碰巧”的是,Tim Scott 的一位黑人高级智囊也是深受此困,干脆考虑把豪车卖了换一辆烂车,免得路人报警警察生疑。

如果一定要为这些种族差异的现象找一个理由的话,也就就是,在黑人种族吓人的犯罪数据的潜移默化影响下下,警察见到黑人就下意识地提高警惕,加强戒备,出手从严从重。在概率上就必然就导致警力失控比例的上升。

这是警察歧视黑人的种族主义吗?还是某些种族自己的“不争气”而给整体形象抹了黑?

我们先不谈动机和标签,唯考虑后果。

纽约市警方有过一个受到广泛质疑的手段叫做:拦截与搜身(Stop and Frisk),实行了快 20 年。意思是说警察只要有“合理”的怀疑,就有权拦截嫌疑人盘问甚至搜身。纽约时报曾经刊出过文章声称:黑人和西裔遭到拦截盘问的几率比白人高 9 倍,而之后的逮捕率其实相仿(Blacks and Latinos were nine times as likely as whites to be stopped by the police in New York City in 2009, but, once stopped, were no more likely to be arrested)。

这是赤裸裸的种族主义吗?

Heather Mcdonald 是一位保守派的社会学者,她的一个特长就是语不惊人死不休。针对这篇纽时文章,她也发文论证,在纽约市所有的暴力罪犯中,黑人和西裔的比例超过白人的 13 倍。

按照这个比例,这位保守女学者写道:纽约黑人和西裔遭到拦截盘问的几率虽然比白人高了 9 倍,但这不是太高,而是太低了。少数民族不是受到了歧视,而是得到了过多的优待!

她认为:黑人西裔在暴力犯中的比例既然 13 倍超过白人,那么他们在随机搜查中就应该得到超过 13 倍的重点照顾。

这好像是一个逻辑的必然,而事实上,这是一个统计学上的误区,很少有人能够逃脱。

美国种族骚乱背后的统计学陷阱

这位保守女学者的错误,在于她混淆了统计学上的两个容易混淆却截然不同的概念:似然函数(Likelihood function)和后验概率(Posterior probability)。

不喜欢统计学的读者可以放心,这是本文第一次也是最后一次用到统计学术语。

我们不会用统计学术语的大帽子去套用现实中的概念,相反,我们来探讨不同概率的实际意义。

按照 Heather Mcdonald 的数据,纽约暴力罪犯中,黑人和西裔的比例高出白人 13 倍,这是一个高得惊人的数字。但是,在普通大众的群体水平上,暴力犯罪其实依然是一个相对罕见的现象。我们在上面举了一个例子:整个美国黑人的坐监率(犯罪率)大概是 2.5%,固然比白人高很多,依然是一个相对稀少的现象。

所以,罪犯中黑人的比例,和所有黑人中犯罪的比例是两个完全不同的统计概念,前者叫似然函数,后者属于后验概率,它们之间可以用贝叶斯公式来换算。纽约市拦截搜身政策的目的,是找出各个种族中的犯罪分子,这是一个后验概率的问题,而这个保守女学者却主张用罪犯中黑人很高的这样一个比例,也就似然函数来作为全权指导,那就把打击面扩大得太甚了。

这恰恰是纽约市警方的问题,2009 年拦截搜身的人数是 57 万,黑人虽然是少数民族,但是被拦截的占总数目的 55%。而最终导致的有效逮捕人数 3 万 4 千,比例为 6%,黑人和白人一样。这说明警方对黑人的重点性截停搜查,并没有起到更有效地抓捕罪犯的目的。

但是,这样的政策会产生严重的社会后果。“截停搜身”政策在纽约市实行了将近 20 年,累计被拦截搜身的超过六百万人次,大部分是黑人和西裔,加上他们的人口比例小,这个群族中的很大比例都有过被无理截停搜身的亲身经历。

所以,当一个普通黑人看到乔治弗洛伊德被缓慢而残忍地当街卡死的那一幕,他们很自然地把这个场景和自身曾经有过的屈辱经历联系在一起,产生了白人或者是亚裔所无法想象的感同身受的强烈共鸣。这是这次乔治佛洛依德的遇害激发大规模抗议甚至骚乱的社会原因之一。

在美国的大型体育比赛开幕前都有例行的唱国歌仪式,全体观众应该起立手放胸前以示肃穆。但是,在 2016 年的橄榄球赛季,黑人球星 Colin Kaepernick 却做出了一个不同寻常的举动:他面对星条旗单膝跪下。这传达了两个信息:第一,拒绝肃立代表一种对国家权力的抗议,抗议在这个制度下黑人遭遇的不公正;第二,单膝下跪这个姿势也保留了对为国服务的军人的部分尊重。

Colin Kaepernick 这些运动员的这个下跪传达的抗议意味,遭到了总统的攻击,称他们为 Son of a Bitch。但是,当白人警察此次“跪杀”弗洛伊德的画面曝光后,Colin Kaepernick 的单膝下跪的无声抗议,被更多的人所理解和效仿。

美国种族骚乱背后的统计学陷阱

今天早上,抗议的人群越聚越多,当抗议者们集体单膝下跪,效仿始作俑者 Colin Kaepernick 向死难者默哀的时候,惊人的一幕出现了,负责维护治安弹压抗议人群的警察们也同样肃穆地单膝下跪,用同样的经典的动作向抗议者转达:

人同此心。

美国种族骚乱背后的统计学陷阱美国种族骚乱背后的统计学陷阱

美国的种族关系就象一层厚厚的阴云雾霾难见天日,警察和抗议者们这一个共同的动作,仿佛是一线微弱的光芒透射出来,给绝望中的人们一线希望。

美国种族骚乱背后的统计学陷阱
经济科学+自然科学 = 完整的智力体系美国种族骚乱背后的统计学陷阱
点击 阅读原文 深度学习区块链

来源链接:mp.weixin.qq.com