与外观和犯罪相关的算法的黑暗历史

通过 凯瑟琳·斯汀森

将人格与身体特征联系起来的机器学习值得进行严格的审查。

电脑 技术

当前的问题

这篇文章从发行

2021年1月至2月

第109卷第1期

“物相学”具有老式的含义。听起来好像它属于一本历史小说,归档在放血和速记之间。我们想认为,根据人们的头骨大小和形状来判断他们的身价是一种远远落后于我们的做法。然而,相变学再次在技术的幌子下抬起头来。

近年来,机器学习算法的使用激增,合法而可疑。最近的一些应用程序向政府和私人公司保证,可以从人们的外表中收集各种信息。斯坦福大学的研究人员建立了一个“盖达尔”算法,他们说该算法可以比人们更准确地分辨异性恋和同性恋面孔。研究人员指出,他们的动机是揭露潜在的隐私威胁,但他们还宣称其结果与“产前激素理论”相一致,该理论认为胎儿暴露于雄激素有助于确定性取向。研究人员援引备受争议的说法,即这些激素的接触也会导致性别不典型的面孔。

快速采取
  • 越来越多的人工智能(AI)技术声称能够比人类更好地找到外观与角色特征之间的关联。
  • 但是,这些算法所做的概括通常可以由与遗传学无关的因素来解释,例如社会表现。
  • 研究人员并没有产生客观的见解,而是警告说,人工智能程序通常会加剧人的偏见,并且可能 伤害已经边缘化的人口。

几家初创公司声称能够使用人工智能(AI)来帮助雇主根据他们的面部表情检测应聘者的性格特征。在中国,政府率先使用监视摄像机来识别和追踪少数民族。同时,有报道称,学校安装了摄像头系统,该摄像头系统会根据面部动作和诸如眉毛抽搐等微表情自动对不注意的孩子进行制裁。通过监考算法进行监控的在线考试的大学生不仅必须回答问题,而且还可以保持不作弊的学生的外表。据报道,这些算法针对以非典型方式移动其面部和手部的残疾学生,是虚假的指控。黑人学生表示,他们必须要照亮自己的脸,才能完全检测其特征。

图片由Rachael E. Jack提供;摘自Jack等人,2016年。

广告权利

也许最近最臭名昭著的面部识别误用是上海交通大学的AI研究人员吴小林和张曦的案例,他们声称已经训练了一种基于脸部形状识别罪犯的算法,准确率高达89.5%。 。 2016年的作品仅作为预印本出现,没有在同行评审的期刊中出现。研究人员并没有去认可19世纪流传的有关相貌和性格的观点,特别是来自意大利犯罪学家Cesare Lombroso的著作:罪犯是进化不足的亚人类野兽,从他们的倾斜角度可以辨认前额和鹰般的鼻子。但是,这项研究看似高科技的尝试,是直接从维多利亚时代的万事通弗朗西斯·加尔顿(Francis Galton)开发的“照相合成方法”中挑选出与犯罪相关的面部特征,该方法涉及覆盖多个人的脸部以找到表示健康,疾病,美丽或犯罪等品质的特征。

技术评论员将这些面部识别技术列为“文学相貌学”。他们还将某些应用与优生学相结合,优生学是造相学的父级伪科学,旨在通过鼓励被认为是最适者的人繁殖并劝阻那些被认为不适合的人来“改善”人类。高尔顿本人创造了这个词 优生学,在1883年将其描述为“所有的影响,无论在多大程度上都倾向于使更合适的种族或血统更快地胜过那些不合适的人,而不是其他人。”中国对少数民族的监视的明确目标是剥夺那些被认为不合适的人的机会。试图发现罪犯或考试作弊者的面孔的技术可能具有更高的目标,但往往会导致相同的可预测结果:对已经边缘化的人们产生许多误报,导致剥夺权利和机会。

然而,当算法被诸如“相象学”或“伪科学”之类的标签驳斥时,究竟指出了什么问题呢?颅相学在科学上有缺陷吗?还是即使可以使用,使用它在道德上还是错误的?

有缺陷的数据集

这个词有悠久的历史 颅相学 已经被用作凋零的侮辱。道德和科学批评一直纠缠在一起,尽管纠缠随着时间而改变。在19世纪,相貌学的批评者反对这一事实,即这种做法试图指出大脑不同部位的不同心理功能的位置,这一举动被视为异端,因为它使人们对基督教关于统一性的观点产生了质疑。灵魂。有趣的是,尝试根据头部的大小和形状来发现一个人的性格和才智并没有被认为是一个严重的道德问题。相比之下,今天,将心理功能本地化的想法已经毫无争议。例如,科学家可能不再认为破坏性位于右耳上方,但是认知功能可以局限在特定的大脑回路中的观点是主流神经科学的标准假设。

由惠康收藏提供

物相学在19世纪也有其经验批评。关于哪些功能驻留在何处以及颅骨测量是否是确定大脑中发生的事情(不是)的可靠方法的争论激烈。不过,对最古老的相貌学的最有经验的批评来自法国医师让·皮埃尔·弗洛伦斯(Jean Pierre Flourens)的研究,该研究基于破坏兔子和鸽子的大脑的研究,他得出的结论是,心理功能是分布的,而不是局部的。 (后来重新解释了这一结果。)物相学被拒绝的原因是大多数当代观察者不再接受,这使得我们在确定使用时的目标更加困难 颅相学 作为今天的诽谤。

一些评论者认为,面部识别应像p一样受到严格的管制,因为它几乎没有有害的用途。

“旧的”和“新的”相貌学因其草率的方法而受到批评。在最近的AI犯罪研究中,数据来自两个截然不同的来源:警察为定罪者提供的身份证照片,以及从互联网上为非定罪者抓取的专业照片。人们愿意在互联网上发布的图片往往会向人们展示与身份证照片不同的心情,衣服和生活环境。仅这些事实就可以说明算法检测组之间差异的能力。同样,对gaydar算法研究的批评者指出,对于为什么不难区分研究是从约会地点拍摄的同性恋者和异性恋者的照片,有一个显而易见的解释:他们倾向于打扮,化妆和化妆。摆出不同的姿势。即使是拍摄照片的角度也可以说明面部形状的变化。

在犯罪预印的新序言中,研究人员还承认,将法院定罪视为犯罪的代名词是“严重的疏忽”。然而,将定罪与犯罪相提并论似乎主要是由于经验上的缺陷而在作者中注册的,因为使用定罪的罪犯的图片而不是被清除的罪犯的图片会引入统计偏差,从而使结果产生偏差。他们说,对于一项旨在“进行纯学术讨论”的研究,他们对公众的愤慨“深为困惑”,这也表明他们没有意识到他们工作的缺陷超出了草率的统计。

值得注意的是,研究人员没有评论犯罪事实本身取决于警察,法官和陪审团对嫌疑人的印象这一事实,这使一个人的“犯罪”外观成为一个令人困惑的变量。他们还没有提及特定社区的严格治安以及获得法律代表权的不平等如何扭曲数据集。在被逮捕和定罪的人与没有被逮捕和定罪的人之间,在外观上存在差异是完全不奇怪的。正如Ice Cube所说的那样,洛杉矶警察局认为每个黑人都是毒贩。在对批评的回应中,吴和张没有拒绝“做一名罪犯需要具备许多异常的(异常的)个人特征”的假设。实际上,他们的框架表明犯罪是一种先天特征,而不是对诸如贫困或虐待之类的社会条件的回应,或者是施加于施加社会控制的标签。这一假设反映了盖达尔研究的快速飞跃,即得出的结论是它必须在生物学上有所发展。从经验上使数据集令人怀疑的部分原因是,被贴上“犯罪”标签的人几乎没有价值中立。

摘自Wu and Zhang,2016。

使用面部识别检测犯罪的最强烈的道德异议之一是,它已经使已经过度警惕的人蒙受耻辱。犯罪论文的作者说,他们的工具不应该在执法中使用,而只是引用关于为什么不应该使用它的统计论点。他们指出,假阳性率非常高(超过95%的分类为犯罪分子的人从未被定罪),但没有注意到这对人类的意义。那些误报将是那些面孔像过去曾被定罪的人的个人。考虑到刑事司法系统中存在种族歧视和其他偏见,此类算法最终会高估边缘化社区中的犯罪。

试试,再试一次?

最有争议的问题似乎是,为了“纯粹的学术讨论”,重塑颅相学是否是公平的游戏。一个人可能会根据经验提出反对:例如Galton和Lombroso等过去的优生主义者最终未能找到使人容易犯罪的面部特征。缺乏证据几乎可以肯定是因为没有这种联系。同样,研究情报的遗传性的心理学家,例如西里尔·伯特(Cyril Burt)和菲利普·拉什顿(Philippe Rushton),也必须对数据进行快速和宽松的处理,以使其看起来好像发现了头骨大小,种族和智商之间的真正联系。如果有什么可以发现的,大概几个世纪以来尝试过的人都不会干dry的。

人工智能算法似乎比数学更强大。

复杂的个人特征(例如犯罪倾向)极不可能以从图片上可读取的方式与外观遗传相关。首先,犯罪必须在很大程度上取决于基因而不是环境。可能有一些非常弱的遗传影响,但是存在的任何因素都会被更大的环境影响所淘汰。第二,与犯罪相关的遗传标记将需要以常规方式与确定外观的基因联系起来。如果与犯罪相关的基因聚集在基因组的一个区域中,而该区域恰好位于与面部形状相关的基因附近,则可能发生这种联系。对于犯罪等复杂的社会特征,这种聚集是极不可能的。更有可能的假设是,外表与犯罪之间存在的任何关联都朝着相反的方向起作用:一个人的外表会影响其他人如何对待他们,而这些社会影响是驱使某些人犯罪(或被判有罪)的原因。他们)。

吴和张采用的论证策略是由著名的优生学家和统计学家卡尔·皮尔森(Karl Pearson)率先提出的,该策略声称即使人们的生活处于平衡状态,我们也应该能够以超然的学术眼光看待证据。在有关该主题的最新文章中,数学家奥布里·克莱顿(Aubrey Clayton)认为,统计显着性检验旨在为优生论断提供数学上的光彩,而优生论主张只能提出有缺陷的方法:很难反驳的数学事实。”使用这些(非常普遍,但越来越残酷的)统计方法,Wu和Zhang可以提供从技术上讲具有统计意义的结果,但是仍然极具误导性。人工智能算法似乎比数学更强大。

不要伤害

重新发明诸如隐匿术等以新技术形式掩盖的优生方法的问题不仅在于它已经尝试了很多次而没有成功。在科学共识达成后仍坚持寻找冷聚变的研究人员,也因追逐独角兽而面临批评,但冷聚变的反对远远没有op之以鼻。最糟糕的是,冷聚变研究人员被认为浪费了时间。不同之处在于冷聚变研究的潜在危害要有限得多。相反,一些评论员认为面部识别应该像p一样受到严格的管制,因为它很少有无害的用途。当您想复活的死胡同项目是为了支撑殖民地和阶级结构而发明的,而它唯一能够衡量的是这些结构中固有的种族主义时,很难再尝试一次,只是出于好奇。

由玛格丽特·米切尔(Margaret Mitchell)提供

但是,将面部识别研究称为“相貌学”而不解释什么是危急关头,并不是传达抱怨力的最有效策略。为了使科学家认真履行其道德责任,他们需要意识到研究可能产生的危害。希望更清楚地阐明标为“颅相学”的作品有什么问题,而不是简单地以侮辱为名而产生更大的影响。

参考书目

  • Agüeray Arcas,B.,M。Mitchell和A. Todorov。 2017年。相貌的新衣服。 中, May 6.
  • Agüeray Arcas,B.,A。Todorov和M. Mitchell。 2018年。算法会揭示性取向还是仅仅暴露我们的刻板印象? 中, 一月11。
  • 克莱顿,答:2020年。优生学如何影响统计。 鹦鹉螺 10月28日。
    • 格雷夫斯,J。L.,2002年。他编织的网有多纠结:种族,生殖策略和拉什顿的生活史理论。 人类学理论 2:131–154。
    • Jack,R.E。,等。 2016.四个不是六个:揭示文化上常见的情感面部表情。 实验心理学杂志:一般 145:708-730。
    • Kshetri,N.2020。远程教育到处都是对学生隐私的威胁。 谈话, 11月6日。
    • Stark,L.2019。面部识别是AI的the。 XRDS 25(3):50–55。
    • Van Noorden,R。2020年。困扰面部识别研究的伦理问题。 性质 587:354–358。
    • Wang,Y。和M. Kosinski。 2018年。在从面部图像检测性取向方面,深度神经网络比人类更准确。 人格与社会心理学杂志 114:246–257。
    • Wu,X.,and X. Zhang。 2016年。对对犯罪认知的机器学习的批判的回应。 arXiv:1611.04135
    • Wu,X.,and X. Zhang。 2016。使用面部图像自动推断犯罪。 arXiv:1611.04135v1

本文改编自先前的文章 永旺 , 永旺 .

美国科学家评论政策

保持话题。尊重。我们保留删除评论的权利。

请阅读我们的 评论政策 评论之前。