【译】基于DNA的脸型再造和案件重塑
大数据文摘翻译作品
作者:Andrew Pollack
翻译:Kiki, 崔浩,陈洁,孙强
校对:孙强
摘自:纽约时报
欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权
欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,回复“翻译”和“志愿者”了解详情。
四年前发生的一起谋杀案至今找不到目击者,受害者是一位年轻的母亲和她的三岁女儿。没有任何一台监控器捕捉到罪犯的行踪。
然而,就在上个月,美国南卡罗莱纳州哥伦比亚市的警方发布了一张嫌疑犯的素描头像。这张由计算机生成的头像仅仅依靠在犯罪现场找到的DNA, 而不是基于目击者的描述。
通过这样的方式将嫌疑犯的头像公布于众也许是第一次,却绝不是最后一次。遗留在犯罪现场的DNA有助于调查者确定嫌疑犯的生理特征, 也为法律的实施提供了强有力的新工具。
如今,基因鉴定已经能够相对精准地确定嫌疑犯的眼睛和头发颜色。也可能很快做到对肤色,雀斑,秃顶,头发的卷曲度,牙齿形状和年龄做出预测。
计算机也许最终能够做到把由DNA生成的嫌疑犯头像和数据库里的面部照片匹配起来。研究人员声称,即使不能立即锁定罪犯,基因"目击者"的作用也是很大的。
“至少能缩小嫌疑人的范围,”印第安纳州普渡大学生物系的助理教授Susan Walsh称, 她刚从司法部门获得一千一百万美金的拨款来开发此类技术。
但是法医遗传表现型预测的使用也存在越来越多的担忧。一些科学家质疑该技术的精确度,特别是重塑嫌疑犯脸型的能力。其他人认为该技术会使存在于执法机构的种族形象定性(指警察等因肤色或种族而不是证据怀疑人犯罪)问题恶化,并侵犯隐私。
纽约大学法学院的Erin Murphy教授说:“DNA在犯罪领域的这一应用是技术领先大众舆论和认知的又一例证。”
DNA被用于寻找,定罪或释放嫌疑犯已有超过20年的历史了。但是直到现在,只是用于匹配某个犯罪嫌疑人的DNA和遗留在犯罪现场的DNA,或是匹配政府数据库的DNA。
基因表现型预测则大不相同:当用传统方法找不到匹配时,该方法试图通过遗留在犯罪现场的基因残留物来预测某些生理特征。虽然该技术还有待完善,一些小型公司,比如构造出南卡案例犯罪嫌疑人头像的Parabon NanoLabs和Identitas,已经向执法机构提供DNA表现型技术的服务了。
Illumina, 最大的DNA测序仪制造商,刚刚推出了一款既可以用来预测疑犯物理特征又可以执行传统的DNA分析测试的取证产品。
?南卡罗莱纳州Columbia市警察局所发布的根据现场DNA预测的犯罪嫌疑人的脸型图片。产生这一图片的Parabon NanoLabs已经开始向执法部门提供类似服务。
多伦多警方已将从1980年到2014年间发生的29个案件中获取的DNA提交给Identitas。其中的10个样本因为破损太严重而无法执行任何分析。
对于剩下的部分案例,“新的证据使我们改变了侦破思路,”负责这些凶杀案的调查官Sergeant Stacy Gallant探长说,“但是还没有案件告破“。
长久以来,从犯罪现场采样的DNA被用来确定嫌犯性别。 大约15年前,一些警察局已经开始尝试着用DNA来确定疑犯的地理祖先, 以及现在人们常用的基因遗传的测试[译者注:类似于亲子鉴定一类]。
在2003年,此类信息帮助改变了对路易斯安那州连环杀人犯的搜捕方向。基于一位目击者的口供和心理学特征描述分析,警方已在全力搜捕一名白人男子。但是遗留在一处谋杀案现场的DNA显示,嫌疑犯的祖先是85%撒哈拉沙漠以南的非洲(大陆)。最终,一名黑人男子被定罪。
如今研究人员倾向于研究某特定的生理特征,比如眼睛和头发的颜色。一个名为HIrisPlex的系统,由位于荷兰Erasmus大学MC医学中心开发,能以94% 准确度判断一个人的眼睛是蓝色的还是棕色的,但是对于像绿色这样的中间色精确度降低,协助该技术开发的Walsh博士说。
Walsh教授说:“通过分析24种遗传性变异,HIrisPlex 确定头发颜色的精确度可达到75%, 预测结果也可以随着每个人的年龄改变。
科学家们通过基因预测生理特征的方法和探索可能致病的基因是一样的:通过研究人类的基因组里含有或缺失某种特征或疾病,并寻找其中的关联。但这会是一个非常艰巨的任务。
很多遗传性变异也许跟某一特征相关,但是每个变异也许只起到很微弱的作用。举个例子,双胞胎的研究揭示了身高百分之八十由遗传基因决定, Erasmus大学法医分子生物系的教授Manfred Kayser表示。
但与此同时,一项研究表明:大约700个遗传性变异和身高有关,但这些变异仅仅揭示了大约15%的身高差异, 他说道。
另一方面,从DNA样本中获取眼睛和头发的颜色已经被证明相对容易, Kayser博士说,因为单体基因对这些生理特征影响巨大。
Kayser博士说:“预测一个嫌疑犯的年龄毫无疑问也包括在内,可以通过分析某种随着人们年龄增长而关闭的基因的生物标记来实现。”
计算机预测图片和真人版照片的比较
但是,耶鲁大学遗传学教授Kenneth Kidd说道,这些技术的很大部分是基于对欧洲人种的研究,所以对其他人种可能不具适用性。
他和其他专家都对脸部特征由DNA决定这一论断表示怀疑,因为它是如此复杂。当然,遗传肯定起着很大的作用,比如同卵双胞胎、血缘关系较近的亲戚,他们面部会非常相似。但是,一些专家认为,目前为止还是没有足够的证据能证明基因和脸部特征之间的确切关系。
卡尔加大学(University of Calgary)细胞生物学和解剖学系的系主任Benedikt Hallgrimsson说,“这一点上其实带有些许科幻小说的色彩”。Benedikt Hallgrimsson研究脸部发育学。
评论者指出,总部设在弗吉尼亚州Reston的Parabon公司,虽然从国防部收到研究经费,并没有发布任何经过同行评议过的学术论文,即使这种论文发布会增加公司的销售。
Parabon上周宣布,一位外部知名专家将进行验证试验研究并发表结果。Parabon生物信息学主任,Ellen McRae Greytak说到,公司的技术依赖于宾夕法尼亚州立大学人类学和遗传学的教授 Mark D. Shriver去年发表的方法。
Shriver 博士和他的合伙人,比利时鲁汶大学的 Peter Claes 表示,已经研发出基于在脸上测量7000多点的三维坐标等复杂的数学方法来模拟面孔。
通过DNA测定,他们研发了一种方法 -基于人的性别和祖先起源,来创建一个人的面孔。然后他们通过20个相关基因中的24个遗传变异组合来做进一步的调整。
研究人员在他们的论文中说到,他们的祖先和性别分析,只解释了大约23%的面孔变化,遗传变异分析并没有真正增加太多的细节。但该技术尚处于初期研发阶段,他们已经增加了更多的遗传变异来试着提高精度。一些生成的图像确实和DNA供体的真实的脸很像,其他则差强人意。
不过有时候警察在一些凶手案件中没有任何线索。在2011年1月南克罗莱纳州哥伦比亚的凶案中,25岁的Candra Alston和她的3岁女儿Malaysia Boykin , 在她们的公寓被凶手谋杀,警方因为没有线索而使调查陷入停顿。
没有任何强行进入的迹象,表明 Alston 女士和杀手认识。超过100个熟人自愿提供DNA样本,但没有DNA能和在犯罪现场发现的相匹配。
这样四年后的1月9日,警方公布了 Parabon 研发出的一张可能的犯罪嫌疑人(Person of Interest)脸部图像。
一位警方调查员表示Mark Vinson说到,“我们认为这值得一试。”,该警署支付给Parabon 4200美金,虽然该技术并没有得到验证。
你能根据预测图片识别纽约时代的这两位员工吗?一位是记者,一位是视频编辑师
该脸部图像的释放产生了几个线索,但都没有最后结果。
执法当局说,通过DNA产生的物理特性的信息没有得到法庭允许,因为这后面的科学还没有很好地建立。不过,DNA表现型的普遍使用愿景已经让一些专家感到不安。
斯坦福大学人类学副教授Duana Fullwiley说,她担心使用这些影像会导致种族歧视。她指出,Shriver博士开发的系统是基于西非和欧洲人混合血统的DNA和面孔分析。
“这样一种技术,能够更好地预测非洲裔美国人的面孔,”她说。在南卡罗来纳州的案件所产生的图像,Fullwiley博士补充说,“就是一个典型的年轻黑人。”
Shriver博士说,他最初研究欧洲和非洲混合血统的人,其中许多来自巴西,是因为这会使分析变得更加容易。他最近的研究已经涉及到许多不同种族的人,他说。
一些法律专家也说,DNA表现型的使用会给公民自由带来令人担忧的前景。
常规DNA匹配分析,不依赖于DNA链接到该人的物理特性(性别除外)。法学教授Murphy女士说, 到现在为止,这有助于人们理解法医DNA的使用,不会违反宪法第四修正案 — 该修正案保护公民不受无理搜查。
但使用DNA来确定身体特征会“完全把这一牢固的界限打破。”她说。
这也带来一个新的问题:有那些身体特征是要受到保护的?如果条件允许,当局是否能够测试疑犯具有某种医学病症或容易具有某种暴力倾向?
比利时和德国禁止DNA表现型在法医上使用。荷兰则规定只能使用公开可见的特性,像头发和眼睛的颜色。
在美国,一些州禁止测试是否一个人有某种医疗特征,或倾向性的疾病,墨菲女士说。但这些法律主要涉及到从已知的人所采集的样品,如已知的DNA数据库。
犯罪现场的DNA,在法律上视为弃物。 “这里几乎没有任何法律规定,限制你对犯罪现场采样可以做什么,”墨菲女士说。
原文链接:
http://www.nytimes.com/2015/02/24/science/building-face-and-a-case-on-dna.html?_r=0
【医疗大数据栏目介绍】
2015年2月7日“医疗大数据专栏”正式成立。随着基因芯片及DNA测序技术的发展,生物医疗大数据迅猛发展,既是大数据技术发展的原动力,也是大数据技术的受益者。大数据文摘2013年7月成立,我们专注数据,每日坚持分享优质内容,从未间断,我们努力为读者和志愿者打造一个分享和交流平台。作为大数据文摘的志愿者群,我们中有不少人从事医疗大数据相关工作,关心医疗大数据的发展,愿意通过这个专栏,和大家一起分享医疗大数据的点点滴滴。
如果您是专业人员,愿意与大家分享,请加入我们,我们把这个平台和专栏做得更好。精准医疗的革命时代到来了,让我们一起关注医疗大数据技术的发展。
【译者介绍】
有意联系译者的朋友,请给“大数据文摘”后台留言,附自我介绍及微信ID,谢谢。
孙沁(Kiki)
美国留学五年,现为EmoryUniversity生物统计在读硕士。对ClinicalTrails, Cancer Prevention, HIV/AIDS以及Food Science/Nutrition的领域很感兴趣。毕业后希望在Pharmaceutical, Biotechnological HealthcareIndustry或者Hospital工作,也想尝试医疗健康方向的咨询工作(Life Science Consulting)。希望结交对医疗数据有兴趣的朋友,也希望大家帮忙推荐此方向的实习和工作机会给我。
崔浩
大学在读,擅长韩语和英语。专业为生物工程,现在和教授一起研究乳酸菌降解亚硝酸盐的相关基因,平时对大数据很感兴趣,希望更多的了解和学习大数据加入了大数据文摘翻译志愿者。
陈洁
统计分析师,Emory大学生物统计硕士,曾在美国疾病防控中心CDC实习一年,先后就职于美国国立卫生研究院肿瘤所 NIH/NCI,与BioStat Solutions统计咨询公司。现为大数据文摘翻译组组长, 希望结交对大数据感兴趣的朋友,共同学习进步。
孙强
资深生物信息专家,现在服务于美国国立癌症研究所,从事癌症基因组数据库管理工作。热爱大数据,加入大数据文摘志愿者行列一年有余,愿以文会友,广结大数据善缘。旅居美国多年,现在定居于大华府地区。
读过的学校:山东大学,中科院植物所,加大洛杉矶分校( UCLA )
生活过的城市:淄博,济南,北京,洛杉矶,华盛顿
其他爱好:足球,钓鱼,打牌
大数据格言:big data is better data
数据分析, 数据挖掘
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!