【科技.未来】基因数据库屡破悬案 亲戚DNA在无意中举证

撰文: 孔祥威
出版:更新:

美国“金州杀手”(Golden State Killer)去年4月落网,逾四十年的连环凶杀悬案得以告一段落,自此开启了科学搜证的新时代——以公开基因数据库重组族谱来锁定犯人的方法,已协助警方解决一宗又一宗的棘手案件。随着基因检测潮流愈趋炽热,预料会有愈来愈多悬案罪犯被送进监狱,然而,重组族谱技术也意味着会有大量无辜或不知情的人被卷入调查之中。悬案要水落石出,是否要以公众私隐为代价?

警方透过遗传系谱缉凶的方法,成功令四十年悬案的疑犯Joseph James DeAngelo落网。(路透社)

1998年9月,在美国北卡罗莱纳州I-85干道一块广告牌下,躺着一具死于绞杀的十岁男童尸首。经DNA测试发现,受害人是一对亚裔和白人夫妇的儿子,但与失踪儿童记录中无一匹配,身份不明,被称为“广告牌下的男孩”(Boy Under the Billboard),成为悬案。

案件直到去年12月才有所突破,遗传系谱学者Barbara Rae-Venter把男童的基因检测数据与网上基因数据库进行比照,找到男童一名曾参与基因检测的亲戚。这名亲戚另有一名女亲戚,正寻找一起长大的失散表弟。女亲戚表示,表弟十岁时与父母移居北卡罗莱纳州,不久之后,表弟的父亲跟亲戚说与太太离婚,表弟随韩裔母亲回韩国生活,表姐弟自此失去联络。女亲戚向警方讲述了表弟失踪的情况,两者一拍即合,终于证实了男童名叫Robert “Bobby” Adam Whitt,生于密歇根州,成长于俄亥俄州。

遗传系谱学者Barbara Rae-Venter协助警方侦破多起案件。(资料图片/barbara.genealogyconsult)

那么,Bobby的母亲又在何处?警方翻查失踪女性案件后有所发现。在Bobby尸体被发现的四个月前,在同一干道延伸至南卡罗莱纳州一段的路边丛林中,警方发现一具亚裔女尸,双手有捆绑印痕,死于窒息。经基因鉴定证实她是Bobby的母亲,并在国际间协力下得知,她名叫Myoung Hwa Cho。

警方找上了Bobby父亲、Hwa Cho的丈夫,他因为干犯其他罪行正在狱中。连番盘问之下,他承认自己杀害了妻儿。这宗逾二十年的悬案,终于在本月初得以侦破。

透过遗传系谱缉凶

Rae-Venter早在去年4月,已用相同技术令“金州杀手”嫌疑犯Joseph James DeAngelo落网。DeAngelo涉嫌于上世纪七十至八十年代在加州谋杀12人,并性侵最少50人。Rae-Venter把疑犯的基因资料上载到名为GEDmatch的公开基因数据库,找到了DeAngelo的族兄弟姊妹(third cousins,即共同祖先为高祖父母),重组系谱后锁定了DeAngelo。

DeAngelo最终被警察拘捕,负责追捕“金州杀手”的探员Paul Holes对这项技术推崇备至:“这是最新的侦案技术,也是廿多年前开始使用DNA以来最大的一场革命。”一名执法部门官员向新闻网站《BuzzFeed News》透露,自“金州杀手”落网以来,马里兰州、华盛顿州、加州、佛罗里达州等地的警察相继以同样方法破案。加州非牟利组织DNA Doe Project也以之辨认出几名失踪人士的身份。难怪去年末Rae-Venter登上了《自然》 (Nature)科学杂志2018年度十大科技人物排行榜。

CeCe Moore是这股法证新潮的另一炙手可热人物,她除了是寻根电视节目《Finding Your Roots》的常客外,去年5月更被DNA法证公司Parabon聘用为首席遗传系谱学家。自去年5月中首次成功协助警方拘捕了三十年前华盛顿双尸谋杀案疑凶William Earl Talbott II后,Moore领导新成立的遗传系谱部门屡建奇功。Parabon至今已上传至少200人的基因档案到GEDmatch,参与“解决”了20宗已公开案件,另有八宗未公开,现时正跟进约40宗案件。

GEDmatch创办人Curtis Rogers事前不知道警方用他的网站令“金州杀手”落网,故收到指摘他泄露用户私隐的电邮时大为愤怒。但他后来收到更多祝贺信,一名女性用户更要求让执法部门更容易找到她的资讯,因为她的父亲杀死了祖父后需要经常进出精神病院,她怀疑父亲也杀害了其他人。

(香港01制图)

遗传系谱缉凶到去年才一鸣惊人,一大原因是美国的基因检测潮流近年愈趋旺盛,积累了大量市民基因数据。约十年前起,23andMe、FamilyTreeDNA、Ancestry等好几家直接面向消费者(direct to customer,DTC)的基因检测公司,在美国陆续推出基因检测服务。消费者只需花数十美元,并把口水或拭过口腔的棉花棒寄回这些公司,就可得到一份检测报告。这些报告主要会告诉客户其祖先来源,例如有多少比率是高加索人种或蒙古人种之类、与数据库中其他做过检测的人的血缘亲疏,以及是否具有特别基因。

以基因“大义灭亲”

据《麻州理工科技评论》(MIT Technology Review)整理及估算,截至本年1月,已合共有至少2,600万名消费者的DNA资讯记录在美国四大基因检测公司的数据库中,并预期若热潮持续,数据库记录数量将在24个月内突破一亿人。

消费者只需花数十美元,并把口水或拭过口腔的棉花棒寄回基因检测公司,就可得到一份检测报告。(资料图片/视觉中国)

有别于这些基因检测公司,GEDmatch没有实验室,不做检测,它只是商人Curtis Rogers和运输工程师John Olson出于兴趣、助人了解家族历史和寻找失散亲人而设的免费网站,让做过基因检测的人上载结果配对。

正如我们约有一半基因分别来自父和母,约四分之一来自祖父母辈,与其他不同亲戚之间也有一定范围的基因是相同的。只要把某人的基因样本上载到GEDmatch与约120万个档案作比较,遗传系谱专家就可以找出哪人是他的亲属,以现时的数据量,一般可找到族兄弟姊妹一辈或更近的亲人。专家再以这些亲戚为基础,利用人口普查数据、死亡证、结婚证、讣闻,甚至社交网站帐号等资讯,像砌拼图般重组他的族谱。养子可寻回亲生父母,警方则以此收窄侦查范围,甚至锁定疑犯身份。

事实上,GEDmatch的数据量远不及Ancestry(1,000万)、23andMe(500万)等检测公司,美国联邦调查局(FBI)的数据库CODIS(The Combined DNA Index System)也记录了1,600万名罪犯的基因资料。GEDmatch之所以吸引到市民、研究人员和警方,全因它是最具弹性的基因数据库。检测公司的数据库各有诸多限制,例如有些禁止上传罪案现场的基因资料,又或不接受其他公司所做的检测报告。

此外,CODIS只针对20个特定基因位置采集数据,不会记录某人的所有遗传编码。这些位置上是一些称为STR(short tandem repeats,短串联重复序列)的简短而重复的DNA序列,重复次数长短因人而异,不可能有两人在20处皆完全一样。美国史丹福大学生物学者Jaehee Kim解释,这样做的原因是为了尽量保障私隐,确保只足够罪案举证之用,而去除了其他生物资讯如瞳孔颜色、肤色、疾病等,就像采集指纹一样。

遗传系谱缉凶到去年才一鸣惊人,一大原因是美国的基因检测潮流近年愈趋旺盛,积累了大量市民基因数据。(资料图片/法新社)

美国最高法院于2013年裁定,这种方式即使在未经同意下采集,仍没有违反宪法《第四修正案》(The Fourth Amendment)中“不合理搜查和扣押”的条文,全因STR的资讯“不足以暴露被捕人士的遗传特征”。

史丹福大学人口遗传学家Noah Rosenberg指出,这种方式虽可让法证专家在血渍之类容易变质的样本中,仍可相对容易地取样,但它极不适合用来配对亲属,因为数据的精细度不足以追溯祖源和亲属关系。像DeAngelo等悬案疑犯被上载到GEDmatch的基因资料,或DTC基因检测公司所用检测方法,记录某人基因组上数十万个称为SNP(单核苷酸多态性)的DNA序列差异位点,就适合得多。

再者,CODIS只有已知罪犯的数据,无法与无案底者比对,作用有限。GEDmatch则不问基因数据来源,不论是23andMe的口水检测,还是不知名实验室所做的血液报告,一概照单全收,资料更完全公开,自然是应用遗传系谱最佳之处。

史丹福大学人口遗传学家Noah Rosenberg指出,特定基因位置采集数据适合用来配对亲属,因为数据的精细度不足以追溯祖源和亲属关系。(资料图片/史丹福大学)

遗传系谱缉凶协助警方破案有如神助,但该技术从面世之初便引起争议,现时也暂无法例可以规管基因检测公司或警方使用这种新颖而强大的搜查方法。各界争议的焦点何在?请详见另文《基因检测公司协警破案 遗传监视铺天盖地?

上文节录自第151期《香港01》周报(2019年2月25日)《 来自远房亲戚的“指证” 基因数据库有助破悬案》。

更多周报文章︰【01周报专页】《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。

【科技.未来】专题相关文章:实验室制“迷你脑” 三大方向造福人类美国不规管 欧洲不放行 基因编辑重燃基改争议黑客编辑肌肉基因 基因编辑有几神奇模糊人类定义 生物黑客的超人类实验改造基因适应太空 你有无资格生存?