【人工智能】AI助测肺炎 惟须保障私隐 以免身份被识别
医管局日前公布三宗医疗事故,医护人员迟迟未能察觉病人肺 X 光片异常,延误诊治。局方成立委员会制作报告,探讨改善方法。事故原因有待查证,但有报道指局方正测试人工智能技术,辅助诊断,并先针对肺 X 光片。有外国研究显示,人工智能判断放射准确度比得上专业人员,有助加快诊断时间,减少漏诊误诊。港府和医管局应继续发展机器学习功能,利用电脑协助诊断,并邀请学界和商界研究,过程中需要妥善移除病人资料,保障私隐。
AI助找出肺炎病征 成功率堪比真人
医护人手不胜负荷,如果科技能够协助侦测病况,既能加快诊断速度,减少病人等候报告时间,又能为专业人员比对判断结果,提升判断准确度。以肺部 X 光片为例,美国国家卫生研究院临床中心(The National Institutes of Health Clinical Center )“Chest X-ray 14”胸腔放射线检查库公开了超过 11.2 万份肺部 X 光片,来自逾三万名病人,美国印第安纳大学医院也公开了7,470 份肺部 X 光片,相当适合电脑程式学习,分辨正常和异常的肺部 。
究竟人工智能的检测结果有多准确?比人手侦测相差多少?2017 年,一群学者抽取上述资料库当中的 420 张肺部 X 光片,分别给机器及四位放射科医生分类肺炎跟非肺炎病人。结果发现机器的准确度较医生高,而且具统计学显著分别。简单来说,机器比放射科医师更能侦测肺炎特征。再者,电脑可以制作肺炎的热图(heatmap),显示肺炎最有可能患病的位置。
必须提醒,上述研究并非无懈可击,例如有学者质疑放射科医生数目太少,另外,研究中的 X光片没有侧面照,又缺乏病史佐证,误诊机会较实际高。即使如此,研究支持继续发展电脑辅助检测,并套用在不同病症。
个人资料跟医疗数据须分离 免被辨识
推动电动辅助检测的同时,更须慎守私隐安全。病历是敏感的个人资料,医护及学术界使用和分析数据前,必须先要除去能够识别身份的资料,才能保障病人私隐。这些资料主要为两类:直接资料和间接资料。前者包括姓名、电邮、电话、身份证号码,后者包括生日、死亡日期、地址、种族、诊断时间等人口社经资料。两者都要跟诸如留院时间、病症种类、电脑扫瞄图片、基因排序等的医疗数据剥离。
更重要的是,数据不应让使用者得知资料的身份。事实上,外地曾经有人在结合不同数据后,识别出特定人物的例子。2016 年,澳大利亚墨尔本大学一名学者尝试在卫生部门开放数据库的 1.7 万个女性记录寻找自己,她借用 facebook 关于性别、出生年份、居住州份及健康活动,成功筛选出 23 个吻合例子。当她加入出生日子后,她就发现自己不在数据库中。此外,她还声称比对出三名国会议员及一名足球员的病历记录。
修订法例、事前检测 减私隐风险
开放数据同时要保障私隐,难以两存其美。立法加强数据取用的条件,以及测试数据的安全程度,是可行办法,但要小心操作。澳大利亚政府计划立例,禁止第三者运用政府公开数据组合、识别个人身份。因为罪行涉及刑事,有追溯期,加上举证责任不在控方,而在被告一方,民间对修法有保留,现时未有定案。在法例以外,数据持有者可以先测试原始数据能被再识别的风险,当风险太高,持有者可以修改或删除个别栏目,例如改动出生日期,直至不能再辨识身份。
人工智能并非取代医护,而是加快医护断症,减少误诊。这需要大量医疗数据训练机器辨识,而开放医疗数据则有利知识普及,集思广益。不论是医疗机构还是公众,必须谨慎处理资料,避免有人滥用敏感资料。港府屡屡被批私隐监管疏漏,更应及早检讨法例,预防私隐被侵犯,把好事变坏事。