【科技.未来】诊症能力媲美人类 人工智能将成未来医生?

撰文: 孔祥威
出版:更新:

“有病就睇医生”的说法可能很快就会变成“有病就睇AI”。上月中在科学期刊《自然.医学》(Nature Medicine)刊登的一项研究显示,人工智能(AI)在诊断多种常见疾病上,表现已胜过初级儿科医生。最近,台湾、英国、印度、日本等地陆续有医疗机构采用AI诊症,随着这股新趋势逐渐发展,未来或可大大缩短诊症及病人排队等候的时间,医生也可从濒临爆煲的工作量中解放出来,有更多时间照顾病人。当然,前提是病人信得过AI的诊断。AI诊症能力持续提升,未来会否全面取代人类医生?

去年8月,美国特拉华州(Delaware)一家儿童医院有位四岁女童,身型比同龄人略为矮小,但几乎所有乳齿都已经脱掉,并开始长出恒齿。遗传学家Karen Gripp回想起Wiedemann-Steiner症候群儿童过早换牙的病例报告,怀疑女童患有该病。但除了早换牙外,女童并无其他与该病有关的身体特征。

为了验证自己的判断,Gripp把女童肖像上载到名为Face2Gene的AI诊症手机应用程式。Face2Gene列出女童可能罹患的疾病,果然包括Wiedemann-Steiner症候群。在进行针对性的基因检测后,Gripp确认女童患上这种由于KMT2A基因突变所致的极罕见遗传疾病。

Face2Gene可让医生上载病人照片,分析诊断出它是否患有罕见遗传病。(Face2Gene网站图片)

能“人”所不能

Face2Gene由总部设在美国波士顿的数码医护公司FDNA开发,该程式透过分析先天性疾病和神经发展障碍症患者的照片,归类出各种疾病的独特容貌特征,并寻找当中的规律,从而诊断出程式使用者可能罹患的疾病。《自然.医学》1月初刊登的一篇研究更显示,Face2Gene使用的DeepGestalt演算法的诊症能力已可媲美人类医生。

据FDNA技术总监Yaron Gurovich介绍,他们把涵盖216种症候群、共17,000张已诊断的照片输入DeepGestalt,训练它辨识各种病患容貌特征。研究人员之后进行了两个测试,分别要Face2Gene在其他疾病患者的照片对照下,诊断出狄兰氏症候群(Cornelia de Lange syndrome)和天使症候群(Angelman syndrome)。这两种疾病的患者都有独特面容征状:狄兰氏症候群患者双眉呈拱形而且极之接近;天使症患者则有口阔、牙齿疏、斜视等征状。结果显示,Face2Gene在两个测试中准确率均超过九成,而过往记录中,人类医生准确率只有约七成至八成多。

FDNA团队其后再以同样患上努南氏症候群(Noonan syndrome)、但病因各异导致外貌略为不同的病人,测试DeepGestalt可否从他们的照片中正确诊断出属于哪种病因,结果准确率达64%,比随机猜的20%机率为高。研究人员还以502张涵盖92种不同疾病的病人照片再作诊断测试,DeepGestalt可为每张照片的病人列出十个可能患上的疾病,结果,估中了91%患者的疾病。

Google DeepMind与英国摩尔眼科医院合作研发的人工智能,可从OCT扫瞄诊断眼疾,准确率比人类医生有过之而无不及。(Wikimedia Commons图片)

对此,美国国立人类基因组研究所(NHGRI)临床遗传学家Paul Kruszka只好“认输”:“我们惨败于Face2Gene。我想未来每个儿科医生和遗传学家,都要有一个类似的应用程式,用来当听诊器。”

Face2Gene并非首个达到这种诊断能力的AI系统。过去一、两年,《自然.医学》几乎每几个月便会有AI诊症表现胜过人类医生的新研究出现。例如去年8月,Google旗下AI公司DeepMind发表了与英国摩尔眼科医院(Moorfields Eye Hospital)的合作研究成果,他们成功训练AI系统从光学同调断层扫描(OCT)诊断出50种眼疾,当中包括青光眼、糖尿眼和老年性黄斑部病变这三种主要眼疾,错误率仅为5.5%,与最佳的两位眼科专家表现相若(6.7%和6.8%),而且没有错过任何一个紧急个案。

摩尔眼科医院顾问眼科医生Pearse Keane预期这种工具可救助更多病人:“我们进行眼球扫描的次数愈来愈多,其增速之快远超人类专家解读的速度。我们把AI系统设计为优先处理迫切需要医生看诊和治疗的病人。愈早断症及治疗,愈能拯救病人的视力。”

人工智能如何及早治疗病人,以眼疾为例

美国加州大学圣迭戈分校眼科教授张康的团队开发的AI诊症系统,似乎已胜过部分医生。系统经广州某大型医疗中心130万笔18岁以下病人的医疗记录训练后,能诊断出感染性单核球增多症(俗称腺热,Glandular fever)、玫瑰疹(Roseola)、流行性感冒、手足口病等常见疾病,准确率达90%至97%。

与20名不同资历的儿科医生相比,张康的团队发现,AI系统的表现好过初级儿科医生,但仍比不上资深儿科医生。例如AI系统诊断哮喘的准确率为90%,人类医生则为80%至94%;在肠胃病方面,AI的准确率为87%,医生则是82%至92%。

张康研发的人工智能诊症工具以可媲美人类儿科医生,他预期未来可作分流之用。图为中国山东一名儿科医生正以胸腔扫描诊症。(视觉中国)

准确以外,AI更可看出隐藏其中的规律。纽约大学病理学家Aristotelis Tsirigos的团队从公开资料库“癌症基因体图谱”(TCGA)找来数十万张照片,训练一个开源的Google演算法识别癌症和健康组织,继而学习分辨出肺腺癌(adenocarcinoma)和鳞状细胞肺癌(squamous cell carcinoma)这两种最常见的肺癌。之后他们再利用TCGA的数据,这次不但输入图片,还把每个肿瘤的连带基因档案一同输入到演算法。当团队利用演算法未见过的图片进行测试时,它不但能分辨哪些是癌组织,更能辨认出该肿瘤的基因变异。“真正新颖之处不是展示AI可与人匹敌,而是它能够看到人类专家看不到的。”Tsirigos说。

解放人类医生

随着人口增加和老化,医疗压力愈来愈大。例如在英国,现时每人平均一年看六次医生,是十年前的两倍。据英国智库King’s Fund调查,2011年至2015年间,平均而言,全科医生的病人名单增加了10%,与病人接触(电话或亲身)次数增加了15.4%。英国医学会(British Medical Association)2016年的调查显示,84%的全科医生说他们的工作量“过量”或“无法应付”,并直接影响他们照顾病人的质素。

Tsirigos团队研发的人工智能,可判断不同成因的肺癌(即右图红色及蓝色;灰色为健康部分)。(美国纽约大学医学院图片)

结果,“非紧急”病人看医生要排长龙预约,部分不想等的就直接到急症室,令英国医疗系统再添压力。英国医疗科技公司Now Healthcare Group创办人Lee Dentith指出:“我们常以为看急症的都是老人,其实不是,也有很多是18至35岁的人,他们多数不愿意为看病等上一星期。”当然,压力非英国独有,先进国家如美国的医疗成本便十分高昂,发展中国家则往往缺乏专业医护人员。聊天机械人诊症服务开发商Babylon的医疗总监Mobasher Butt说:“全球医疗系统都十分紧张,没有足够医疗资源,也没有足够资金。”

AI诊症似乎有望纾缓这些压力,虽然准确率不是百分百,但张康说人类医生也同样做不到:“(医生)忙的时候,可能一天要看80个病人,只能尽可能地掌握大量病人资讯,这导致人类医生有机会出错。AI不需要睡觉,而且记忆力强大,又不会失去动力。”

以AI协助诊症,或可加快诊症时间,让医生从爆煲压力释放,对每名病人有更多时间照顾。(资料图片,林若勤摄)

张康认为AI诊症的出现,将可大幅减少病人等候的时间:“你不会希望因为吃错东西或肠胃炎引致肚痛,而要去急症室等上五个小时。这些疾病都有端倪可循,就如我们医生问一连串问题后可以作出诊断,AI同样可以。”他预期AI可应用在急症室分流之上:“只要有足够数据,AI理应有能力诊断到底昰紧急情况需要转介,抑或只是感冒。”

儿科医生Rahul Parikh亦在《麻州理工科技评论》(MIT Technology Review)撰文,指AI可让他重拾陪伴病人的时间:“这种节省时间的智能可以释放我,让我把更多时间花在病人身上。有研究指患有哮喘的儿童有一半时间未按指示接受吸入疗程,AI或可让我有更多时间亲身与那些小孩相处,以获得更好的治疗效果。”

这些优点,意味着AI诊症可让医疗资源短缺地区的病人得到更好的治疗。例如Google及旗下医疗公司Verily正在印度测试其视网膜疾病自动评估(ARDA)工具,以诊断糖尿病性视网膜病变(diabetic retinopathy),并为病情分级。当地眼科医生Ramasamy Kim指,传统的人为诊断约需时三分钟,AI诊断可把时间缩短至几秒。

更重要的是,印度是全球最多盲人的国家,却极缺乏眼科医生,每100万人口只有11个眼科医生,远低于英国(49)、美国(59)、德国(81)、日本(109)等较先进国家,AI或可弥补医生不足的问题。

基于这些潜力,AI诊症已陆续为一些政府或医疗机构所认可及采用,成为新的医疗趋势。例如美国食品及药物管理局(FDA)去年4月批准了一个名为IDx-DR的眼疾AI诊断工具在市场出售,该工具可以在眼科专家不在场下,由一般医生护士操作使用,或可令更多人及早得到诊断。

在台湾,科技部于2017年10月展开医疗影像专案计划,建立疾病影像标注资料库,以开发自动分析医疗影像诊断的AI。有了这些资料为基础,台北荣民总医院先在去年11月中在放射线部使用“临床人工智慧脑瘤自动判读系统”(DeepMattes),更在上月底开办AI门诊,初期将主要用于心脏、骨科与神经内科。“以往要用十分钟诊断,现在AI只要20秒。”放射线部主任郭万祐说。

英国今年分别在列斯、牛津、高云地利、格拉斯哥及伦敦启用的五间新医疗中心,也将使用AI加快诊断。日本昭和大学联同名古屋大学和Cybernet公司合力研发,判断大肠瘜肉是否恶性的AI软件,亦获日本政府准许发售,预计最快今年春季推出市面。

相关文章:【科技.未来】要取代人类医生,人工智能还欠甚么?

上文节录自第152期《香港01》周报(2019年3月4日)《协助人类VS取代人类 未来有病就睇AI?》。

更多周报文章︰【01周报专页】《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。更多人工智能议题文章:

人工智能结合生前数据 人类可得“永生”?以数码化身得“永生”  技术与数据监管成疑

Deepfake假得迫真 深度造假模糊真相 什么才可信?防伪研发竞赛展开 单靠科技足以打击深度造假?

人工智能促进生产 垂直农场的新型农夫