【科技.未来】AI用数据研制新药 反而是它的最大局限?

撰文: 孔祥威
出版:更新:

众所周知,研发新药的路途极之艰难,耗费极多资金和时间,而最终能通过临床试验和监管核准而面世的药少之又少。不过,制造了Deepfake和AlphaGo的人工智能(AI)技术,竟已帮助科学家在制药方面取得一些初步成果。但是,AI以分析数据能力强大见称,在研制新药上这一点又会否是它的死穴?

承接上文︰新药研发低迷 AI可如何颠覆生态

虽然 DeepMind行政总裁Demis Hassabis说DeepMind将致力解决蛋白质折叠(protein folding)难题,但哈佛大学系统药理学实验室研究员Mohammed AlQuraishi质疑AlphaFold成果的拓展性:“在生物学的其他领域会复杂很多。所以,我觉得DeepMind在蛋白质折叠的成果未必可以自动转化到其他领域。”

华盛顿大学蛋白质设计研究所总监David Baker也说“这只是第一步”,在能为医生和病人带来实际好处前仍有很多工夫。例如随着他们更了解蛋白质在人体的运作,科学家也必须创造有可能作为药物的新蛋白质。Baker相信,创造蛋白质比探索折叠方式,在研发新药上更为重要。 美国药厂默沙东(MSD)的计算化学副主席Juan Alvarez也有类似意见:“因为研发药物的复杂性,我们需要很多元化的工具,并没有一个能回答所有问题的答案。”

Koller指出,要利用AI研发新药的话,现有病人数据量未必足够。(Getty Images)

前史丹福大学机器学习专家、AI制药公司Insitro创办人Daphne Koller认为,要避免这种情况就需要更好的数据,并且规模要大到现时在医疗以外的AI应用领域般。但是,“我们在说的这种数据组,现时在生物学界根本不存在。”这一大原因,固然是与个人医疗数据的严格私隐保护有关。对Koller来说,这些措施不必要地窒碍了创新,而她也提出了一些可加快脚步的解决方法。“我们甚至不可以问病人会不会选择把他们的数据分享予一些机构来创造更好疗法。但如果改为预设他们的数据是在私隐受保护下分享的话,我们就会有多很多的数据。有些欧洲国家已经建立了一套系统,器官捐赠是要选择退出而不是选择参与,结果器官捐赠翻了四倍,而又没有限制了人们对于自己身体的掌管。”

在处理这个极之敏感的议题之前,一些药厂已开始携手互助。十间大型药厂,包括强生(Johnson & Johnson)、阿斯利康、葛兰素史克等,在本年6月宣布将展开名为MELLODDY的首次合作计划,以共享数据各自训练机器学习演算法来研发药物。计划另有四间欧洲大学、两间初创公司、芯片大厂辉达(Nvidia)等共17个单位参与。其中,一间获Google风险投资基金支持的初创公司Owkin就开发了一套保密、基于区块链技术的系统,可让这些药厂演算法既能在可追踪的情况下得到竞争对手的数据,又不会透露各自的商业秘密。

Ian Read提醒,AI虽然潜力庞大,但短期内将受限于人类的生物学知识。 (Getty Images)

加州大学三藩市分校(UCSF)生化学家Adam Renslo则从Insilico Medicine的成果看出了AI制药的局限:“这是适合的开发之处,但要让AI去解决没有数据可供其着手的药物开发难题,就困难得多了。”美国大型药厂辉瑞前行政总裁Ian Read则提醒,AI能力将受限于人类对疾病在人体如何运作的认知:“短期内,用AI开发药物将会极之困难,而且不太可能有成效,因为我们对生物学的认知并非所想的那么深。”

这就应验了在电脑科学界流行的一句话,“垃圾进,垃圾出”(Garbarge in, garbage out)。就如Exscientia技术总监Adrian Schreyer解释,人工智能也受限于输入其中的数据,特别是这数据质素会影响它学习:“若你的数据有缺憾,结果也很可能有缺憾。当数据是由第三方而来,就更可能有这个问题。”

实验数据与真实世界不会完全一样,而且,很多都涉及假设和修正。若那演算法及其使用者没有足够考虑这些偏见或加权因素,那么,输出结果也很可能有偏见。例如Koller指,过往很多药物都想要治疗阿兹海默症,但其中很多失败都是因为误以为这病是由β淀粉样蛋白(beta-amyloid)累积所致:“机器学习是一把双刃剑,它愈强大,就愈容易堕进这种空隙。”

相关文章︰从招聘到挽留员工 人工智能如何改革人事部?分析求职者性格 人工智能请人更可靠?用人工智能请人 是消除还是延续偏见?诊症能力媲美人类 人工智能将成未来医生?要取代人类医生 人工智能还欠甚么?

上文节录自第181期《香港01》周报(2019年9月23日)《新药研发低迷 人工智能可如何颠覆生态》。

更多周报文章︰【01周报专页】《香港01》周报,各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。