【云端X影像】让人工智能学习历史 拼凑出人类的“时光地图”

撰文: 伍振中
出版:更新:

《纽约时报》与Google合作,报社记者可以借由Google云端技术团队协助建设的数码图库搜索图片。Google工程人员亦向《纽时》提供机器学习工具如Vision API等高阶资讯整合技术,让《纽时》可以综合实体新闻图片的各种资讯,包括辨别手写文字、图中物件等。这项将历经年的计划,他们称之为“Google Morgue”。(此为《云端上的图片》系列报道之二)

Vision API:Google向公众提供的一种人工智能和机器学习技术,具有物体辨识功能。它可以快速将图片归类至数千种类别之一、侦测图片内的个别物件和脸部,以及读取图片中的印刷文字,并能持续引进新概念,提高侦测准确度。

无论是企业,或是个人用户,很多人都用上了Google提供的云端服务。(Getty Images)

系列相关文章:

【01专访】从《纽时》地库“停尸间” 看一场百年旧照的重生之旅

【云端X影像】科企掌握我们的“记忆” 数码遗产谁来继承?

【01专访】Instagram取代实体相簿 细诉两种摄影的意义

【云端X影像】寻找“古早味”老照片 探索香港影像的数码化进程

“Google方面给予我们很多技术支援,确保我们能够妥善运用它提供的技术,并建议我们如何完善内部的内容整合系统……此外,我们也会反馈一些服务方面的意见。” 协助Google Morgue统筹工作的《纽约时报》编辑Veronica Chambers向记者表示。

Google云端服务的技术总监Brian Stevens则提到,与《纽时》的合作将惠及下一代,继续承传历史使命。

Stevens称,“Google希望自己研发的云端技术,可以用作保存这些无价的历史片段,而且能够让新闻从业员以崭新的方法,在芸芸数百万张历史图片中,进行搜索和分析,并赋予‘新生命’……从仓库转移至云端平台,记者可以将图片故事升华至全新的高度。”

《纽时》通过Google Morgue,与Google工程人员不断探索云端技术和API人工智能技术,运用于未来新闻业发展。不过,Chambers向记者强调,Google只向《纽时》提供技术上的支援,Google方面没有权限取得《纽时》内部数据库的资讯内容。

《纽时》地下图库的历史新闻图片,将会逐一数码化,放上云端永久储存。(Earl Wilson for The New York Times)

方便搜索分析 重构历史现场

由于“停尸间”的新闻老照片库藏极多,因此《纽时》与Google工程人员仍需继续跟进图像数码化工作,以扩充云端图库,更新库藏资讯。

他们更艰巨的工作在于对历史新闻故事的资讯整合,“我们透过Google的技术,从历史新闻图片中辨识出足够的资讯,包括文字说明、分类卡片说明、图片背面有关事件背景的简介等,将当时的历史事实重新呈现出来。” Chambers向记者表示,这是整个计划的终极目标。

纽约市宾夕法尼亚车站(Penn Station)的往昔时光。(The New York Times)

Google Morgue载入新闻照片的相关资讯,故可以将同一宗事件或有关连的事件汇集起来,从而将某宗历史事件的来龙去脉和前因后果,像搜集一块块拼图般,拼凑成一幅较完整的图画。借着Google Morgue,历史事件按照其演进过程重新建构起来,并向读者呈现最合乎基本事实的故事全貌。

部分历史照片背后记载重要讯息,“停尸间”图库收藏的宾夕法尼亚车站照片(上图),背面附上新闻剪报。(The New York Times)

若没有这些技术,单靠人手及笔录整合数百万张图片资讯,基本上是一项“不可能的任务”。

根据《纽时》摄影记者Stephen Hiltner的说法,除了“停尸间”数以百万计的新闻老照片外,报社还有大约一千万张新闻相片的底片,存放在编辑室及其他图书馆。那么,已经数码化并放上云端的照片,实质占多少比例?连Chambers都说不清楚。

“我只能说,数码化的照片只占很少部分。这个计划将会历时多年……每一次走进‘停尸间’,仔细考究每一张图片,我们对于现时身处的这个社会便会多一份认知。” Chambers说道。

“我们希望通过数码化历史新闻照片,让年轻一代的读者了解过往发生的事情。骤眼看下去,‘旧照片’、‘新世代读者’,两者似乎相当矛盾。” Chambers表示,“不过,现时新闻媒体作为‘解释者’(explainer)的概念十分流行。现在的读者都希望媒体可以就着新闻事件,解释一个人、一宗故事,或者一套思想……”

“解释性新闻”(Explanatory Journalism)是互联网社交媒体时代兴起的新型新闻叙述方式。由于互联网资讯繁杂,质素参差,愈来愈多新闻读者,希望可以得到有关新闻背后的详细背景资料,且须真实可靠,而非纯粹得悉新闻事件。故有新创媒体以“解释性新闻”为主打内容,就着单一新闻事件,重塑事件背后的脉络、历史远因等。创立于2005年的美国新创网络媒体公司Vox Media正是其中一例。

互联网资讯繁杂,质素参差,愈来愈多新闻读者,希望可以得到有关新闻背后的详细背景资料,且须真实可靠,而非纯粹得悉新闻事件。(Getty Images)

“停尸间”存放的都是活生生、关于这个世界的集体记忆。这些珍藏的历史图片,正正就是一个极佳的论证资源,让新闻媒体向读者解释:“我们是谁?”“我们是怎样走到现在?”

记述历史、认识历史,正正存在这种难以抗拒的魔力。

上文节录自第149期《香港01》周报(2019年2月11日)《把记忆托付云端 褪色老照片获新生》。

更多周报文章︰【01周报专页】《香港01》周报于各大书报摊、OK便利店及Vango便利店有售。你亦可按此订阅周报,阅读更多深度报道。