【开放数据】不再误将PDF当开放数据 资科办指政府部门认知升
政府首份开放数据计划文件2019年出炉,这是自2011年政府部门开始在“资料一线通”网站上发放公共数据后,首次要求各部门每年公布开放数据未来计划。
2020年的开放数据计划早前发布,负责统筹的政府资讯科技总监办公室﹙资科办﹚总系统经理赵善衡接受访问时表示,开放数据除对外可便利市民及程式开发商外,对内亦加深政府部门对开放数据的认知,如“部门准备第二份计划时,初版不会再出现PDF。”
此外,资科办近期亦推出城市仪表板,以互动图表及地图展示交通、天气、公共服务等城市动态,另外在“政府一站通”网站增加聊天机械人,协助市民寻找所需表格。
政府部门去年一共开放700多个数据集,当中有实时更新的交通、天气数据等,也有多项API﹙应用程式介面﹚及地理空间数据。赵善衡表示,在选择开放哪些数据时,会以是否围绕市民日常生活、是否有助推动智慧城市发展等作为考虑因素。
政府部门认知提升 不再将PDF当成开放数据
回顾制订首份﹙2019年﹚开放数据计划的“心路历程”,他说当时先参考国际标准如GOPI﹙全球开放数据指数﹚,找出需要增加的数据种类,并引导讨论;其后又举办多场工作坊,向其他部门讲解开放数据的理念,并示范如何准备数据等。
政策推行一年后,赵善衡认为政府部门皆非常重视这项工作,而且认知大有提升,例如初期因不同理解,有人会认为将数据公开便是开放数据,而现在就更了解何谓常用机器可读格式,“部门准备第二份计划时,初版亦不会再出现PDF。”此外,资科办的一大任务,就是与其他部门商讨选用一些常用机读格式,设定一套标准。
首年收市民意见超过100则 八成获回应
至于市民可循甚么途径提出建议?资科办高级系统经理王翔表示,“资料一线通”上设有意见栏收集市民意见。他透露,去年收到超过100则意见,政府部门在考虑公帑运用、私隐及法例几方面后,回应当中的约八成的建议,开放相应的数据集,包括即将在今年年中推出的分区天气数据,以及在明年第二季发放的小巴实时到站数据。
王翔又说,处方亦会留意社会讨论,并在研讨会、黑客松等活动中主动了解业界需求,亦会不时跟进部门仍未开放的数据集。
现时“资料一线通”上的数据多为机器可读格式,主要用家是应用程式开发商,而为了便利市民理解及使用数据,资科办新推出城市仪表板,互动图表及地图展示交通、天气、公共服务,以及城市统计四大主题。市民可利用手提或电脑打开仪表板,拣选所需的资讯组合,了解城市动态。
新推出城市仪表板、聊天机械人
市民若要申请护照、驾驶执照等,一般都会在“政府一站通”下载表格。资科办近期在“政府一站通”上增加聊天机械人Bonny,协助市民找寻所需表格。市民只需输入问题,聊天机械人便会回复表格的下载连结,若果输入的要求未够清晰,机械人会以一问一答方式引导市民找出表格,现时已可提供74个政府部门多达3,300张表格。
项目负责人、高级系统经理劳敏明解释,Bonny结合人工智能及自然语言处理技术,而由于广东话中有不少别字、中英夹杂的语句,为使回答更准确,故选用AI监督式学习﹙supervised learning﹚,初期需要人手每日微调词库,例如因应政府颁报的新政策,迅速加入语句资料。她预期,Bonny有助积累政府服务相关的词库,将来可与其他政府部门共享,改善电子服务流程。