立法会过千万引入AI誊录系统 一常见字常写错 梁君彦:学习当中
立法会去年与内地人工智能公司科大讯飞合作,引入智慧誊录系统,在10月复会后使用第二期系统,即时逐字记录会议,准绳度达93%,又能透过声纹自动辨认发言的官员及议员。据立法会主席梁君彦透露,首两期系统,立法会合共向政府申请拨款不多于1,500万元。
到底花费八位数字的系统准确度如何?立法会今日向传媒展示系统运作,其中系统多次将“系”写成“系”,又曾多次在议员发言停顿时,误以为换人,令“李世荣议员”的名字“老是常出现”。秘书处解释,议员口音、部份不常见字词等,系统仍需时间学习,仍然有机会出错,职员会在后台即时修正,又强调对比以往人手逐字记录,已经节省很多时间,有信心系统会不断进步。
梁君彦早前透露,立法会秘书处过去一段时间,向科大讯飞提供立法会成立以来,共约2亿5,000万个中英文字,以及提供予大约100小时的会议录音及80万字会议誊本,以训练翻译引擎。
系统可准确记录绝大部份议员发言 惟多次将“系”写成“系”
该智慧誊录系统上两周起启用,立法会今日向传媒展示系统运作。据记者观察,腾录系统能准确记录议员的绝大部份发言内容,“啲”、“嘅”、“呢”等口语用字,通通难不到系统。
系统亦能听出英语字词,例如“O Camp”、“COVID”,并有自动修正错误功能,例如将“资讯”一词记录为“自信”时 ,又或议员停顿、无法判断是否要加逗号时,都能自动在数秒内调整。
不过系统似乎仍有沙石,其中多次将“系”写成“系”,又曾将“上面”,写成“上便”。声纹辨认亦不例外,议员发言停顿或换人发言之时,系统多次误认,重复写出“李世荣议员”,需要秘书处在后台即时更正。
至于部份议员或广东话不正,或有懒音等,系统又能否认出?梁君彦表示,系统暂时未处理到,会有职员即时更正。他又透露,有口音的选委界议员谭岳衡议员今日曾视察系统,“都戙起手指公赞我哋system好”。他又笑言,李世荣“老是常出现”,或许是“系统好钟意李世荣”。
梁君彦:系统学习当中 有信心会继续提高准确度
梁君彦透露,首付及第二期系统,立法会分别向政府申请拨款不多于500万及不多于1,000万,现时系统逐字记录准绳度达93%。至于声纹认人准确率,秘书长卫碧瑶指已达70%。二人强调,系统正在学习当中,已比最初“叻”了不少,有信心会继续提高准确度。
秘书处又正计划向政府申请拨款多1,000万元,发展第三期系统,提供即时字幕功能,期望明年第三季推出。而第四期项目,计划发展政策资料库及智能分析等,供议员及政府官员使用。
被问到系统启用后秘书处会否精简人手,梁君彦指无此想法,又强调引入系统,是不希望同事做“揼石仔嘅嘢”,而是做更多可以帮到秘书处运作的专业升值工作。