【东京直击】Google翻译揭秘 更似人话 仲学埋Singlish等方言
Google翻译是一个十分有用的工具,有用到连大部份Google服务都“行人止步”的中国,也“破例”准许内地网民使用。最近于东京举办的Google媒体开放日中,Google便展现了在人工智能﹙AI﹚和机器学习(Machine Learning)技术的帮助下,Google 翻译如何再进化,除了更似“人话”,未来不但图像可即时翻译,甚至可以结合耳机,作即时传译!
根据 Google 早前的统计,全世界每天进行超过 10 亿次的翻译,每月有超过10 亿的活跃使用者,Google亦加快开拓翻译的版图,哪怕是英文,机器未来也要弄清“新加坡英语”(Singlish﹚等方言!
Google Brain和Google深度学习及人工智慧研究团队的领导者Jeff Dean表示,去年以来,Google开始将神经互联网用于翻译中,现在已有有97个语言使用了神经机器翻译系统﹙Neural Machine Translation﹚技术,令翻译结果更流畅,准确性也大大提高。
即时图像和语音翻译
这也令Google翻译的使用场景更多,第一个是即时相机翻译(Word Lens),现在使用者只要拿著手机镜头对准部份文字,便可即时翻译为英文,目前已可支援38种跟英文互译的语言组合,去旅行时用来翻译标志或菜单十分好用。
此外,Google的Pixel Buds耳机可以即时将附近的人说的话翻译成你选择的语言,Jeff Dean称,它令一般人都可以在陌生语言环境中自在漫游,陌生的语言只需几秒钟便能通过耳机翻译成你的母语。有了它,要去异地旅行或读书工作,要融入当地环境,相信也会容易得多。
解决“网络语言不平衡”
除了扩大翻译的准确度和使用方便度外,Google另一目标是将翻译支援的语言种类不断扩大。Google语言研究计划总经理Linne Ha表示,全球其实有6,000种语言,互联网上却有超过50%都是英文网页,这样的不平衡会造成知识资源向某些语言倾斜,但却令部份地区更难取得知识。
透过更好更快的Google翻译,不但以弱势语言设立的网页可接触到更多受众,也可以令更多人愿意以弱势语言设立网页,解决网络语言不平衡的问题。Google正透过Google的AI深度学习技术,在持续改善翻译质量的同时,不断添加Goolge翻译支援的新语言,今年能够辨识的语言便新增了20种。
制作各语言的“平均腔调”
为了让Google翻译可帮助到更多的人,Google也发起Unison计划,为资源较少的语言建立文字转语音系统,每个语言收集众多志愿者的人声,每位讲45分钟,大约2,000个常用语,并从中选出10位“人声”,透过系统处理创造出一个平均的腔调,来制作出该国正式的翻译语音。
Linne Ha表示,该人声要既平均,反映出当地人的腔调,又不可完全似一个“真人”,否则在日常使用上易令人困惑。目前Google已经建立孟加拉语、尼泊尔语、高棉语、僧伽罗语、爪哇语等的文字转语音系统。Linne Ha称,未来Google翻译另一目标是方言,因为同是英语,不同方言之间也有不少区别,例如英式英语跟新加坡英语在腔调和用字上也有不同,料Google未来很快便会支援到新加坡英语。