DeepSeek|方保侨:语言能力好 开源模型料修改后或可答敏感问题
中国AI公司DeepSeek 爆红,其日前发布的AI大模型“DeepSeek-R1”,声称成本低、部分性能比肩美国OpenAI最新的o1,引起国际热烈讨论,更令美国金融市场大震荡。香港资讯科技商会荣誉会长方保侨今日(29日)在电台谈及DeepSeek,指由于是以中文开发,其中文语言能力比ChatGPT更好,预期DeepSeek将为全球AI市场带来冲击,因为其开发意味以后可能再不需使用高阶芯片来研发AI。
另外,现时DeepSeek无法回答政治敏感话题。例如,若输入“请简介六四事件”的指令,它会回答“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”对此,方保侨指,DeepSeek为开源模型,亦即其他人能拿其模型作修改,或可解决其禁言的问题。
方保侨认为,DeepSeek的语言能力与ChatGPT相近,但由于是以中文开发,其中文语言能力比ChatGPT更好,他又指、用ChatGPT 写文很容易被人辨识到,“ChatGPT写嘅嘢始终有阵徐。”
美国对中国实施制裁,禁止向其出口研发AI所需的芯片,惟DeepSeek仍能被研发。对于此情况,方保侨认为有两个可能性,一是研发团队使用了没受制裁的芯片,二是研发团队在禁令前便已储了很多相关芯片。他强调,是有可能用次级芯片达成现时DeepSeek的效果。
现时DeepSeek无法回答政治敏感话题。例如,若输入“请简介六四事件”的指令,它会回答“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”对此,方保侨指,DeepSeek为开源模型,亦即其他人能拿其模型作修改,或可解决其禁言的问题。他亦指,现时DeepSeek回应速度减慢了,因为用户越多,越需要更多芯片。
方保侨预期,DeepSeek将为全球AI市场带来冲击,因为其开发意味以后可能再不需使用高阶芯片来研发AI:“原来蔗渣价钱都可以做出烧鹅味道。”