ChatGPT迎来劲敌?Google能否靠Gemini重拾AI霸主之位

撰文: 欧敬洛
出版:更新:

Google在12月7日发布新人工智能(AI)模型Gemini,宣称这是胜过OpenAI的GPT-4,是目前世界最强的AI模型。Gemini和GPT-4有什么分别?Google何来如此自信?

Google多年来一直在开发自己的AI工具,随著OpenAI发布ChatGPT,Google也顺势推出了类似的AI工具Bard。但Bard输了给ChatGPT,让ChatGPT成为今天最受欢迎的生成式AI。Google当然不甘示弱,经过半年的打造,在今天发布Gemini。

Gemini与ChatGPT分别?

Gemini在技术上是一个LLM(大型语言模型),这意味Gemini是一个机器学习框架,通过将大量人类内容输入其中并协助其建立规则来理解内容。通过足够训练,LLM能够处理语言数据并组成自己的句子,模仿特定风格。

图为2019年5月,位于美国加州的Google总部大楼。(Reuters)

ChatGPT则是基于GPT-3.5、GPT-4架构的LLM训练而成的生成式AI。因此把Gemini和ChatGPT比较不太妥当,Gemini应与ChatGPT背后的GPT-4比拼才是。

过去LLM大都专注于某几个领域,例如语音或图像。Google DeepMind著名的AlphaGo曾击败世上顶尖围棋棋手,成为当时世上最强的AI。但AlphaGo除了围棋外对其他领域一窍不通,GPT-4凭着打破这单一领域的界限而受到青睐。

Gemini同样打破了单一领域的界限,Gemini从一开始就接受多项训练,包括代码、图像(包括表情符号)、影像、音讯(包括语言)等各种内容,这似乎要比GPT-4还要多。根据Google的介绍,Gemini的“十项全能”包括:

向学生解释物理问题。
处理原始音讯以寻找特定信号。
翻译、摘要和对话等自然语言处理。
分析用户意图,为用户创造配件和方案。
协助科学家发现他们可能错过的研究中的关联性。
在所有程式编写竞赛中获胜。

Gemini将会推出的3个版本,Nano相信会被Google应用在多个领域中,且很可能免费。(Google)

可以应用在哪里?

Gemini目前仍未上市,但Google已说明会为Gemini设计三个版本,分别是最强的Ultra版,实用的Pro版和轻量Nano版。根据不同用途和资源,开发者可使用不同版本打造自己的AI程式。

外界预料Gemini推出初期可能仍不足以与GPT-4比拼,因ChatGPT的用户非常多,但长远来看假若Gemini表现良好,Google可以逐渐扳回优势。Google的用户比ChatGPT还要多,除了PC外还有手机Pixel,接触层面非常广阔。且Google就是现时全球最主流的搜索引擎,掌握所有实时资讯提供学习,这是OpenAI无法媲美的。

据预测Google会把Gemini整合到Bard中,提升Bard能力,同时透过Google自身的搜寻引擎、Youtube及Pixel手机等展示Gemini,吸引开发者投入设计更贴切用户需求的AI,让另一个AI生态圈发展起来。