Google DeepMind 的最新版本 Gemini Exp 1114,在 Chatbot Arena 上取得了重要成就,凭借超过 6000 个社区投票,跃升至总榜第 1,并在多个领域表现出色:
首先,我们要理解 LLM Arena 是什么。LLM Arena(或称聊天机器人竞技场)是一个评估 LLM 的平台,主要目标是促进社区驱动的 LLM 性能评估。它是最有声望的评估平台之一。
从总榜来看,谷歌新模型 Gemini(Exp 1114)分数直涨 40+,得分为 1344,而 ChatGPT 4.0 最新版本的得分是 1340。谷歌旗下的模型这好像还是第一次有这样的成绩。
Gemini-Exp-1114 在数学竞技场中并列第一,性能匹敌 o1:
目前,Gemini-Exp-1114 可以在谷歌 AI Studio 对话体验
The Terminator is coming