Google DeepMind 的最新版本 Gemini Exp 1114,在 Chatbot Arena 上取得了重要成就,憑藉超過 6000 個社區投票,躍升至總榜第 1,並在多個領域表現出色:
首先,我們要理解 LLM Arena 是什麼。LLM Arena(或稱聊天機器人競技場)是一個評估 LLM 的平台,主要目標是促進社區驅動的 LLM 性能評估。它是最有聲望的評估平台之一。
從總榜來看,谷歌新模型 Gemini(Exp 1114)分數直漲 40+,得分為 1344,而 ChatGPT 4.0 最新版本的得分是 1340。谷歌旗下的模型這好像還是第一次有這樣的成績。
Gemini-Exp-1114 在數學競技場中並列第一,性能匹敵 o1:
目前,Gemini-Exp-1114 可以在谷歌 AI Studio 對話體驗
The Terminator is coming