CodeGemma,一個基於 Google DeepMind 的 Gemma 模型構建的開源程式碼模型家族,已經在程式碼生成和理解領域引起了巨大關注。這個模型不僅提高了程式碼生成能力,還保留了強大的自然語言理解能力,為各種應用場景提供了強大的支持。在這篇論文中,我們將深入探討 CodeGemma 的技術細節和評估結果,以及它對 AI 領域的影響。
1 簡介
CodeGemma 模型是基於 Gemma 預訓練模型構建的,通過在大量程式碼數據上進行進一步預訓練,取得了在程式碼補全和生成任務上的領先地位。同時,它還保留了 Gemma 模型強大的自然語言理解能力。CodeGemma 包括一個 7B 參數的預訓練模型和一個 7B 參數的指令調優模型,以及一個 2B 參數的專門用於程式碼補全和生成任務的模型。
在 Ollama 上簡單測試
發現 ollama 已經支持 codegemma 了:https://ollama.com/library/codegemma ,默認是 4bit 量化,也支持其他版本。我就選了在 16G 顯卡上能跑的最大的模型 “codegemma:7b-instruct-q6_K”