CodeGemma は、Google DeepMind に基づいて構築された Gemma モデルを使用したオープンソースのコードモデルファミリーであり、コード生成および理解の分野で大きな注目を集めています。このモデルはコード生成能力を向上させるだけでなく、強力な自然言語理解能力も維持し、さまざまなアプリケーションシナリオに強力なサポートを提供しています。この論文では、CodeGemma の技術的詳細と評価結果、および AI 分野への影響について詳しく説明します。
- 紹介
CodeGemma モデルは、Gemma 事前トレーニングモデルに基づいて構築され、大量のコードデータでさらなる事前トレーニングを行うことで、コード補完および生成タスクでのリーダーシップを確立しました。同時に、Gemma モデルの強力な自然言語理解能力も維持しています。CodeGemma には、7B パラメータの事前トレーニングモデル、7B パラメータの命令チューニングモデル、およびコード補完および生成タスクに特化した 2B パラメータのモデルが含まれています。
Ollama で簡単なテストを行ったところ、ollama が codegemma をサポートしていることがわかりました:https://ollama.com/library/codegemma、デフォルトは 4 ビットの量子化で、他のバージョンもサポートしています。私は、16G の GPU で実行できる最大のモデル "codegemma:7b-instruct-q6_K" を選択しました。