このウェブサイトを通じて、次のことができます:
28 の大規模言語モデルと対話する
大規模モデル同士をランダムに対戦させる
2 つの大規模モデルを指定して対戦させる
大規模モデルのランキングを表示する
上記のすべての操作には、登録、ログイン、支払いは必要ありません。ウェブアドレスを開くだけで体験できます!
これらの 28 のモデルには、現在世界最強の GPT-4-Turbo も含まれています。
さらに、以下も含まれています:
第一陣のオンラインモデル:
GPT3.5
Gemini Pro
Claude2
第一陣のオープンソースモデル:
Llama2
Qwen
Yi-Chat
ChatGLM
Code Llama
WizardLM
実際には、市場に出回っているほとんどのモデルが含まれています。
さまざまな AI チャットモデルを素早く体験したい場合、これは間違いなく良い選択です。
以下に、具体的なプレイ方法をご紹介します!
同時に、真の言語の王者は誰なのか見てみましょう。
- モデルバトル
ウェブサイトを開くと、デフォルトでアリーナ(戦闘)に入ります。実際には、28 のモデルがバトルしています。
ルールは非常にシンプルです:
ウェブページを開いた後、システムは 2 つの大規模モデルを自動的に選択し、モデルの名前は表示されません。
あなたがチャットを開始し、それらの応答に基づいて評価を行います。
システムは多数の評価に基づいてランキングを作成します。
このデザインは興味深いです。これにより、実際のユーザーのフィードバックを収集することができます。GPT 公式のチャットでも、並べて表示される結果が表示され、どちらがより良いかを選択することがあります。
このようなテストの結果は、さまざまな基本的なテストを行うよりも意味があります。
以下に例を挙げます。直接質問「父の父の娘の名前は何ですか?」を入力します。
左側の方が右側よりも少し良いです。
- 指定モデル対戦
匿名性は公平で公正なフィードバックの統計に有利ですが、誰と対話しているのかはわかりません。もし直接 2 つの大規模モデルを指定して対戦させたい場合は、2 番目の機能であるサイドバイサイドのアリーナ(side-by-side)を使用することができます。
結果は明らかです。GPT4 が圧勝です。claude は OpenAI の強敵と言われていますが、実際には大きな差があり、時には一撃で倒せることさえあります。
専門領域の大規模モデルを作るのは比較的簡単です。
世界最大の汎用言語モデルを作ることは簡単なことではありません。
- 直接チャット
対戦したくない場合、ただ静かにチャットしたいだけなら、以下の機能を使用してください。1 対 1 で大規模モデルとおしゃべりできます。(direct chat)
- ランキング
最も強力なモデルは誰なのか、これは常に人々が議論し、関心を持っている問題です。
それでは、ランキングを見てみましょう。
説明から見ると、これは 10 万人以上のユーザーの投票に基づいて作成されたランキングであり、非常に参考になると言えます。
ランキングからは、OpenAI が開発した GPT4 が上位 3 位を占めており、GPT3.5 の順位も良いです。
その他には Claude、Gemini Pro もあります。
前述の 2 つは皆さんにはよく知られていますが、Mixtral はあまり知られていないかもしれません。
Mixtral 8x7B は、Mistral AI チームが開発した大規模言語モデルであり、スパースミクスチャーオブエキスパート(Sparse Mixture of Experts、SMoE)モデルに属しています。
このモデルは Mistral 7B のアーキテクチャを継承しており、各層は 8 つのフィードフォワードブロック(つまり「エキスパート」)で構成されています。各単語を処理する際に、各層のルーターネットワークは現在の状態を処理するために 2 つのエキスパートを選択し、それらの出力を組み合わせます。
このアイデアは興味深く、小さなトリックで大きな成果を上げています。
みんなが GPT4 を追い越そうと言っていますが、実際には GPT4 が圧倒的です。差は縮まっていないどころか、むしろ広がっているように感じます。
投資と関心の度合いもまったく異なります。
強者は強く、予測可能な未来では、ChatGPT は同業他社を遥かにリードするでしょう。