編集者の評価: ユーザーの評価:[合計: 0 平均: 0] @media(最小幅: 500px) { } @media(最小幅: 800px) { }
Retool は、LLM の結果を並べて比較するための無料の LLM Playground を立ち上げました。選択して使用できる、人気のあるさまざまな大言語モデルがリストされています。プロンプトを受け取った後、それらはすべて結果を生成し、それらを分析できます。これらのモデルには、短い結果を生成するものもあれば、詳細な結果を生成するものもあります。このように、このプラットフォームを使用すると、同じプロンプトに対して異なるモデルによって AI が生成した応答を比較できます。
異なる LLM が同じ場所の同じプロンプトでどのように動作するかをテストする場合は、この Web サイトを参照してください。は素晴らしい場所です。今のところ、選択して結果を比較するために使用できる 7 つの LLM が提供されています。ただし、現時点では、結果を比較するために一度に 3 つのモデルしか選択できません。 Retool が現在提供している LLM のリストは次のとおりです。
GPT 3.5 GPT 4 Command XL Nightly Anthropic’s Calude 1.2 Flan-T5 XXL Blenderbot 3B DialoGPT Large
これらのモデルから、任意の 3 つを選択して同時に比較できます。 LLM プラットフォームにはシンプルで直感的なインターフェイスがあり、トークン数と温度を制御できます。
Retool による無料の LLM Playground で LLM 結果を並べて比較
この Retool の LLM Playground を試すのにアカウントは必要ありません。 こちらの URL からアクセスして、使い始めるだけです。すでに 3 つのモデルが設定されていますが、リストから別の 3 つのモデルを選択して変更できます。
ここで、開始するプロンプトを入力します。プロンプトを入力し、トークン数と温度を指定するだけです。
[送信] をクリックして、すべてのモデルが応答を生成するのを待ちます。最終的に回答が得られたら、それらを単純に比較できます。または、クリックしてコピーすることもできます。
このように、このシンプルなオンライン ツールを使用して、テキスト応答を生成する一般的な AI チャットボットの LLM 出力をすばやく比較できます。ただし、ここでの少しの欠点は、すべてのモデルがデータをロードできるわけではないということです。それらの一部だけがいつか機能します。しかし、今後の更新ですぐに修正されることを願っています。
まとめ:
何らかの理由で、異なる LLM が同じプロンプトでどのように動作するかを確認したい場合は、この webapp を使用してください。リツールがお手伝いします。今のところ7モデルしかありませんが、今後のアップデートでさらに追加されることを願っています.このツールを試してみて、ご不明な点がありましたらお知らせください。