編輯評分: 用戶評分:[總計:0 平均:0] @media(min-width: 500px) { } @media(min-width: 800px) { }

Retool 剛剛推出了一個免費的 LLM Playground,用於並排比較 LLM 成績。它列出了各種流行的大型語言模型,您可以選擇和使用。採取提示後,它們都會生成結果,您可以對其進行分析。其中一些模型生成簡短的結果,而另一些模型生成詳細的結果。這樣,該平台允許您比較不同模型對同一提示的 AI 生成響應。

如果您想測試不同的 LLM 在同一地點對同一提示的表現如何,那麼這個網站是個好地方。目前,它提供了 7 個 LLM,您可以選擇並使用它們來比較結果。但目前,您一次只能選擇 3 個模型來比較結果。這是 Retool 現在提供的 LLM 列表。

GPT 3.5 GPT 4 Command XL Nightly Anthropic’s Calude 1.2 Flan-T5 XXL Blenderbot 3B DialoGPT Large

從這些模型中,您可以選擇任意 3 個同時進行比較。 LLM 平台具有簡單直觀的界面,您可以控制代幣數量和溫度。

Retool 提供的免費 LLM Playground 可並排比較 LLM 結果

您不需要真的需要一個帳戶來嘗試這個 Retool 的 LLM Playground。您只需​​通過此 URL 訪問它,然後開始使用。已經為您設置了 3 種模型,但您可以通過從列表中選擇其他 3 種不同的模型來更改它們。

現在,您輸入提示以開始使用。輸入提示,然後簡單地指定令牌計數和溫度。

單擊提交,然後等待所有模型生成響應。當您最終獲得答复時,您可以簡單地比較它們。或者您也可以單擊它們以單擊複製它們。

這樣,您可以使用這個簡單的在線工具快速比較生成文本響應的流行 AI 聊天機器人的 LLM 輸出。然而,這裡的一個小缺點是並非所有模型都可以加載數據。只有他們中的一些人有時工作。但我希望它在即將到來的更新中盡快得到修復。

結束語:

出於某種原因,如果您想了解不同的 LLM 在同一提示下的表現如何,那麼這個 webapp重組將幫助你。目前只有 7 個模型,但我希望他們在即將到來的更新中添加更多模型。所以,試試這個工具吧,如果您有任何問題,請告訴我。

Categories: IT Info