編輯評分: 用戶評分:[總計:0 平均:0] @media(min-width: 500px) { } @media(min-width: 800px) { }

OpenAI Whisper Microservice 是 GitHub 上的一個免費開源項目,您可以使用 AI 來轉錄音頻錄音。只需您的 OpenAI API 密鑰即可將您的錄音轉錄為文本。它的速度非常快,您只需將其部署在本地或云上。此外,該服務還有一個託管版本,如果您需要快速的語音轉文本解決方案,您可以使用該版本。

目前,它只能轉錄口語單詞。但我希望在以後的更新中,他們添加一個在上傳音頻文件後轉錄音頻文件的選項。這是一個很好的聽寫工具。它支持多種語言,因為它在底層使用 Whisper。但由於它使用的 Whisper 是來自 OpenAI 本身的 API,因此您不需要具有高硬件的 PC。

如何使用這個基於人工智能的工具將語音轉換為文本?

這個OpenAI Whisper 微服務完全開源,因此您可以獲取其源代碼並託管它只需在 VPS 上點擊幾下或在本地運行即可。但該工具的開發人員還提供了其在線託管版本,您可以使用自己的 API 密鑰進行嘗試。主用戶界面非常簡單且易於使用。

因此,輸入您的密鑰,然後點擊錄製按鈕。它會詢問您是否允許使用麥克風。所以,允許這一點,然後開始說話。如果您想以文本形式閱讀您想要的內容,那麼您現在就可以這樣做。

錄音完成後,您只需提交錄音,然後等待幾秒鐘。它會向您顯示轉錄的錄音。只需複製文本,然後在任何您喜歡的地方使用即可。

這樣,您就可以使用這個簡單且開源的微服務來轉錄您的錄音。它非常適合語音轉文本和在線聽寫。您現在不必為其他服務支付大筆費用。

結束語:

我們已經介紹瞭如何在巡演 PC 上使用 Whisper 本身,但這需要技術知識和運行人工智能模型的強大硬件。現在,您可以使用免費開源服務自動化所有操作。由於所有繁重的工作都是由 OpenAPI API 完成的,因此您可以在普通 PC 或筆記本電腦上運行它。

Categories: IT Info