Az
OpenAI Whisper a hangját szöveggé alakítja a Windows 11/10 eszközökön. Mivel ezt a programot az OpenAI fejleszti, egyértelművé kell tenni, hogy a mesterséges intelligencia áll a középpontjában, amit képes tenni. Ha pedig a ChatGPT-t érdemes figyelembe venni, akkor bízhat abban, hogy a Whispert működtető mesterséges intelligencia csúcsminőségű.
Emellett azt is el kell mondanunk, hogy a Whisper tökéletes azok számára. akik a hangot szöveggé szeretnék alakítani, de kevés a pénzük. Ennek az az oka, hogy az AI-alapú alkalmazás ingyenesen letölthető és használható.
Melyek a Whisper hátrányai?
Valószínűleg a telepítés az az egyetlen rész, amely a legtöbb felhasználónak nem fog tetszeni. Ez azért van, mert nem egyértelmű. Ez a szokásosnál hosszabb folyamatot igényel, és ez problémát jelenthet a kezdő felhasználók számára.
Továbbá az AMD GPU-k nem támogatottak. Ennek az az oka, hogy ezek a GPU-k nem támogatják a CUDA-t, az NVIDIA által létrehozott eszközt, amely párhuzamos számítási platformnak és programozási modellnek minősül.
A jelenlegi állapot szerint a CUDA csak az NVIDIA GPU-kat és a hozzá legközelebb álló alternatívát támogatja. az AMD-k szemszögéből a Radeon Compute Platform és az OpenCL. Azt gyanítjuk, hogy az OpenAI a jövőben támogatni fogja az ilyen platformokat, ezért egyelőre várni kell.
Mégis rá kell mutatnunk, hogy a CUDA érettebb a többihez képest, így ez lehet az elsődleges ok, amiért az OpenAI úgy döntött, hogy pillanatnyilag lemond az OpenCL-ről és a Radeon Compute Platformról.
Az OpenAIs Whisper letöltése és telepítése Windows 11/10 rendszeren
A Whisper számítógépen történő telepítéséhez és használatához szükség van a PowerShell használata és a kulcsfontosságú eszközök, például a Python stb. telepítése. Az ehhez szükséges lépések a következők:
Töltse le és telepítse a Pythont.Download és telepítse a PIPD-t. ] Töltse le és telepítse a Python
Ha még nem tette meg, kérjük, látogassa meg a
Ne feledje, hogy a Python nem rendelkezik felhasználói felülettel, ezért minden a parancssoron keresztül történik.
2] Töltse le és telepítse a PIP-t
Itt van a helyzet, ha Pythont használ 2.7.9 vagy újabb, akkor a PIP alapértelmezés szerint telepítve van. Ennek az az oka, hogy a PIP be van építve a Python telepítőjébe, ezért javasoljuk a legújabb kiadás letöltését, mert a régebbi verziók nem lesznek örökké támogatottak.
3] A Chocolatey letöltése és telepítése
Végül időt kell szánnia a Chocolatey csomag letöltésére a számítógépére.
Ehhez nyissa meg a PowerShell programot a számítógépén rendszergazdaként.
Győződjön meg arról, hogy a Get-ExecutionPolicy nincs korlátozva, ezért futtassa a következőt parancsot, és nyomja meg az Enter billentyűt.
Get-ExecutionPolicy
Ha a Restricted feliratot látja, futtassa:
Set-ExecutionPolicy AllSigned
Vagy
Set-ExecutionPolicy Bypass-Scope Process
Ha minden a terv szerint halad, a következő üzenet jelenik meg:
Győződjön meg arról, hogy közvetlenül a beillesztés után nyomja meg az Enter billentyűt a parancs futtatásához. A végrehajtási házirend segít megvédeni Önt azoktól a szkriptektől, amelyekben nem bízik meg. A végrehajtási szabályzat módosítása biztonsági kockázatoknak teheti ki, amelyeket a https:/go.microsoft.com/fwlink/?LinkID=135170 címen található, a végrehajtási irányelvekről szóló súgótémakör ismertet.
Típus: I ha igen, majd kattintson az Enter billentyűre a módosítások hivatalossá tételéhez.
Most a szokásos módon be kell illesztenie a következő parancsot a PowerShellbe. , nyomja meg az Enter billentyűt:
Set-ExecutionPolicy Bypass-Scope Process-Force; [System.Net.ServicePointManager]::SecurityProtocol=[System.Net.ServicePointManager]::SecurityProtocol-bor 3072; iex ((New-Object System.Net.WebClient).DownloadString(‘https://community.chocolatey.org/install.ps1’))
Várjon türelmesen, amíg a Chocolatey települ a számítógépére.
4] Az FFMPEG letöltése és telepítése
A következő lépés tehát a letöltés és telepítse az FFMPEG programot. Ez csak akkor lehetséges, ha a Chocolatey telepítve van. Ezenkívül a telepítést a PowerShell eszközzel kell végrehajtani.
Másolja és illessze be a következő parancsot a PowerShellbe, majd nyomja meg az Enter billentyűt:
choco install ffmpeg
Telepítenie kell az FFMPEG Python verzióját is. ezzel a paranccsal:
pip3 install python-ffmpeg
5] Töltse le és telepítse a Whisper
Végül a következő paranccsal töltse fel a Whispert a számítógépére:
pip3 install git+https://github.com/openai/whisper.git
Mindennek kell lennie. most a helyes irányba halad, ezért gratuláljon magának.
6] Hangot szöveggé alakítani a Whisper segítségével
Mivel minden telepítve van, és készen áll a használatra, itt az ideje az átírásnak. Mivel nincs GUI, a parancssor az egyetlen barátod.
Most, mielőtt elkezdenénk, rögzítenie kell egy hangfájlt, vagy elő kell készítenie egy már a számítógépére mentett fájlt.
Tehát, mondjuk, van egy TWCAudio.mp3 nevű hangfájlunk, amelyet a TWCThings nevű mappában tárolunk.
Az első teendő, hogy módosítsa a könyvtárat a következő paranccsal:
cd C:\TWCThings
Futtassa a Whisper eszközt a fájlon a következő paranccsal:
whisper–model base–language gr–task translate TWCAudio.mp3
Térjen vissza a mappába, és keressen egy szöveges fájlt. Ebben a fájlban található a lefordított hang szöveges formában.
OLVASD EL: Mi az az OpenAI Playground, és hogyan kell használni?
Futtathatja a Whispert helyileg?
Igen, a Whisper futtatható helyben a személyi számítógépén vagy egy felhőplatformról, amely támogatja ennek a nyílt forráskódú beszédfelismerő alkalmazásnak a futtatását.
Használható-e a Whisper AI offline?
A Whisper AI eszköz támogatja az offline használatot, de a legjobban hatékony és gyors számítógépeken működik. Egy gyengébb számítógép arra kényszeríti a felhasználót, hogy sokáig várjon a fájlok átírására, és mindez a hangfelvétel hosszától függ.