Oceny redaktorów: Oceny użytkowników: [Razem: 0 Średnia: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }
OpenAI Whisper Microservice to darmowy projekt typu open source w serwisie GitHub, którego można używać do transkrypcji nagrań dźwiękowych przy użyciu sztucznej inteligencji. Do transkrypcji nagrań na tekst potrzebny jest tylko klucz OpenAI API. Robi to bardzo szybko i wystarczy wdrożyć go lokalnie lub w chmurze. Ponadto dostępna jest hostowana wersja tej usługi, z której możesz skorzystać, jeśli potrzebujesz szybkiego rozwiązania mowy na tekst.
Na razie może transkrybować tylko wypowiadane słowa. Ale mam nadzieję, że w późniejszej aktualizacji dodadzą opcję transkrypcji pliku audio po jego przesłaniu. Jest to dobre narzędzie do dyktowania. Obsługuje wiele języków, ponieważ pod spodem używa Whisper. Ale ponieważ Whisper, którego używa, pochodzi z samego OpenAI przez API, więc nie potrzebujesz komputera z zaawansowanym sprzętem.
Jak konwertować mowę na tekst za pomocą tego narzędzia opartego na sztucznej inteligencji?
To OpenAI Whisper Microservice jest w pełni open source, więc możesz pobrać jego kod źródłowy i hostować go za pomocą kilku kliknięć na serwerze VPS lub uruchomić go lokalnie. Ale twórca tego narzędzia oferuje również wersję hostowaną online, którą możesz wypróbować z własnym kluczem API. Główny interfejs użytkownika jest bardzo prosty i łatwy w użyciu.
Wprowadź klucz, a następnie naciśnij przycisk nagrywania. Poprosi Cię o pozwolenie na dostęp do mikrofonu. Pozwól więc na to, a następnie zacznij mówić. Jeśli chcesz przeczytać coś w formie tekstowej, możesz to teraz zrobić.
Po zakończeniu nagrywania wystarczy przesłać nagranie, a następnie odczekać kilka sekund. Pokaże ci przepisane nagranie głosowe. Po prostu skopiuj tekst, a następnie użyj go w dowolnym miejscu.
W ten sposób możesz użyć tych prostych i otwartych mikrousług do transkrypcji nagrań głosowych. Jest idealny do zamiany mowy na tekst i dyktowania online. Nie musisz teraz płacić ogromnych abonamentów za inne usługi.
Podsumowanie:
Omówiliśmy, jak korzystać z Whisper na komputerze w trasie, ale wymaga to wiedzy technicznej i potężny sprzęt do uruchamiania modelu AI. Teraz możesz to wszystko zautomatyzować, korzystając z bezpłatnych usług typu open source. Ponieważ cała ciężka praca jest wykonywana przez interfejs API OpenAPI, możesz go uruchomić na przeciętnym komputerze PC lub laptopie.