Herausgeberbewertungen: Benutzerbewertungen:[Gesamt: 0 Durchschnitt: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }
OpenAI Whisper Microservice ist ein kostenloses Open-Source-Projekt auf GitHub, mit dem Sie Audioaufnahmen mithilfe von KI transkribieren können. Sie benötigen lediglich Ihren OpenAI-API-Schlüssel, um Ihre Aufnahmen in Text umzuwandeln. Das geht sehr schnell und Sie müssen es nur lokal oder in einer Cloud bereitstellen. Darüber hinaus ist eine gehostete Version dieses Dienstes verfügbar, die Sie nutzen können, wenn Sie eine schnelle Sprach-zu-Text-Lösung benötigen.
Im Moment können nur gesprochene Wörter transkribiert werden. Aber ich hoffe, dass sie im späteren Update eine Option zum Transkribieren einer Audiodatei nach dem Hochladen hinzufügen. Es ist ein gutes Werkzeug zum Diktieren. Es unterstützt mehrere Sprachen, da es Whisper darunter verwendet. Da Whisper jedoch von OpenAI selbst über die API verwendet wird, benötigen Sie keinen PC mit hoher Hardware.
Wie konvertiert man Sprache mit diesem KI-basierten Tool in Text?
Dies OpenAI Whisper Microservice ist vollständig Open Source, sodass Sie seinen Quellcode abrufen und hosten können mit wenigen Klicks auf einem VPS oder führen Sie es lokal aus. Der Entwickler dieses Tools bietet jedoch auch seine online gehostete Version an, die Sie mit Ihrem eigenen API-Schlüssel ausprobieren können. Die Hauptbenutzeroberfläche ist sehr einfach und benutzerfreundlich.
Geben Sie also Ihren Schlüssel ein und klicken Sie dann auf die Aufnahmetaste. Sie werden um Erlaubnis gebeten, auf das Mikrofon zuzugreifen. Also, lassen Sie das zu und fangen Sie dann an zu sprechen. Wenn Sie etwas, das Ihnen gefällt, in Textform vorlesen möchten, können Sie das jetzt tun.
Nachdem Sie mit der Aufnahme fertig sind, müssen Sie nur noch die Aufnahme absenden und dann ein paar Sekunden warten. Es wird Ihnen die transkribierte Sprachaufnahme angezeigt. Kopieren Sie einfach den Text und verwenden Sie ihn dann an einer beliebigen Stelle.
Auf diese Weise können Sie diese einfachen und Open-Source-Microservices zum Transkribieren Ihrer Sprachaufnahmen nutzen. Es eignet sich perfekt für Speech-to-Text und Online-Diktieren. Sie müssen jetzt keine hohen Abonnements mehr für andere Dienste bezahlen.
Abschließende Gedanken:
Wir haben erläutert, wie Sie Whisper selbst auf einem Tour-PC verwenden, aber das erfordert technische Kenntnisse und eine leistungsstarke Hardware zum Ausführen des KI-Modells. Jetzt können Sie all das mithilfe der kostenlosen und Open-Source-Dienste automatisieren. Da die gesamte schwere Arbeit von der OpenAPI-API übernommen wird, können Sie sie auf einem durchschnittlichen PC oder Laptop ausführen.