Notes de l’éditeur : Notes des utilisateurs :[Total : 0 Moyenne : 0] @media(min-width : 500px) { } @media(min-width : 800px) { }
OpenAI Whisper Microservice est un projet open source gratuit sur GitHub que vous pouvez utiliser pour transcrire des enregistrements audio à l’aide de l’IA. Il suffit de votre clé API OpenAI pour transcrire vos enregistrements en texte. Il le fait très rapidement et il vous suffit de le déployer localement ou sur un cloud. De plus, une version hébergée de ce service est disponible et vous pouvez l’utiliser si vous avez besoin d’une solution rapide de synthèse vocale.
Pour l’instant, il ne peut transcrire que des mots prononcés. Mais j’espère que dans la mise à jour ultérieure, ils ajouteront une option pour transcrire un fichier audio après l’avoir téléchargé. C’est un bon outil pour la dictée. Il prend en charge plusieurs langues car il utilise Whisper en dessous. Mais puisque Whisper qu’il utilise provient d’OpenAI lui-même via l’API, vous n’avez donc pas besoin d’un PC avec un matériel élevé.
Comment convertir la parole en texte à l’aide de cet outil basé sur l’IA ?
Ceci OpenAI Whisper Microservice est entièrement open source, de sorte que vous pouvez saisir son code source et l’héberger en quelques clics sur un VPS ou exécutez-le localement. Mais le développeur de cet outil propose également sa version hébergée en ligne que vous pouvez essayer avec votre propre clé API. L’interface utilisateur principale est très simple et facile à utiliser.
Alors, entrez votre clé, puis appuyez sur le bouton d’enregistrement. Il vous demandera la permission d’accéder au microphone. Alors, autorisez cela, puis commencez à parler. Si vous voulez lire quelque chose que vous aimeriez sous forme de texte, vous pouvez maintenant le faire.
Une fois l’enregistrement terminé, il vous suffit de soumettre l’enregistrement, puis d’attendre quelques secondes. Il vous montrera l’enregistrement vocal transcrit. Copiez simplement le texte et utilisez-le où vous voulez.
De cette façon, vous pouvez utiliser ces microservices simples et open source pour transcrire vos enregistrements vocaux. Il est parfait pour la synthèse vocale et la dictée en ligne. Vous n’avez plus à payer de lourds abonnements pour d’autres services.
Réflexions finales :
Nous avons expliqué comment utiliser Whisper lui-même sur un PC de tournée, mais cela nécessite des connaissances techniques et un matériel puissant pour exécuter le modèle AI. Désormais, vous pouvez automatiser tout cela en utilisant les services gratuits et open source. Étant donné que tout le travail lourd est effectué par l’API OpenAPI, vous pouvez l’exécuter sur un PC ou un ordinateur portable moyen.