OpenAI tarafından Whisper kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Editör Puanları: Kullanıcı Puanları:[Toplam: 0 Ortalama: 0].ilfs_responsive_below_title_1 { width: 300px; } @media(min-width: 500px) {.ilfs_responsive_below_title_1 { genişlik: 300px; } } @media(min-genişlik: 800 piksel) {.ilfs_responsive_below_title_1 { genişlik: 336 piksel; } }

Buzz, OpenAI’s Whisper’a dayalı ücretsiz bir masaüstü uygulamasıdır. Sesi otomatik olarak metne kolaylıkla kopyalayabilir. Birkaç modeli var ve siz sadece mikrofona konuşuyorsunuz ve neredeyse gerçek zamanlı olarak onu metne dönüştürecek. Bu tamamen açık kaynaklı bir araçtır ve Windows, macOS ve Linux üzerinde çalışır.

Altta kullandığı makine öğrenimi modeli çok güçlüdür. Ve ses sistemini mikrofona bağlayarak şarkıları ve videoları otomatik olarak metne dönüştürebilirsiniz. Sadece başlattığınızda, mikrofondan ses dinlemeye başlayacak ve onu ücretsiz olarak metne dönüştürecektir.

Sesi yazıya dökmenin yanı sıra, çeviri modunda da çalışabilir. Bu durumda, yalnızca hedef dili seçmeniz gerekecek ve gerisini o halledecektir. Ancak, şimdilik, giriş olarak yalnızca İngilizce dilini desteklemektedir. Yalnızca konuşulan İngilizce kelimeleri çevirebilir veya yazıya dökebilirsiniz. Ancak sonraki güncellemelerde daha fazla dil için destek eklediklerini umuyorum.

OpenAI, Whisper<'ı başlattı/a> birkaç gün önce. Wisper, İngilizce konuşma tanıma konusunda insan düzeyinde doğruluğun yanı sıra sağlam bir deneyim sunan açık kaynaklı bir sinir ağıdır. Oldukça yeni ve bu nedenle gelecek güncellemelerde daha güçlü dil desteği ekleyeceklerini umuyorum.

OpenAI tarafından Whisper’ı kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Buzz, GitHub. Python’da yazılmıştır. Yani, doğrudan kaynaktan çalıştırabilirsiniz. Veya bu aracın geliştiricisinin sağladığı bağımsız ikili sürümleri kullanabilirsiniz.

Kaynak ile gitmeye karar verdiyseniz, Python ve şiir kitaplığının kurulu olması gerekir. Bundan sonra, gerekli tüm bağımlılıkları ve sanal ortamları yüklemek için bu komutu çalıştırmanız yeterlidir.

poetry install

Basitlik için, ikili sürümü indirebilir ve doğrudan çalıştırın. Mac, Windows ve Linux sürümleri mevcuttur. Burada Windows sürümünü kullanıyorum, bu yüzden onu indirip doğrudan çalıştırın. Oldukça ağır bir yazılım olduğu için yüksek donanım konfigürasyonuna sahip bir bilgisayarda denemenizi tavsiye ederim. Yapmanız gereken ilk şey mikrofonu seçmek ve modu belirlemek. Varsayılan olarak, transkripsiyon modunda çalışır.

Şimdi başlamasına izin verin. İlk kez çalıştırdığınızda, modeli arka planda indirecektir. Bu nedenle, ilk çalıştırma biraz daha yavaş olacaktır. Hazır olduktan sonra, sadece Kaydet düğmesine basmanız yeterlidir. Bundan sonra konuşmaya başlayabilirsiniz ve metin düzenleyicide görünecektir. Deşifre işlemi ayrıca gecikme gibi bir dizi faktöre de bağlıdır.

Farklı modeller hakkında daha fazla bilgi için aşağıdaki tabloya bakın:

Boyut Parametreleri Yalnızca İngilizce model Çok Dilli model Gerekli VRAM Göreceli hız minik 39 M tiny.en minik ~1 GB ~32x taban 74 M base.en taban ~1 GB ~16x küçük 244 M small.en küçük ~2 GB ~6x orta 769 M orta.en orta ~5 GB ~2x büyük 1550 M N/A büyük ~10 GB 1x

Artık bu yazılımı bu şekilde kullanmaya devam edebilir ve konuşmayı metne çevirebilirsiniz. Doğruluk adil. Ancak Windows 10’un sesle yazması kadar düzgün değil, 11 ve veya Speechnotes web sitesi. Şimdilik sadece çalışıyor ve OpenAI’nin Fısıltısının doğruluğunu ve kullanılabilirliğini test etmek için kullanabilirsiniz.

Fikirleri kapatmak:

Whisper, konuşmayı metne dönüştürmek için harika bir sinir ağıdır. Bir geliştirici veya programcı olarak, bunu konuşmadan metne işlevselliğine ihtiyaç duyan yazılımlar ve uygulamalar oluşturmak için kullanabilirsiniz. Doğruluk iyi ancak bundan sonra hız ve akıcılık eksik. Ancak bu, modelin kendisinin değil, yalnızca GUI’nin sınırlamasıdır. Umarım gelecek güncellemelerde kullanıcı arayüzünü geliştirirler.

OpenAI tarafından Whisper kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Published by IT Info on October 6, 2022

OpenAI tarafından Whisper’ı kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Fikirleri kapatmak:

IT Info

Ulefone Note 15, yeni bir Android Go akıllı telefon

IT Info

Erken Apple M2 Kodu, Daha Fazla WiFi 7, AMD Kılavuzlu Otonom Mod ile Linux 6.4 Piyasaya Sürüldü

IT Info

Apple Watch Telegram İstemci Güvercini Çıkartmalar, Sesli Mesajlaşma İle Güncellendi

OpenAI tarafından Whisper kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Published by IT Info on October 6, 2022

OpenAI tarafından Whisper’ı kullanarak Sesi Metne Dönüştürmek için ücretsiz araç: Buzz

Fikirleri kapatmak:

Related Posts

IT Info

Ulefone Note 15, yeni bir Android Go akıllı telefon

IT Info

Erken Apple M2 Kodu, Daha Fazla WiFi 7, AMD Kılavuzlu Otonom Mod ile Linux 6.4 Piyasaya Sürüldü

IT Info

Apple Watch Telegram İstemci Güvercini Çıkartmalar, Sesli Mesajlaşma İle Güncellendi