El tan esperado Tesseract 5.0 ahora está disponible como una gran actualización de este motor líder de reconocimiento óptico de caracteres (OCR) de código abierto que, a través de redes neuronales, ofrece una gran precisión y admite más de 100 idiomas para convertir imágenes de texto en texto real.

Tesseract 5.0 había estado disponible como alfa desde finales de 2020 y la versión beta de Tesseract se lanzó en agosto. El martes, Tesseract 5.0.0 fue lanzado oficialmente. Tesseract 5.0 ofrece un rendimiento más rápido a través de”flotadores rápidos”para usar flotadores en lugar de dobles ahora para su entrenamiento de modelos LSTM y reconocimiento de texto. Esto debería conducir a un entrenamiento y un rendimiento de OCR mucho más rápidos mientras se usa menos memoria del sistema.

Tesseract 5.0 también tiene soporte nativo para Apple Silicon, mejoras en el sistema de compilación, mejoras de API para su biblioteca, mejor soporte ARM y más. También hay otras mejoras de código además de los flotantes rápidos que deberían ayudar aún más al rendimiento de OCR de Tesseract.

El desarrollo de Tesseract se originó en HP hace décadas antes de ser de código abierto en 2005. Google se hizo cargo del desarrollo de este motor de OCR después de que fuera de código abierto, pero en 2018 dejaron de contribuir tanto al esfuerzo, que parece ser en parte por qué Tesseract 5.0 tardó tanto en materializarse. Gran parte de la actividad reciente de Tesseract ha sido de Stefan Weil de la UB Mannheim.

Descargas de Tesseract 5.0 y más detalles sobre esta gran actualización de OCR de código abierto a través de GitHub .

Categories: IT Info