Na początku 2021 r. Google ogłosił Lyra jako kodek o bardzo niskiej przepływności przeznaczony do mowy, którego celem jest umożliwienie Lyry i AV1 rozmów wideo na połączeniach 56 kb/s.
Miesiące po pierwszym ogłoszeniu opublikowali kod open-source i nadal go rozwijali. W tym tygodniu pojawi się Lyra w wersji 1.3 z najnowszymi optymalizacjami.
Lyra 1.3 poprawia to jeszcze bardziej niż poprzednio dzięki ulepszeniom Lyra 1.2 „V2” we wrześniu. Dzięki Lyra 1.3 jest teraz jeszcze lepsza prędkość i mniejsze potrzeby w zakresie przechowywania modelu.
Model oparty na Lyra 1.3 TFLife jest o około 43% mniejszy niż poprzednia wersja, a jednocześnie jest około 20% szybszy w porównaniu z poprzednią wersją v1.2. Te wygrane są uzyskiwane przy użyciu 8-bitowych liczb całkowitych zamiast 32-bitowych liczb zmiennoprzecinkowych dla niektórych wag i operacji. Mówi się, że jakość dźwięku Lyry 1.3 jest tak samo dobra, jak w poprzednich wydaniach, a jednocześnie cieszy się dużym przyspieszeniem. Jednak strumień bitów Lyra uległ zmianie i jest niekompatybilny z wcześniejszymi wydaniami ze względu na różnice w wadze.
Pobierz i więcej szczegółów na temat kodeka głosowego Lyra 1.3 na GitHub.
Tymczasem Facebook/Meta ogłosił niedawno EnCodec jako swoją technologię neuronowej kompresji dźwięku o wysokiej wierności, która ma cele podobne do Lyry.