Google представила аудиокодек Lyra, для передачи речи при плохой связи

Изображение: opensource.googleblog.com
Lyra
Lyra

Новый аудиокодек Lyra представлен компанией Google, 6 апреля сообщил Google Open Source.

Уточняется, что кодек оптимизирован для получения наилучшего качества передачи речи, в случае, если доступны только низкоскоростные каналы связи. Кодек написан при помощи языка программирования C++ и доступен для пользователей под открытой лицензией Apache 2.0. Однако, для полноценной работы с кодеком, необходима библиотека libsparse_inference.so, защищенная правами собственности. С помощью этой библиотеки реализовано ядро кодека, занимающееся математическими вычислениями.

Google уверяет, что наличие этой библиотеки является временной мерой и вскоре она будет заменена на бесплатный аналог, разработанный корпорацией. Кроме того, Google собирается обеспечить поддержку кодека на различных платформах.

Отмечается, что Lyra значительно превосходит возможности традиционных кодеков по передаче голосовых сигналов на низких скоростях. Его алгоритмы, помимо обычных методов сжатия данных, используют приемы машинного обучения, позволяющие воссоздавать недостающую информацию, основываясь на типовых характеристиках речи. Для создания модели генерации звука кодеком использовали базу данных, содержащую несколько тысяч часов с записями голосов людей, говорящих на более чем 70 языках.

Создатели аудиокодека утверждают, что с кодированием и декодированием сигнала Lyra может справляться даже на средних по мощности смартфонах, несмотря на применяемые технологии машинного обучения. При этом, задержка передачи сигнала будет составлять, в среднем, около 90 миллисекунд.