Несколько библиотек с открытым исходным кодом, которые используют нейронные сети для распознавания речи:
DeepSpeech. speechify.com Библиотека от Mozilla построена на технологиях глубокого обучения, таких как TensorFlow. speechify.com Она использует нейронные сети, смоделированные по динамике человеческого мозга, для преобразования речи в текст. speechify.com
Wav2letter. waksoft.susu.ru Библиотека полностью построена на свёрточных нейронных сетях (CNN) — от акустического моделирования до языкового моделирования. waksoft.susu.ru
Whisper. pypi.org Модель распознавания речи общего назначения, обученная на большом наборе разнородных аудиофайлов. pypi.org Может выполнять многоязычное распознавание речи, её перевод и определение языка. pypi.org
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.