Некоторые современные методы машинного обучения, которые используются для транскрибации аудио в текст:
DeepSpeech. exolve.ru Библиотека для транскрибации, в основе которой лежит рекуррентная нейронная сеть. exolve.ru Движок библиотеки принимает звуковой поток как входные данные и преобразует его в последовательность символов в алфавите указанного языка. exolve.ru
Kaldi. exolve.ru Мощная библиотека для автоматического распознавания речи, в которой для распознавания речи применяются скрытые марковские модели и технологии глубоких нейронных сетей. exolve.ru
Whisper от OpenAI. tenchat.ru Универсальная модель распознавания речи, обученная на большом наборе данных с разнообразным аудиоконтентом. tenchat.ru Она является многозадачной моделью, которая может выполнять многоязычное распознавание речи, перевод речи и определение языка. tenchat.ru
Yandex SpeechKit API. tenchat.ru Облачное решение от компании Яндекс, которое предоставляет высококачественные инструменты для обработки речи. tenchat.ru SpeechKit включает в себя технологии распознавания речи, синтеза речи, а также функции для обработки аудио с помощью машинного обучения и нейросетевых алгоритмов. tenchat.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.