Некоторые технологии машинного обучения, которые помогают в обработке голосовых записей:
Apache Kafka. bigdataschool.ru Распределённая платформа потоковой передачи событий, оптимизированная для приёма и обработки данных в режиме реального времени. bigdataschool.ru В случае масштабной ML-системы распознавания речи данные могут непрерывно генерироваться тысячами источников, которые отправляют записи почти одновременно. bigdataschool.ru Kafka может обрабатывать миллионы сообщений в секунду, что достаточно для обработки аудиозаписей. bigdataschool.ru
Apache Spark. bigdataschool.ru Используется в качестве вычислительного движка распределённой обработки данных, чтобы обрабатывать и очищать большие объёмы аудио, а также сохранять их в корзине облачного объектного хранилища S3. bigdataschool.ru
Метод скрытых моделей Маркова (СММ). tproger.ru Это статистические модели, опирающиеся на скрытые или не наблюдаемые состояния. tproger.ru СММ создаёт граф из связанных фонем, а иногда даже последовательностей слов, который после отображает в гистограмме вероятных результатов. tproger.ru
Искусственные нейронные сети. eduherald.ru Они получают на вход фрагменты записей человеческой речи длиной в несколько миллисекунд и определяют, какой звук был произнесён. eduherald.ru В подготовленных данных нейронной сети проще находить шаблоны и закономерности, чем в сырых записях человеческой речи. eduherald.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.