Распознавание голосовых меток. frolov-lib.ru Фрагменты речи распознаются по заранее записанному образцу. frolov-lib.ru Такой подход используют в простых системах, которые предназначены для исполнения записанных речевых команд. frolov-lib.ru
Распознавание лексических элементов. frolov-lib.ru Из потока речи выделяют отдельные лексические элементы — фонемы и аллофоны, которые затем объединяются в слоги и морфемы. frolov-lib.ru
Использование машинного обучения. blog.skillfactory.ru Процесс распознавания речи основан на двух моделях: акустической и языковой. blog.skillfactory.ru Акустическая модель преобразует речь сразу в буквы, а языковая анализирует контекст и выбирает наиболее вероятное слово. blog.skillfactory.ru
Применение нейросетевых систем. developers.sber.ru На сигнальном уровне такие системы могут распознавать и синтезировать устную и письменную речь. developers.sber.ru
Использование платформы SaluteSpeech от Sber. developers.sber.ru При распознавании речи искусственный интеллект может определять эмоции говорящего и знаки препинания, отфильтровывать шумы. developers.sber.ru
Некоторые системы распознавания речи, которые используют современные подходы:
LAS (Listen, Attend and Spell, другое название — Attention-based Encoder-Decoder). blog.skillfactory.ru Имеет встроенную языковую модель, которая с помощью механизма внимания может учитывать всю входящую последовательность для каждого символа. blog.skillfactory.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.