Система автоматического распознавания голосовых команд (ASR) в современных колл-центрах работает в несколько этапов: 2
- Анализ сигнала. 2 Система получает голосовой сигнал, записывает и посылает на сервер. 2 Сервер очищает сигнал от шумов и помех, затем делит запись на фонемы — фрагменты длиной до 25 миллисекунд. 2 Каждый фрагмент сервер пропускает через акустическую модель, которая определяет, какие именно звуки произнесены. 2
- Расшифровка аудио. 2 Речевые фрагменты записи сравнивают с эталонными произношениями слогов и слов из акустической модели. 2 Система использует машинное обучение, чтобы подобрать фонетические варианты произнесённых слов и определить их контекст. 2
- Преобразование речи в текст. 2 С помощью языковой модели алгоритм определяет порядок слов и подбирает нераспознанные слова по контексту. 2 Полученная информация поступает в декодер, который объединяет данные от акустической и языковой моделей и преобразует их в текст. 2
В колл-центрах ASR-системы позволяют автоматизировать стандартные задачи. 4 Например, клиент может произнести запрос на проверку баланса, а система с помощью ASR распознает запрос, найдёт нужную информацию в базе данных и ответит, озвучив результат. 4
Также ASR-системы используют для актуализации клиентской базы и ведения статистики. 1 Любое обращение можно перевести в текст, чтобы добавить к карточке клиента в базе. 1 При следующих обращениях сотрудники будут знать, с какими вопросами обращался клиент ранее, каким был результат разговора. 1