Преобразование речи в текст на плате Arduino работает с помощью модуля распознавания речи, который позволяет создавать проекты с голосовым управлением. 1
Процесс включает несколько этапов: 3
- Нормализация текста. 3 Символы, числа и сокращения преобразуются в слова, которые могут быть прочитаны машиной. 3 Например, знак «?» превращается в «вопросительный знак». 3
- Преобразование нормализованного текста в фонемы. 3 Фонемы — это небольшие части произносимых слов, то есть звуки, которые составляют предложения. 3 Этот этап необходим, чтобы машина могла говорить слова, как человек. 3
- Синтез фонемов в звучащий голос. 3 Этот шаг может быть достигнут разными методами, например, путём записи человеческого голоса для разных слов или фраз, генерации базовых частот звука и их объединения в фонемы или копирования механизма речи человека. 3
Для работы модуля распознавания речи необходимо его обучить — записать через микрофон собственные голосовые команды в энергонезависимое хранилище. 1
Существуют различные библиотеки, которые обеспечивают интерфейс для распознавания речи на Arduino, например, uSpeech. 2