Механизм сохранения голоса в голосовых помощниках работает следующим образом: 2
- Оцифровка звука. 2 Для этого используются аналого-цифровые преобразователи (АЦП). 2 На выходе АЦП звук преобразовывается в цифровой массив. 2
- Фильтрация. 2 Заключается в отсеивании всех частот, не относящихся к человеческому голосу. 2 Это позволяет отсеять 97,5% ненужной информации и ускорить дальнейшую обработку сигнала. 2
- Нормализация. 2 Нужна, чтобы устранить влияние громкости звука на результат. 2 Слабый сигнал усиливается, а сильный, наоборот, ослабляется. 2 Итоговый сигнал имеет примерно одинаковую амплитуду для всех записей звука — как громких, так и тихих. 2
- Распознавание методами математического анализа. 2 Технологии внутри помощника делят слова на звуковые фрагменты — фонемы. 4 Затем, для наибольшей точности, фонемы разбивают на фреймы. 4 После математических преобразований получаются коэффициенты, описывающие частотные характеристики входящего звукового сигнала. 4 Только после такой разбивки ассистент может «предположить», что именно сказал пользователь. 4
Чтобы речь звучала естественно, для разработки голоса ассистента приглашают профессиональных дикторов или актёров, которые наговаривают тысячи часов речи. 4