Программы для преобразования речи в текст работают в несколько шагов: 1
- С помощью аналого-цифрового преобразователя компьютерная программа применяет к предоставленным данным лингвистические алгоритмы, чтобы отличать вибрации от звуковых сигналов. 1
- Соответствующие звуки фильтруются путём измерения звуковых волн. 1
- Звуки распределяются на сотые или тысячные доли секунды и сопоставляются с фонемами (измеримой единицей звука, позволяющей отличить одно слово от другого). 1
- Затем фонемы проходят через математическую модель для сравнения существующих данных с хорошо известными словами, предложениями и фразами. 1
- В результате получается текстовый или компьютерный аудиофайл. 1
Например, в сервисе Google Docs для транскрибации нужно открыть документ, нажать «Инструменты» и выбрать «Голосовой ввод». 3 На странице документа появится значок микрофона, где можно выбрать язык. 3 После этого остаётся нажать на значок и начать говорить — речь будет автоматически переводиться в текст и фиксироваться в документе. 3