Некоторые способы распознавания речи в компьютерных системах:
- Диктовка. 1 Помогает набирать и редактировать текст голосом, а также записывать аудио. 1 Программы для диктовки есть в операционных системах, например, на macOS и в iOS. 1
- Расшифровка. 1 Анализирует аудио и видео, превращает речь в текст. 1 Тексты бывают со временными отметками, если это субтитры, или в виде сплошного текста, когда это расшифровка. 1 Примеры — Amazon Transcribe и Whisperer. 1
- Потоковое распознавание. 3 Предназначено для распознавания аудио в режиме реального времени. 3 Позволяет одновременно отправлять аудио на распознавание и получать результаты в рамках одного соединения. 3
- Виртуальные собеседники. 1 Распознают человеческую речь и отвечают на запросы текстовыми сообщениями или голосом, похожим на человеческий. 1 К таким помощникам относятся голосовые ассистенты, например, Alexa, Siri, Google Assistant, Cortana, Алиса. 1
Системы распознавания речи обычно состоят из трёх основных компонентов: словаря произношения, акустической модели и языковой модели, которые декодируют звуковой сигнал и дают подходящую расшифровку. 2