Технология распознавания речи в виртуальных помощниках развивалась следующим образом:
- 1950-е годы: первая система Audrey была разработана Bell Laboratories в 1952 году и могла распознавать только цифры. www.androidauthority.com sonix.ai Устройство заставляло говорящего делать паузы на 350 миллисекунд между словами и понимало только цифры от 1 до 9. www.androidauthority.com
- 1962 год: корпорация IBM представила технологию распознавания голоса — Shoebox. vc.ru Система могла понимать 16 слов: цифры и команды для операций с числами, такие как «плюс», «минус» и «равно». vc.ru
- 1970-е годы: Министерство обороны США финансировало исследования технологии распознавания речи. www.androidauthority.com Одним из результатов этих усилий стала Harpy, система понимания речи, разработанная Университетом Карнеги-Меллон, которая могла понимать около 1000 слов. www.androidauthority.com
- 1985 год: компания Kurzweil Applied Intelligence выпустила первую программу преобразования речи в текст, которая понимала 1000 слов. www.androidauthority.com Два года спустя выпустили обновлённую версию, в которой объём словарного запаса увеличился до 20 000 слов. www.androidauthority.com
- 1990-е годы: с распространением интернета и персональных компьютеров технологии распознавания голоса начали развивать как программное обеспечение. vc.ru В 1990 году появилась Dragon Dictate, которая работала на операционной системе DOS и распознавала 30 тысяч слов естественного языка. vc.ru
- 2000-е годы: технологию развивали с помощью машинного обучения. vc.ru В 2008 году Google создал Voice Search — программу голосового управления для iOS. vc.ru
- 2010-е годы: Amazon и Apple запустили первое в мире речевое программное обеспечение на основе искусственного интеллекта — Alexa и Siri. ru.shaip.com В начале этого десятилетия произошёл резкий рост возможностей технологии распознавания речи благодаря появлению глубокого обучения, рекуррентных нейронных сетей (RNN) и долговременной памяти (LSTM). sonix.ai
Современные виртуальные помощники используют искусственный интеллект (ИИ) и машинное обучение для дальнейшего совершенствования процесса распознавания речи. sonix.ai Они распознают речь и понимают грамматику, синтаксис, структуру и состав аудио- и голосовых сигналов, эффективно обрабатывая человеческую речь. sonix.ai