Технология распознавания речи (STT) появилась ещё в 1950-х годах, но активное развитие началось лишь в 1970-х. blog.skillfactory.ru
Некоторые этапы развития:
- 1970-е: в США разработали систему распознавания речи под названием «Гарпия». rekk.io Она позволяла распознавать речевые команды для управления компьютером, а также использовалась для создания систем автоматического диктовки и транскрибирования речи. rekk.io
- 1980-е: появились первые игрушки с чипом для распознавания речи, например, Talking Teddy Ruxpin, Furby, Speak & Spell. rekk.io
- 1990-е: произошёл рывок в развитии технологии распознавания речи. rekk.io Одним из первых программных обеспечений была Dragon Dictate, разработанная компанией Dragon Systems в 1990 году. rekk.io Программа позволяла диктовать текст, который затем переводился в текстовый файл. rekk.io
- 2000-е: развитие технологий распознавания речи вступило в период затишья, который продолжался более десятилетия. rekk.io Системы распознавания речи были ограничены своей вычислительной мощностью и памятью, и им всё ещё приходилось «угадывать», какие слова произносятся на основе фонем. rekk.io
- С конца 2010-х: старые алгоритмы распознавания речи стали вытесняться end-to-end-моделями. blog.skillfactory.ru Процесс основан на двух моделях, но теперь они работают эффективнее благодаря машинному обучению. blog.skillfactory.ru
В начале 2000-х благодаря прогрессу в области машинного обучения IT-специалисты начали создавать программы, которые точно преобразовывали речь в текст. blog.skillfactory.ru