Чтобы улучшить распознавание речи Алисой с разными акцентами и дефектами, нейросеть нужно дообучить на большом количестве аудиофрагментов с текстовой расшифровкой. 1
Для этого Яндекс совместно с некоммерческими организациями, которые помогают людям с особенностями здоровья, подготовил датасет из аудиозаписей людей с различными речевыми нарушениями. 14
В проекте участвовали более 300 человек, которые записали более 855 тысяч фрагментов речи. 45 Это позволило улучшить точность распознавания проблемной речи Алисой на 20%. 45
В результате Алиса стала лучше понимать речь при нарушениях звукопроизношения, заикании, нарушениях слоговой структуры, а также при особенностях интонации, темпа и ритма. 1