Технология глубокого обучения для преобразования голоса в реальном времени работает следующим образом: 4
Например, в платформе SaluteSpeech пользователи загружают текст онлайн, выбирают понравившегося диктора из обширной библиотеки и нажимают кнопку «Синтезировать». 4 Обученная нейросеть анализирует текстовую информацию и переводит её в голосовые единицы, а затем алгоритм объединяет их в единую звуковую дорожку. 4
Для обучения глубоких нейронных сетей используются большие объёмы записанной речи и, в случае системы преобразования текста в речь, связанных меток и/или входного текста. 2