Некоторые нейросетевые технологии для создания новых голосов:
- Tacotron. sky.pro Архитектура, разработанная компанией Google, которая преобразует текст в спектрограмму, а затем использует алгоритм WaveNet для синтеза аудиосигнала. sky.pro
- WaveNet. sky.pro Глубокая нейросеть, разработанная компанией DeepMind, которая генерирует аудиосигнал на основе последовательности акустических признаков. sky.pro
- FastSpeech. sky.pro Модель, разработанная для ускорения процесса генерации речи. sky.pro Она использует предварительно обученные трансформеры для предсказания акустических признаков и синтеза аудиосигнала. sky.pro
Также для создания новых голосов можно использовать, например, следующие сервисы:
- NaturalReaders. pikabu.ru Онлайн-инструмент, который предлагает клонирование голоса и преобразование текста в речь. pikabu.ru С его помощью можно создать уникальный голосовой клон, который будет звучать как собственный голос или голос выбранного человека. pikabu.ru
- ElevenLabs. vc.ru pikabu.ru Платформа специализируется на транскрибировании текста в речь. pikabu.ru Алгоритмы ElevenLabs анализируют текст и создают реалистичную речь с правильной интонацией, ударениями и паузами. pikabu.ru
- Resemble AI. dzen.ru Платформа объединяет технологии создания и защиты аудиоконтента в одну систему. dzen.ru Для анализа и воспроизведения уникальных характеристик голоса (тембра, интонации и манеры речи) система использует искусственный интеллект. dzen.ru