Возможно, имелся в виду автоматический перевод видео в «Яндекс Браузере». ya.ru yandex.ru В основе технологии лежат нейросети, которые работают почти как синхронные переводчики. ya.ru yandex.ru
Процесс перевода состоит из нескольких этапов: ya.ru
- Распознавание речи. ya.ru Голос превращается в текст. ya.ru
- Обработка текста. ya.ru Нейронная сеть «причёсывает» получившийся текст, а результат отправляется на перевод. ya.ru
- Озвучивание и совмещение с видеорядом. ya.ru Нейронная сеть выполняет речевую компрессию: сокращает паузы между словами и, если необходимо, немного ускоряет темп речи. ya.ru
В озвучке видео принимают участие сразу шесть нейросетей: www.iphones.ru
- Первая определяет язык говорящего. www.iphones.ru Если он говорит на поддерживаемом языке, то браузер предложит перевести содержимое на русский. www.iphones.ru
- Вторая переводит речь в текст. www.iphones.ru В полученной модели создаётся аудиодорожка, из которой нейросеть удаляет лишние звуки и слова-паразиты. www.iphones.ru
- Третья нормализует текст и расставляет знаки препинания. www.iphones.ru Нейросети передаётся определённый выделенный контекст, чтобы она могла лучше понять, о чём идёт речь в ролике. www.iphones.ru
- Четвёртая определяет количество спикеров, их пол и применяемые местоимения. www.iphones.ru Вычисляется тип голоса (мужской или женский) по частоте звучания. www.iphones.ru
- Пятая занимается переводом текста на русский язык. www.iphones.ru
- Шестая синтезирует речь и синхронизирует её с роликом. www.iphones.ru Она делает паузы одновременно с говорящим человеком, а также соблюдает его темп речи, иногда ускоряясь или замедляясь. www.iphones.ru