Примеры ответов Нейро на вопросы из разных сфер
Главная / Технологии / Как устроена система распознавания голоса в чат-боте Тинькофф банка?
Вопрос для Нейро
19 февраля
Как устроена система распознавания голоса в чат-боте Тинькофф банка?
Нейро
На основе 5 источников

Система распознавания голоса в «Тинькофф банке» основана на технологии VoiceKit. 15 Она позволяет переводить аудио в текст с качеством до 96%. 5

Процесс расшифровки происходит в несколько этапов: 1

  1. Нейросеть получает на входе звук в каком-либо виде, например, спектрограмму или wave-форму. 1 На выходе нейросеть выдаёт вероятности произнесения отдельных букв в каждый момент времени. 1
  2. Подключается языковая модель. 1 Она учитывает тематику, если участвовала в обучении, или использует общие данные. 1 Модель определяет, с какой вероятностью можно встретить в данном языке определённую последовательность звуков и сложенных из них слов. 1
  3. Нейросеть с языковой моделью соединяет алгоритм декодер, который уже выдаёт предложения. 1

В основе разработки «Тинькофф банка» лежит метод, основанный на извлечении i-векторов (слепков голоса) и их сравнении с помощью вероятностного линейного дискриминантного анализа PLDA. 2

Ответ сформирован YandexGPT на основе текстов выбранных сайтов. В нём могут быть неточности.
Примеры полезных ответов Нейро на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Нейро.
Задать новый вопрос
Задайте вопрос...
…и сразу получите ответ в Поиске с Нейро
Thu Mar 20 2025 18:24:43 GMT+0300 (Moscow Standard Time)