Для распознавания речи в мессенджерах могут использоваться различные технологии, например:
- Платформа Audiogram от MTS AI. 1 Позволяет расшифровывать аудиосообщения и записи конференций, озвучивать тексты, генерировать субтитры. 1
- Бот SaluteSpeech в Telegram. 2 Распознаёт речь и может преобразовать голосовое сообщение в текст на русском и английском языке. 2 Технология умеет расставлять знаки препинания, определять имена собственные, географические названия. 2
- Telegram-бот Voix. 4 Делает расшифровку голосовых сообщений и кружков, а также переводит длинные аудио и видео до 3 часов в текстовый файл. 4 Текстовая расшифровка происходит при помощи Python-библиотеки SpeechRecognition, использующей современные нейросети. 4