Нейросеть SaluteSpeech от «Сбера» предоставляет следующие возможности для расшифровки аудио: aidive.org
- Распознавание речи в реальном времени. aidive.org Сервис поддерживает русский, английский и казахский языки. aidive.org
- Анализ эмоций. aidive.org Есть возможность определить позитив, нейтрал или негатив в речи. aidive.org
- Фильтрация фоновых шумов и обсценной лексики. aidive.org
- Настройка интонаций с помощью SSML-разметки. aidive.org
- Генерация текстов через GigaChat API. aidive.org Можно загрузить короткие тезисы, и нейросеть подготовит текст для озвучивания. vc.ru
- Разделение спикеров в многоголосых записях. aidive.org
SaluteSpeech доступен через десктопное приложение для Windows и MacOS, а также через Telegram-бот и SaluteSpeech API. aidive.org
Некоторые форматы аудио, которые поддерживает сервис: MP3, WAV, FLAC, OggOpus. aidive.org