Да, существует несколько доступных и открытых технологий speech to text для русской речи. habr.com
Некоторые из них:
- Coqui.ai/TTS. habr.com Проект включает множество уже обученных моделей для популярных языков, а также обширный репозиторий кода и документации для самостоятельного обучения. habr.com В пределах предобученных моделей русский язык генерируется в мультиязычных моделях, таких как xttsv1, xttsv2, bark. habr.com
- Silero. habr.com Русскоязычный проект, который активно развивается и поддерживается разработчиками. habr.com Проект открытый и бесплатный, в общем доступе расположен репозиторий с предобученными моделями. habr.com
- Mimic3. habr.com Решение от MicrosoftAI на основе VITS. habr.com Есть модель для русского языка, поддерживает 1 женский и 2 мужских голоса. habr.com
Также для преобразования русской речи в текст можно использовать, например, такие сервисы, как Speechlogger, Speechpad, SpeechTexter. vc.ru {8-host}