Некоторые современные технологии, которые помогают распознавать речь в телефонных приложениях:
Lingvanex On-premise Speech Recognition. workspace.ru Технология полностью независима от интернета: аудиофайлы и результаты обработки остаются внутри корпоративной сети. workspace.ru Доступно распознавание речи на 91 языке, в том числе с учётом акцентов, неформальной речи и шумов. workspace.ru
Google Speech-to-Text. workspace.ru Система не просто распознаёт слова, а понимает интонации. workspace.ru Поддерживает более 100 языков и диалектов, обеспечивает мгновенную транскрибацию в реальном времени. workspace.ru
Whisper от OpenAI. workspace.ru dzen.ru Технология подходит для многозадачности: перевода, транскрибации, создания субтитров, распознавания шумной речи. workspace.ru Можно развернуть Whisper на собственных серверах или даже на ноутбуке. workspace.ru
Microsoft Azure Speech. workspace.ru Речь распознаётся в реальном времени, поддерживается множество языков и акцентов, включая региональные диалекты. workspace.ru Есть модуль «Custom Speech», который обучается под лексику конкретного бизнеса. workspace.ru
Speechmatics. workspace.ru Технология использует самообучающиеся модели, которые подстраиваются под говорящего. workspace.ru Поддерживает более 30 языков и особенно хорошо справляется с неформальной речью. workspace.ru
Otter.ai. workspace.ru В 2025 году синхронизируется с Zoom, Google Meet и Teams, расшифровывает, анализирует и делает сводки. workspace.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.