Некоторые причины, по которым машинный перевод с голоса может быть менее точным, чем с текстового изображения:
- Различия в модальности речи и текста. 3 Для аудио не характерен чёткий порядок слов, как в текстах. 3
- Влияние фоновых шумов, акустики и количества говорящих одновременно. 4 Если звук приглушённый и слабый, с фоновым шумом, частота ошибок может достигать 40–50%. 4
- Особенности регионального произношения и различия в диалектах. 4 Ни одна программа или приложение не настолько совершенны, чтобы понимать эти нюансы. 4
- Невозможность распознать контекст. 2 В отличие от живого переводчика, машинный не способен распознать контекст. 2
- Невозможность перевести все части исходного предложения. 1 Это может привести к неожиданным вариантам перевода. 1
- Невозможность распознать омонимы и фразеологизмы. 2 Машинные переводчики часто не видят разницы между омонимами, а перевод фразеологизмов часто дословный. 2
Качество распознавания речи зависит от качества данных для обучения нейросети. 5 Чем больше записей голоса обработает искусственный интеллект — с разными интонациями и эмоциями, дикторами, смысловым наполнением, — тем качественнее будет распознавание голоса в текст. 5