Функция распознавания голоса на iPhone работает с использованием фреймворка Speech. 1 Он предоставляет API для распознавания и синтеза речи. 1 С его помощью разработчики могут создавать приложения, способные распознавать и обрабатывать голосовые команды пользователей. 1
Основным компонентом работы с функциями распознавания голоса в iOS является класс SFSpeechRecognizer, который представляет собой объект, отвечающий за распознавание речи. 1 Вместе с ним используется класс SFSpeechAudioBufferRecognitionRequest, который представляет собой объект запроса на распознавание. 1 Для воспроизведения голоса используется класс AVAudioEngine, который отвечает за управление записью и воспроизведением аудио. 1
Также в iOS есть функция «Персональный голос» (Personal Voice). 2 Она использует передовые алгоритмы машинного обучения для высокоточного распознавания речи в реальном времени и преобразования текста в речь. 2 Во время настройки функция анализирует и собирает образцы голоса, чтобы определить конкретные речевые модели пользователя. 2 Затем она анализирует речь в режиме реального времени и преобразует её в текст, который можно просматривать на экране. 2