Предварительная обработка текстовых данных в задачах машинного обучения. diveintopython.org Например, извлечение номеров курсов из текста. pythonru.com
Очистка отсканированного текста в составе OCR-приложений. proglib.io
Для работы с регулярными выражениями в Python используется модуль re, который входит в стандартный дистрибутив языка. proglib.io
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.