Некоторые современные методы обработки данных для заполнения пропущенных значений:
NoNA. habr.com Алгоритм на основе методов машинного обучения с прогнозированием по каждому столбцу с пропусками. habr.com
KNN. habr.com Заполнение пропущенных значений с использованием k-ближайших соседей. habr.com Отсутствующие значения каждой выборки заполняются с использованием среднего значения ближайших соседей, найденных в обучающем наборе. habr.com
MICE. habr.com Использование класса IterativeImputer sklearn, который моделирует каждую функцию с отсутствующими значениями как функцию других функций и использует эту оценку для заполнения. habr.com
Присвоение пропускам специальной категории. education.yandex.ru Вместо того чтобы оставлять пустое значение, в него записывают специальное число или строку. education.yandex.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.