Метод EDA (разведочный анализ данных) при исследовании социальных систем заключается в анализе основных свойств данных, нахождении в них общих закономерностей, распределений и аномалий, построении начальных моделей. 4
Некоторые цели EDA:
- Понимание структуры и характеристик набора данных. 3 Это включает в себя обзор размера набора данных, типов переменных, наличия пропущенных значений, дубликатов и других важных аспектов. 3
- Выявление аномалий и выбросов. 3 Значения, отклоняющиеся от общего паттерна, могут возникать из-за ошибок ввода, случайных событий или даже указывать на систематические проблемы в сборе данных. 3 Определение и устранение таких аномалий помогает гарантировать надёжность результатов. 3
- Идентификация связей и корреляций между переменными. 3 Используя статистические меры, EDA позволяет идентифицировать взаимосвязи между переменными, что помогает понять, как одни факторы влияют на другие. 3
- Подготовка данных для дальнейших этапов анализа. 3 На этом этапе данные чистят от шума, заполняют пропущенные значения, проводят масштабирование или преобразования переменных. 3
Для EDA используют инструменты визуализации, например точечные диаграммы, гистограммы, прямоугольные графики и тепловые карты. 2