Для агрегирования в модели исходных данных, в том числе безразмерных, имеющих различную размерность и качественных, не имеющих измерения, можно использовать следующие подходы:
- Для безразмерных данных. 1 В рамках любой статистической модели нужно предполагать, что измерения происходили примерно в одинаковых обстоятельствах с одинаковыми вопросами. 1 Если в результате измерений возникают наборы ответов разной длин, то либо используют все данные, собранные до добавления дополнительных вопросов, и после, но убирают из модели дополнительные вопросы, либо берут только те данные, которые они содержат. 1
- Для векторной записи качественных данных. 1 В первую очередь используют введение бинарных переменных, которые превращают столбец категориальных данных в набор столбцов, где 1 стоит в столбце той категории, которая была в изначальных данных, а остальные категорные столбцы заполнены нулями. 1
- Для разнородных параметров. 1 Можно использовать метод principal component analysis (PCA), который позволяет из разнородных параметров, в том числе не особо измеримых, сконструировать минимальный набор независимых переменных, позволяющих предсказать интересующие результаты. 1
Для агрегирования данных используют специализированные инструменты — агрегаторы данных. 3 В зависимости от характера данных и целей процесс агрегирования может включать группировку, усреднение, суммирование и подсчёт. 3