Для агрегирования в модели исходных данных, в том числе безразмерных, имеющих различную размерность и качественных, не имеющих измерения, можно использовать следующие подходы:
- Для безразмерных данных. yandex.ru В рамках любой статистической модели нужно предполагать, что измерения происходили примерно в одинаковых обстоятельствах с одинаковыми вопросами. yandex.ru Если в результате измерений возникают наборы ответов разной длин, то либо используют все данные, собранные до добавления дополнительных вопросов, и после, но убирают из модели дополнительные вопросы, либо берут только те данные, которые они содержат. yandex.ru
- Для векторной записи качественных данных. yandex.ru В первую очередь используют введение бинарных переменных, которые превращают столбец категориальных данных в набор столбцов, где 1 стоит в столбце той категории, которая была в изначальных данных, а остальные категорные столбцы заполнены нулями. yandex.ru
- Для разнородных параметров. yandex.ru Можно использовать метод principal component analysis (PCA), который позволяет из разнородных параметров, в том числе не особо измеримых, сконструировать минимальный набор независимых переменных, позволяющих предсказать интересующие результаты. yandex.ru
Для агрегирования данных используют специализированные инструменты — агрегаторы данных. www.astera.com В зависимости от характера данных и целей процесс агрегирования может включать группировку, усреднение, суммирование и подсчёт. www.astera.com