Для решения проблемы неравной длины числовых данных в промышленных информационных системах используют нормализацию данных — метод предобработки числовых признаков, который позволяет привести их к общей шкале без потери информации о различии диапазонов. wiki.loginom.ru
Некоторые методы нормализации:
- Десятичное масштабирование. wiki.loginom.ru Нормализация производится путём перемещения десятичной точки на число разрядов, соответствующее порядку числа. wiki.loginom.ru
- Минимаксная нормализация. wiki.loginom.ru Позволяет привести исходный набор значений к произвольному диапазону. wiki.loginom.ru
- Нормализация средним (Z-нормализация). wiki.loginom.ru Диапазон определяется не с помощью максимальных и минимальных значений, а с помощью «типичных» — среднего и дисперсии. wiki.loginom.ru
- Отношение. wiki.loginom.ru Каждое значение исходных данных делится на некоторое, заданное пользователем число, или на значение статистического показателя, вычисленного по набору данных. wiki.loginom.ru
Также для обработки данных в промышленных информационных системах используют сжатие информации. masters.donntu.ru Применение сжатых форм представления данных позволяет повысить производительность системы, уменьшить объёмы архивов и объём информации, передаваемой по линиям связи. masters.donntu.ru