Некоторые основные принципы теории вероятности при работе с большими выборками данных:
- Закон больших чисел. 13 Утверждает, что по мере увеличения числа испытаний среднее значение результатов будет стремиться к математическому ожиданию случайной величины. 1 Это объясняет, почему средние значения выборок часто близки к средним значениям генеральной совокупности. 1
- Центральная предельная теорема. 1 Утверждает, что сумма большого числа независимых случайных величин с одинаковым распределением стремится к нормальному распределению, независимо от формы исходного распределения. 1
- Закон распределения Пуассона. 1 Описывает вероятность того, что определённое число событий произойдёт в фиксированный интервал времени или пространства. 1 Этот закон часто используется для моделирования редких событий. 1
- Принцип повторности. 2 Выражается в использовании многократного эксперимента. 2 Главное правило — повторения должны быть независимы друг от друга. 2
- Рандомизация. 2 Подразумевает выбор элементов исследований случайным образом. 2 При этом каждый объект должен иметь абсолютно те же самые шансы быть выбранным, что и все прочие объекты. 2
- Репрезентативность выборки. 4 Выборка должна быть пропорциональна как подгруппам, так и всей совокупности, и не исключает каких-либо отдельных групп. 4
Эти принципы помогают понять и интерпретировать данные, делать прогнозы и принимать обоснованные решения. 1