Правило Стерджеса — эмпирическое правило определения оптимального количества интервалов, на которые разбивается наблюдаемый диапазон изменения случайной величины при построении гистограммы плотности её распределения. 5
Преимущества:
- правило широко используется в программном обеспечении для анализа данных, в том числе в Python и R; 2
- правило носит рекомендательный, но не обязательный характер. 4 Нередко в условии задачи прямо указано, на какое количество интервалов нужно проводить разбиение, и тогда следует придерживаться именно этого указания. 4
Недостатки:
- правило Стерджеса не основано на какой-либо процедуре оптимизации; 2
- некоторые исследователи отмечают, что правило Стерджеса в целом создаёт сглаженные гистограммы, то есть с недостаточным количеством ячеек. 2
Также есть мнение, что слишком малое количество интервалов скроет детали распределения, а слишком большое — создаст «шум» и затруднит интерпретацию данных. 3
Таким образом, правило Стерджеса имеет свои особенности и может иметь разные мнения о его применении в анализе данных.