Основные принципы статистического анализа последовательностей символов включают:
- Постановка гипотезы. 1 Предполагается, что последовательность является случайной. 1
- Вычисление статистики исследуемой последовательности. 1 Тестирование проводится на битовом уровне. 1
- Вычисление P-значения. 14 Это вероятность того, что генератор произведёт последовательность не хуже гипотетического истинного. 4 Если P-значение равно 1, то последовательность идеально случайна, а если оно равно нулю, то последовательность полностью предсказуема. 4
- Сравнение P-значения с α. 1 Задаётся α в пределах [0,001; 0,01]. 1 Если P-value больше α, то тест пройден. 1
Некоторые методы статистического анализа последовательностей символов:
- Графические тесты. 1 К ним относятся, например: гистограмма распределения элементов последовательности (позволяет оценить равномерность распределения символов и определить частоту повторения каждого символа), распределение на плоскости (помогает определить зависимость между элементами последовательности), проверка серий (определяет равномерность отдельных символов в последовательности и равномерность распределения серий из k бит) и другие. 1
- Статистические тесты. 1 В отличие от графических тестов, статистические тесты выдают численную характеристику последовательности и позволяют однозначно сказать, пройден ли тест. 1 К ним относятся, например, проверка перестановок (проверяет равномерность распределения символов в исследуемой последовательности), проверка на монотонность (служит для определения равномерности исходя из анализа невозрастающих и неубывающих подпоследовательностей) и проверка корреляции (проверяет взаимонезависимость элементов последовательности). 1