Разница между описательной и инференциальной статистикой в машинном обучении заключается в целях и методах анализа данных. 46
Описательная статистика помогает суммировать и описывать основные характеристики данных. 34 Её задача — дать общее представление о распределении данных и выявить основные тенденции. 4 К методам описательной статистики относятся, например:
- Среднее значение. 34 Сумма всех значений, разделённая на их количество. 3
- Медиана. 34 Среднее значение в упорядоченном наборе данных. 3
- Мода. 34 Наиболее часто встречающееся значение. 3
- Дисперсия и стандартное отклонение. 4 Показывают, насколько данные разбросаны вокруг среднего значения. 4
- Визуализация данных. 4 Например, гистограммы и коробчатые диаграммы, которые помогают наглядно представить распределение данных и выявить аномалии или выбросы. 4
Инференциальная статистика используется для вывода заключений о популяции на основе выборки данных. 46 Её методы помогают оценить значимость результатов и сделать прогнозы на основе имеющихся данных. 4 К ним относятся, например:
- Тестирование гипотез. 4 Позволяет проверять предположения о данных. 4
- Доверительные интервалы. 4 Дают представление о диапазоне значений, в котором с определённой вероятностью находится истинное значение параметра. 4
- Регрессионный анализ. 4 Помогает моделировать зависимости между переменными и предсказывать значения зависимой переменной на основе значений независимых переменных. 4
Таким образом, описательная статистика предоставляет начальное понимание характеристик набора данных, а инференциальная статистика помогает делать более широкие выводы и делать прогнозы на основе этих данных. 6