Наука о данных и традиционный статистический анализ данных связаны тем, что обе области используют данные для извлечения ценной информации. 1
Наука о данных включает в себя ряд принципов, методов постановки задач, алгоритмов и процессов для выявления скрытых полезных закономерностей в больших наборах данных. 4 Для этого используются языки программирования, алгоритмы машинного обучения и информационные системы класса Business Intelligence. 5
Традиционный статистический анализ использует математические методы, такие как проверка гипотез и вероятности, а также теоремы (например, теорема Чебышева, теорема Бернулли и теорема Ляпунова). 6 Статистический анализ более последователен и направлен на понимание одного конкретного аспекта выборки за раз (например, среднего, стандартного отклонения или доверительного интервала). 6
Таким образом, наука о данных заимствует некоторые статистические методы и модели, но при этом имеет свой собственный подход к анализу данных. 4