Некоторые задачи, которые можно решать на языке Python в сфере анализа данных:
- Описательная статистика. 1 Квантили, квартили, гистограммы, ядерные оценки плотности. 1
- Иерархический кластерный анализ. 1 Определение кластеров, расстояний между объектами и между кластерами. 1
- Проверка статистических гипотез. 1 Например, гипотезы согласия, однородности, независимости, гипотезы о параметрах распределения. 1
- A/B-тестирование. 1 Тест для пропорций. 1
- Линейный регрессионный анализ. 1 Построение модели, интерпретация оценок коэффициентов, множественный коэффициент детерминации. 1
- Прогнозирование. 12 Например, спрос на основе исторических данных, анализ трендов и паттернов. 2
- Работа с временными рядами. 2 Индексация по времени, агрегация и ресемплирование временных данных, анализ и визуализация временных рядов. 2
- Формирование отчётов и визуализация данных. 2 Совместно с Matplotlib и Seaborn Pandas используют для создания отчётов и визуализации многомерных данных в виде наглядных таблиц, графиков и диаграмм. 2