Функция value_counts() из библиотеки Pandas отличается от других методов подсчёта уникальных значений тем, что она предоставляет не только уникальные значения, но и частоту их появления. 1
Некоторые другие методы подсчёта уникальных значений и их особенности:
- unique(). 1 Возвращает числовой массив уникальных значений с сохранением порядка их появления. 1
- drop_duplicates(). 1 Возвращает ряд с уникальными значениями, сохраняя исходный индекс. 1
- nunique(). 1 Возвращает количество уникальных значений в столбце или фрейме данных. 1
- set(). 1 Преобразует значения столбцов в набор, автоматически удаляя дубликаты. 1 При этом не сохраняет порядок уникальных значений. 1
- groupby(). 23 Группирует данные какого-либо столбца по одинаковым значениям. 2 Отличие в том, что можно не просто вывести количество уникальных элементов в одном столбце, но и найти для каждой группы сумму, среднее значение или медиану по любым другим столбцам. 2