Вопросы к Поиску с Алисой
Некоторые преимущества использования партицирования в Hive:
Партиционирование наиболее эффективно, когда количество строк в каждом разделе примерно одинаково. bigdataschool.ru При сильном перекосе разделов у одних рабочих узлов будет гораздо больше данных для обработки, чем у других, что приведёт к неэффективному использованию ресурсов кластера. bigdataschool.ru