Возможно, имелись в виду различия между Hadoop 3.x и предыдущими версиями, в том числе Hadoop 2.x. 34 Некоторые из них:
- Требования к Java. 4 Для работы Hadoop 2.x нужна версия 7, а для Hadoop 3.x — 8. 4 Большинство библиотек Hadoop 3.x поддерживает Java 8. 4
- Защита от сбоев. 4 В Hadoop 2.x для этого используется репликация. 45 В Hadoop 3.x — техника Erasure Coding. 4
- Балансировка данных. 5 В Hadoop 2.x для этого используется балансировщик HDFS, а в Hadoop 3.x — внутриузловой балансировщик Intra-data node. 5
- Поддержка нескольких резервных узлов. 4 В Hadoop 2.x можно настроить один активный NameNode и один резервный. 4 В Hadoop 3.x можно настроить несколько резервных NameNode. 4
- Поддержка файловых систем. 5 Hadoop 2.x совместим с HDFS, FTP, Amazon S3 и Windows Azure Storage Blobs (WASB). 5 Hadoop 3.x поддерживает все перечисленные файловые системы, а также файловую систему Microsoft Azure Data Lake. 5
- Масштабируемость. 5 Hadoop 2.x позволяет масштабировать кластер до 10 000 узлов, а Hadoop 3.x — до более чем 10 000 узлов. 5