Разница между действиями и преобразованиями в Apache Spark заключается в следующем:
- Преобразования (transformations) — это операции, которые создают новое распределённое множество данных (RDD) из существующего, но не выполняют никаких вычислений сразу. 3 Трансформации являются ленивыми и не выполняются до тех пор, пока не будет вызвано действие. 3 Примерами преобразований являются filter, flatMap, reduceByKey, groupByKey. 3
- Действия (actions) — это операции, которые запускают выполнение вычислений и возвращают результат. 3 Действия требуют выполнения всех предшествующих трансформаций. 3 Примерами действий являются count, collect, take, saveAsTextFile. 3
Таким образом, преобразования возвращают RDD, в то время как действия возвращают другие типы данных. 1