Несколько способов совместного использования Hadoop и R для анализа:
- RHadoop. 67 Это коллекция из трёх пакетов R: rmr, rhdfs и rhbase. 7 rmr предоставляет функциональность Hadoop MapReduce в R, rhdfs — управление файлами HDFS в R, а rhbase — управление базой данных HBase из R. 7
- ORCH. 67 Это коллекция пакетов R, которые предоставляют интерфейсы для работы с таблицами Hive, вычислительной инфраструктурой Apache Hadoop, локальной средой R и таблицами базы данных Oracle. 7 Кроме того, ORCH предоставляет методы предиктивной аналитики, которые можно применять к данным в файлах HDFS. 7
- RHIPE. 37 Это пакет R, который предоставляет API для использования Hadoop. 7 RHIPE (R and Hadoop Integrated Programming Environment) позволяет проводить анализ больших данных прямо в R. 9
- Hadoop Streaming. 68 Это утилита, которая позволяет создавать и запускать задания с любыми исполняемыми файлами в качестве картографа и/или редуктора. 78
Выбор способа зависит от конкретных требований и предпочтений пользователя.