一般认为Hadoop分成三个部分 HDFS, MapReduce, HBase
1 HDFS是它的底层
2 MapReduce 是一个操作层 用于离线处理,或者叫分时处理,或者叫分析型处理
3 HBase 也是一个扩展层 用于在线处理,或者叫实时处理,或者叫事务型处理
Spark是和MapReduce差不多的东西,可以代替MapReduce。
Hive是和HBase差不多的东西,可以代替HBase。
Spark不一定基于HDFS,Spark也可以用于Cassandra等。
还有一个Flink是干什么的?什么是流处理?
--
FROM 163.125.131.*