hadoop

hadoop = common+hdfs+mapreduce+yarn

common

工具、rpc通信

分布式文件系统，一个文件分成多个128Mb的文件，存储在多个节点，为了保证分区容错性，存有备份，默认为3。主从架构。

用来记录各个文件的block的编号、各个block的位置、抽象目录树

处理读写请求

可以有多个namenode

用来备份namenode,当namenode宕机的时候，帮助namenode恢复

用来储存数据

如果一个datanode挂了，就再开一个datanode，然后吧挂了的数据通过备份推出来存进去，如果之前那个挂了的又活了，则选择一个节点删掉。副本过多将导致维护成本提高

资源调度、管理框架

分布式计算框架