Cloudera

hadoop有两个分支:0.20.x 和0.23.x。其中0.20.x是比较稳定的版本,0.23.x中新特性更多,但相对不稳定。

其中从0.20.x 分支发展出来的是:hadoop1.0,CDH3

从0.23.x 分支发展出来的是:hadoop-alpha,CDH4

下面具体说hadoop1.0、2.0 和CDH3、CDH4:

Apache Hadoop 2012年10月02日发布了 2.0 的第二个 Alpha 版本,版本号 2.0.2。该版本在 2000 个节点的集群上进行测试,目前开发团队的主要工作是处理无共享存储下的 HDFS HA ,还包括 YARN ResourceManager 以及调度方面的改进(YARN 是下一代的 MapReduce 实现)。

2011年12月27日顶级Apache开源项目Hadoop发布了1.0.0版。Hadoop是前雅虎开发者Doug Cutting开发的分布式计算平台,名字源于玩具象,至今已被数千家公司用于分析大容量数据。Hadoop 1.0.0主要是修正了bug,改进了性能和兼容性。它的上一个版本是0.20.205.0,新版的版本号原是 0.20.205.1,但开发者表示,Hadoop已经成熟几年前就做好了应用于生产的准备,但有些客户在采用前希望看到版本号是1.0,所以他们决定直接跳到了1.0。

cloudera CDH3基于hadoop稳定版0.20.2,并集成很多补丁(patch)

CDH4是基于Hadoop0.23的,但是它采用新的MapReduce,即MapReduce2.0,又叫Yarn。

CDH4的安装要求:64位的Red Hat Enterprise Linux5.7,CentOS5.7,Oracle Linux5.6,32位或64位的Red Hat Enterprise Linux6.2和CentOS6.2等