MySQL社区

标题: hadoop家族介绍 [打印本页]

作者: linda    时间: 2015-10-15 14:01
标题: hadoop家族介绍
本帖最后由 linda 于 2015-10-15 14:03 编辑

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据Google公司发表的MapReduce和Google档案系统的论文自行实作而成。

Hadoop框架透明地为应用提供可靠性和数据移动。它实现了名为MapReduce的编程范式:应用程序被分割成许多小部分,而每个部分都能在集群中的任意节点上执行或重新执行。此外,Hadoop还提供了分布式文件系统,用以存储所有计算节点的数据,这为整个集群带来了非常高的带宽。MapReduce和分布式文件系统的设计,使得整个框架能够自动处理节点故障。它使应用程序与成千上万的独立计算的电脑和PB级的数据。

常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

从2011年开始,中国进入大数据风起云涌的时代,以Hadoop为代表的家族软件,占据了大数据处理的广阔地盘。开源界及厂商,所有数据软件,无一不向Hadoop靠拢。Hadoop也从小众的高富帅领域,变成了大数据开发的标准。在Hadoop原有技术基础之上,出现了Hadoop家族产品,通过“大数据”概念不断创新,推出科技进步。


关系图如下:



各项目简介
参考资料

http://blog.fens.me/hadoop-family-roadmap/

http://wiki.apache.org/hadoop/

https://zh.wikipedia.org/wiki/Apache_Hadoop


转载自:http://www.ttlsa.com/bigdata/hadoop-family/



作者: zhangzhufu12    时间: 2016-8-11 16:56
先熟悉下~这东西在我的食谱上了




欢迎光临 MySQL社区 (http://www.mysqlpub.com/) Powered by Discuz! X3.2