- 大数据技术原理与应用(第2版)
- 林子雨编著
- 227字
- 2020-06-24 22:30:28
2.4 本章小结
Hadoop被视为事实上的大数据处理标准,本章介绍了Hadoop的发展历程,并阐述了Hadoop的高可靠性、高效性、高可扩展性、高容错性、成本低、运行在Linux平台上、支持多种编程语言等特性。
Hadoop目前已经在各个领域得到了广泛的应用,如雅虎、Facebook、百度、淘宝、网易等公司都建立了自己的Hadoop集群。
经过多年发展,Hadoop 生态系统已经变得非常成熟和完善,包括 Zookeeper、HDFS、MapReduce、HBase、Hive、Pig等子项目,其中HDFS和MapReduce是Hadoop的两大核心组件。
本章最后介绍了如何在 Linux 系统下完成 Hadoop 的安装和配置,该部分是后续章节实践环节的基础。