Hadoop生态系统组件

  • 来源:
  • 更新日期:2018-05-04

摘要:Hadoop生态系统的组件包括: HDFS:分布式文件系统 YARN:资源管理和调度 MapReduce:并行计算框架 HBase:可扩展的分布式NoSQL数据库 Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduce Impala:新型查询系统,提供交互式的SQL查询 ZooKeeper:分布式应用程序协调服务

Hadoop生态系统的组件包括:

HDFS:分布式文件系统 YARN:资源管理和调度 MapReduce:并行计算框架 HBase:可扩展的分布式NoSQL数据库 Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduce Impala:新型查询系统,提供交互式的SQL查询 ZooKeeper:分布式应用程序协调服务 Spark:分布式内存计算引擎,支持ETL、机器学习、Streaming和图计算 Flume:分布式日志收集、聚合系统

002UASMrzy7605pjKJv15&690.jpg
Pig:大规模数据分析平台
PrestoDB:大数据的分布式 SQL 查询引擎 Phoenix:是Hbase的 SQL 驱动
Drill :加快Hadoop数据查询的工具 Hue 是运营和开发Hadoop应用的图形化用户界面,功能及其强大

 

以服务体系划分:

计算云:虚拟主机/弹性计算/负载均衡QLB

存储云:GlusterFS/Swift/FastDFS/生产存储/云盘

服务云-数据库:MySQL/Couchbase/Redis/MongoDB

服务云-分布式中间件:RPC/MQ/ZooKeeper

服务云-Hadoop:HDFS/MR/Hive/HBase

服务云-实时计算:Spark/Storm/实时日志收集分析