摘要: 一·大数据概述 随着信息技术发展的巨大变革,企业和学术机构纷纷加大技术、资金和人员投入,加强对大数据关键技术的研发与运用。 大数据的发展历程总体上划
一·大数据概述
随着信息技术发展的巨大变革,企业和学术机构纷纷加大技术、资金和人员投入,加强对大数据关键技术的研发与运用。
大数据的发展历程总体上划分为三个重要阶段:萌芽期、成熟期和大规模应用期。
二.大数据概念
大数据的4个特点:数据量大、数据类型繁多、处理速度快和价值密度低。
三.大数据与云计算、物联网的关系
大数据为云计算机提供了用武之地,云计算为大数据提供了技术基础。
物联网是大数据的重要来源,大数据技术为物联网数据分析提供支撑。
云计算为物联网提供海量数据存储能力,物联网为云计算技术提供了广阔的应用空间。
四.大数据处理架构Hadoop
1.Hadoop简介
Hadoop是Apache旗下的一个开源分布式计算平台。是基于Java语言开发的,具有很好的跨平台性,并可以部署在一般的计算机集群中。Hadoop的核心是分布式文件系统HDFS和MapReduce。HDFS具有较高的读写速度、很好的容错性和可伸缩性,很好的保证了数据的安全性。
其中YARN是资源调动,MapReduce是计算框架。
2.Hadoop的特性
高可靠性、高效性、高扩展性、容错性、成本低、运行在Linux平台上、支持多种编程语言。
3.Hadoop生态圈
相关文章推荐
智能手机建站的优点是什么?网站页面布局有哪些关键点? 2022-01-10
2022年中国云计算面临的问题及发展前景预测分析2021-12-28
绿色智能基础设施连接可持续未来-IDCC2021万国数据第一代Smart DC发布会议程揭晓2021-12-27
阿里云:早期未意识到Apache log4j2漏洞情况的严重性 将强化漏洞管理2021-12-27
云计算开发:Python3-replace()方法详解2021-12-27