CDP私有云:加速企业数据云迈向混合多云时代

  • 来源:网络
  • 更新日期:2020-07-08

摘要:数据已成为推动企业数字化转型的重要资源,也是促成生产力升级的核心要素,围绕数据构建的全生命周期管理伴随着数据环境的日益复杂正变得愈发关键,越来越多的数据产生在混合多云

数据已成为推动企业数字化转型的重要资源,也是促成生产力升级的核心要素,围绕数据构建的全生命周期管理伴随着数据环境的日益复杂正变得愈发关键,越来越多的数据产生在混合多云平台,数据规模亦面临着指数级增长,如何掌握数据的采集、处理、分析、预测能力,将其转化为真正的商业价值是摆在每一位CXO面前的问题。

“在Cloudera的CDP上,我们会提供整个数据生命周期每一步所需要的工具,包括基础架构、共享的数据体验,以及数据治理相关的功能,可以随时随地保障客户数据的安全和可管理性。”Cloudera大中华区总经理徐晋在接受采访时表示。6月23日,Cloudera发布了Cloudera Data Platform Private Cloud(CDP私有云),以红帽OpenShift为支撑的CDP私有云专为混合云构建,以统一的内置安全治理能力将本地部署环境无缝连接至公有云,以Kubernetes支持的混合架构进一步完善了企业数据云愿景。

Cloudera大中华区总经理徐晋

一直以来,Cloudera都在帮助客户在公有云、私有云、边缘、本地数据中心等任一环境建立现代数据架构,有效处理和管理任何数据,打通企业的内部数据孤岛,快速从数据中获得价值。2019年1月,Cloudera宣布与Hortonworks合并,实现了传统AI驱动数据管理与端到端数据管理方式的结合,创建了下一代数据平台Cloudera Data Platform。

徐晋认为,Cloudera Data Platform是将Cloudera CDH和Hortonworks HDP的精华融为一体的产品(原有的CDH和HDP用户均可通过软件升级至CDP),可称之为“Cloudera Runtime”,是基于Apache开源社区的30多个开源项目,经过研发、测试、整合后提供的基础的大数据运营环境,具有Data Hub(数据中心的服务)、Data Flow & Streaming(数据收集)、Cloudera Data Engineering(数据处理)、Cloudera Data Warehouse(数据仓库)、Operational Database(数据库赋能)、Machine Learning(机器学习)等六大能力。

Cloudera数据平台

在此基础之上,Cloudera加入了独特的数据管理层SDX,即共享数据体验,提供统一的数据管理、数据目录、安全管控和数据治理机制。无论是在公有云、私有云、混合多云还是本地,亦或是裸金属或容器,Cloudera CDP都能带来统一的使用体验,并匹配了一系列组件来管理分布式环境。基于同一个开发平台,Cloudera推出了两个版本的产品,也就是PaaS级的CDP Public Cloud,以及部署在企业数据中心内部的CDP Private Cloud,后者即是当前中国大陆地区客户主要使用的产品。

一致的开发和使用体验

当然,不管是在哪一类的使用环境中,Cloudera都提供了统一的开发模式,这不仅让应用迁移变得更加无缝,客户的使用体验也得到了高度一致的保证。通过OpenShift和CDP私有云创建的混合云及多云数据架构,客户能够快速加载关键任务应用并在任何地方运行,而且不会破坏现有的应用。Cloudera大中华区技术总监刘隶放介绍称,CDP私有云会确保共享数据的访问机制,可以基于Ozone存储进行大数据分析层面的容器化快速部署。

Cloudera大中华区技术总监刘隶放

“之前有个很大的问题,就是当一个新应用来的时候,因为某个业务部门看中了计算引擎的新功能,要求升级到高版本时,每一次升级就要求所有其他的应用跟着升级,其中有个客户有很大的一个集群,上面应用有上百个,这些应用同时存在的时候,如果某一个应用因为一个计算引擎要升级,就要被迫对所有其他的计算引擎全部进行研调和测试,这是很麻烦的事情。”刘隶放说。

CDP私有云

而CDP私有云基于CDP DC融合了40多个组件,并应用了Kubernetes和OpenShift,可以提供机器学习、数据仓库、数据工程、数据流等服务,在获取高阶能力的同时省去了使用成本。首先是上手简单,具有与公有云一致的体验,用户界面针对业务人员设计,数秒内即可部署上线;其次是多租户管理和隔离,既可以弹性扩展,在独立升级时又不会影响到其他业务;此外,可以充分使用到基础架构的能力。

“对于数据来说要怎么做容器化,因为本身容器的特点,其数据的持久化要怎样实现?”刘隶放称,“我们要提供这样一个新的思路给大家,我们把数据长期的持久化放在DC版上,通过容器化的计算平台把工作负载从物理架构中抽离出来,可以让工作负载在计算资源上面,灵活部署和使用。”如果客户使用的是非Cloudera应用,可以获得对Kubernetes环境的共享。

例如,某家企业的业务部门要上线一个涉及数百个节点的SQL项目,原始做法是先找到物理服务器,再创建实例进行安全和管控配置,然后把相关数据拷贝过来,之后将SQL引擎和应用部署上去,每次的应用上线都要重复这一步骤,并且会在该过程中产生大量的冗余数据。对此,Cloudera可以一次性的为客户安装CDP私有云版本,可以在业务系统的SQL项目上线后的几分钟内而不是数星期就部署好新的应用环境。

CDP私有云应用实例

据了解,CDP私有云为互联数据的生命周期提供了云原生的速度、规模和经济性,使IT部门能够为业务提供一系列支持:轻松提供数据分析和机器学习服务,其速度与传统数据管理解决方案和云服务相比提升10倍,从而更快响应不断变化的业务需求并消除影子IT风险;PB级混合数据架构可满足对数据分析和机器学习服务的需求,该架构可灵活使用私有云和公有云,缩短价值实现时间,为关键工作负载提供大规模支持;在整个数据生命周期中优化和共享数据流、数据工程、数据仓库和机器学习等计算基础架构。通过减少数据分析对数据基础架构的需求,消除不必要的数据复制,从而提高效率并降低成本;确保在混合云和多云部署中轻松一致地实施安全和治理策略,从而减少合规问题风险和由此产生的罚款风险;投资开源平台,确保持续快速的创新,从而满足当前和未来不断发展的业务需求。

在徐晋看来,CDP提供的是一个平台级的产品,而不是单一的解决方案,这不仅体现在任意平台的部署和覆盖数据全生命周期的安全和治理功能,还体现在平台全面的开放性,源代码100%开源,“在完成与Hortonworks的合并之后,Cloudera现在的定位是成为一家企业数据云的公司,我们相信数据可以使今天的不可能成为明天的可能。”

放眼未来的中国企业数据云市场,徐晋也看到了巨大的发展机遇,尤其是新基建在5G、大数据中心等领域的持续投入,“对于Cloudera来说,这是一个非常好的时代,我们会在企业数据云的推广过程中,更广泛的与中国的生态伙伴们合作,在帮助客户进行数字化转型之中不断推进我们的业务,最终为客户实现他们的数据战略目标。”

(7478266)

新网数码