甲骨文将NVIDIA A100 Tensor Core GPU引入Oracle云

  • 来源:网络
  • 更新日期:2020-05-19

摘要: Oracle云基础设施(OCI)专为客户在云中运行人工智能(AI)、机器学习(ML)、高性能计算(HPC)和大数据负载量身打造。为了充分发挥这一特性,甲骨文在第二代云基础设施中引入了最新的NVIDIA A100 Tensor Core GPU — 首款集训练、推理、HPC和分析于一身的弹性多实例GPU。

      Oracle云基础设施(OCI)专为客户在云中运行人工智能(AI)、机器学习(ML)、高性能计算(HPC)和大数据负载量身打造。为了充分发挥这一特性,甲骨文在第二代云基础设施中引入了最新的NVIDIA A100 Tensor Core GPU — 首款集训练、推理、HPC和分析于一身的弹性多实例GPU。

      在Oracle云中运行全新A100 GPU将帮助企业更深入地发掘数据价值,推动创新,支持企业取得重大突破,例如测试和开发新药物、建造安全性能更高的飞机和快速发掘自然资源。

      “甲骨文能够增强NVIDIA GPU的云端功能。”Oracle云基础设施产品管理副总裁Vinay Kumar表示,“强大的NVIDIA GPU计算平台与Oracle裸机计算基础设施以及低延迟的RDMA集群网络相结合,对企业有极大的吸引力。基于Oracle云基础设施的高性能文件服务器解决方案能以前所未有的速度向A100 Tensor Core GPU供应数据,助力研究人员快速找到疾病治疗方案,帮助工程师制造出更加安全的汽车。”

      NVIDIA加速计算副总裁兼总经理Ian Buck也表示:“我们与甲骨文的合作不断深化,催生各个行业和应用领域出现了了不起的创新。将新款NVIDIA A100 Tensor Core GPU集成到Oracle云服务后,甲骨文将能为全球范围内的创新者提供突破性的计算性能,帮助他们利用AI、机器学习、数据分析和高性能计算更加快速地处理关键任务。”

      下一代GPU,为下一代探索而来

      引入NVIDIA A100 GPU后,Oracle云基础设施现在可以更快执行训练、推理和分析,并大幅提升灵活性。另外,最新的Oracle GPU裸机和虚拟机实例还能够加快探索速度,帮助甲骨文客户解决科学、工程和业务领域的难题。

      如今,许多行业纷纷采用HPC技术来推进创新和管理日常业务,比如:

      · 基因技术公司将DNA测序和蛋白质分析等负载广泛应用于祖先研究、健康测试和药物相互作用分析,以缩短新药品上市时间。

      · 零售商使用AI模型来分析客户数据,为客户提供有针对性的购买建议,并采用开启了硬件加速的GPU芯片显著提升负载性能。

      · 媒体和娱乐公司依靠HPC技术实现动画制作、特效渲染和媒体转码。这些工作基于突发性负载,需要数百甚至数千个节点并行运行。

      · 金融科技公司使用HPC技术来执行风险分析、高频交易和财务建模。他们在生成季度报告等场合,对计算和存储资源需求较高。

      · 汽车公司使用复杂的模拟功能支持新车的设计、制造和测试,同时采用HPC负载支持计算机辅助工程模型,用于执行撞击测试、模拟和各种类型的分析。

      · 石油和天然气公司采用HPC技术进行地质建模,预测石油和天然气资源埋藏点,同时还需要大量数据集,并进行空间分析和地震分析。

      · 航空航天公司借助HPC基础设施来执行计算流体动力学任务,例如模拟飞机机翼表面气流。这些模拟工作需要大量节点,且每一个节点均需搭载大量CPU和内存。

      基于Oracle云基础设施运行的NVIDIA A100 Tensor Core GPU

      · 可扩展为数千个互联服务器运行GPU构成的集群,来满足苛刻的AI和HPC负载要求

      · 多实例GPU特性支持将每个A100 GPU分区为多达七个GPU实例,以优化利用率,支持更多团队和服务访问

      · 可缩小和分区为多个虚拟GPU,以适应适合在缩减架构中运行的负载

      · 支持所有主流深度学习框架,例如TensorFlow、PyTorch和Caffe

      · 支持650多个GPU在HPC和AI的应用,例如MATLAB、Gaussian和NAMB

      款型为BM.GPU4.8的新款GPU裸机搭载8个40 GB的NVIDIA A100 Tensor Core GPU,且所有GPU均通过NVIDIA NVLink实现互联。板载CPU包含64个频率为2.9 GHz的AMD Rome处理器物理内核。全新的裸机实例配备2048 GB内存和24 TB NVMe存储,可通过Oracle集群网络提供的RDMA技术实现1.6 Tbps的吞吐量。这一新款型即将在部分地区率先推出,并且将于今年夏天面向全球发布,包括欧洲、美国、亚太区等Oracle云基础设施采用率高的地区。

      除了裸机实例款型,企业还可以部署多个虚拟机。每个虚拟机可搭载一颗、两颗或四颗GPU。

      加速采用数据科学和AI

      使用Oracle云基础设施数据科学平台,数据科学家团队能够在Oracle云提供的协作式托管环境中轻松构建、训练和管理模型。该服务支持Python、JupyterLab和各种主流的开源软件包,比如深度学习的TensorFlow、Keras、PyTorch、MXNET,机器学习的scikit-learn、xgboos,可视化的Plotly和matplotlib等。在未来的版本中,数据科学家还能够通过服务访问最新的NVIDIA A100,提高大规模矩阵计算速度,并行处理大规模机器学习和深度学习问题。

      此外,甲骨文还支持数据科学家通过Oracle云市场提供的预配置映像来部署AI模型。该映像不仅包含NVIDIA深度神经网络库、通用机器学习/深度学习框架、Jupyter Notebooks和通用Python/R集成开发环境,还包含基本示例数据和测试代码,可以在几分钟内启动并正常运行。现在,用户可以使用基于Oracle云基础设施的任何GPU产品来部署数据科学和AI映像。

      企业AI领域的联合投资与创新

      甲骨文和英伟达一直精诚合作,致力于为全球开发人员和客户提供GPU加速计算产品。比如将CUDA-X库与使用GraalVM语言创建的应用相集成;通过MSET2(一种用于支持异常检测的机器学习方法)在Oracle云中实现实时流预测;通过Oracle Digital Assistant增强会话式AI功能;以及通过Oracle云数据科学平台加速开发数据科学项目。

      这些技术创新可帮助用户轻松挖掘数据价值,并将机器学习和深度学习集成到应用中。借助采用NVIDIA A100 GPU的Oracle云基础设施,数据科学团队更能不断提高模型部署成功的速度,生成企业级结果和性能指标以进行预测分析,助力企业取得积极的业务成果。

      为初创企业提供一流技术

      另外,甲骨文还于今日宣布启动Oracle for Startups和NVIDIA Inception项目,帮助初创企业加速采用快速、可扩展且高度安全的云计算技术。符合条件的初创企业可享受到Oracle for Startups项目提供的以下权益:为期三个月的免费Oracle云储值,以及长达两年的7折云服务优惠。这些权益适用于基于Oracle云基础设施的所有GPU产品组合,例如NVIDIA Tesla V100和即将推出的NVIDIA A100 GPU。不仅如此,Oracle for Startups项目现有成员还可以参加NVIDIA Inception项目。您可以点击此处阅读公告,立即申请加入Oracle for Startups计划。

      立即行动

      用户可以利用免费储值,快速开始使用NVIDIA GPU等基于Oracle云基础设施的高级服务。