首页 / 百科
NVIDIA A100登陆AWS,开启加速云计算的下一个十年
2020-11-05 00:00:00

在AWS运行NVIDIA GPU十周年之际,AWS发布了采用全新A100的Amazon EC2 P4d实例
十年前,AWS(Amazon Web Services)发布了首个采用NVIDIA M2050 GPU的实例。当时,基于CUDA的应用主要专注于加速科学模拟,AI和深度学习还遥遥无期。
自那时起,AW就不断扩充云端GPU实例阵容,包括K80(p2)、K520(g3)、M60(g4)、V100(p3 / p3dn)和T4(g4)。
现在,已全面上市的全新AWS P4d实例采用最新NVIDIA A100 Tensor Core GPU,开启了加速计算的下一个十年。
全新的P4d实例,为机器学习训练和高性能计算应用提供AWS上性能与成本效益最高的GPU平台。与默认的FP32精度相比,全新实例将FP16机器学习模型的训练时间减少多达3倍,将TF32机器学习模型的训练的时间减少多达6倍。
这些实例还提供出色的推理性能。NVIDIA A100 GPU在最近的MLPerf Inference基准测试中一骑绝尘,实现了比CPU快237倍的性能。
每个P4d实例均内置八个NVIDIA A100 GPU,通过AWS UltraClusters,客户可以利用AWS的Elastic Fabric Adapter(EFA)和Amazon FSx提供的可扩展高性能存储,按需、可扩展地同时访问多达4,000多个GPU。P4d提供400Gbps网络,通过使用NVLink、NVSwitch、NCCL和GPUDirect RDMA等NVIDIA技术,进一步加速深度学习训练的工作负载。EFA上的NVIDIA GPUDirect RDMA在服务器之间可通过GPU传输数据,无需通过CPU和系统内存,从而确保网络的低延迟。
此外,许多AWS服务都支持P4d实例,包括Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster和Amazon SageMaker。P4d还可使用所有NGC提供的经过优化的容器化软件,包括HPC应用、AI框架、预训练模型、Helm图表以及TensorRT和Triton Inference Server等推理软件。
目前,P4d实例已在美国东部和西部上市,并将很快扩展到其他地区。用户可以通过按需实例(On-Demand)、Savings Plans、预留实例(Reserved Instances)或竞价型实例(Spot Instances)几种不同的方式进行购买。
GPU云计算发展最初的十年,已为市场带来超过100 exaflops的AI计算。随着基于NVIDIA A100 GPU的Amazon EC2 P4d实例的问世,GPU云计算的下一个十年将迎来一个美好的开端。
NVIDIA和AWS不断帮助各种应用突破AI的界限,以便了解客户将如何运用AI强大的性能。
最新内容
手机 |
相关内容
恩智浦半导体推出UWB产品组合扩充
恩智浦半导体推出UWB产品组合扩充的新型汽车UWB芯片,芯片,推出,扩充,定位,多种,车辆,恩智浦半导体(NXP Semiconductors)是一家全球领微软自研AI芯片公布在即,云厂商进一
微软自研AI芯片公布在即,云厂商进一步优化成本,优化,芯片,服务,用户,计算,云计算,近年来,人工智能(AI)技术的发展迅猛,已经成为许多行业台积电报明牌:硅光子将成半导体产业
台积电报明牌:硅光子将成半导体产业关键技术,台积电,云计算,芯片,光纤,可扩展性,器件,硅光子技术是一种将光子和电子相结合的技术,通DRAM芯片价格有望随NAND温和上涨
DRAM芯片价格有望随NAND温和上涨,芯片,上涨,云计算,市场,导致,存储器,DRAM芯片是一种用于计算机内存的74LVC32APW存储器芯片,广泛应获得静止影像的控制系统实例电路图
获得静止影像的控制系统实例电路图,电路图,信号处理电子电路图,获得静止影像的控制系统实例电路图 电路图,获得静止影像的控制系统用低通滤波器进行视频解调实例电路
用低通滤波器进行视频解调实例电路图,电路图,信号处理电子电路图,用低通滤波器进行视频解调实例电路图 电路图,用低通滤波器进行视AD和DA转换器实例电路图
AD和DA转换器实例电路图,电路图,数字电路图,AD和DA转换器实例电路图 电路图,AD和DA转换器实例电路图晶体管阵列应用实例电路图
晶体管阵列应用实例电路图,电路图,数字电路图,晶体管阵列应用实例电路图 电路图,晶体管阵列应用实例电路图