首页 / 行业
亚马逊开始转向另一个开源虚拟化技术KVM
2022-08-10 09:16:00
云服务作为目前市面上利润最大的市场之一,已然成了不少互联网巨头公司的主要业务,而云服务供应商中稳坐头号交椅的,自然是亚马逊的AWS。作为占据全球市场近三分之一,在中国市场仅次于阿里云的公共云平台,亚马逊的云业务成了它最赚钱的业务,甚至在其零售业务开始亏损时,也依然在一己之力撑起亚马逊的利润率。
亚马逊的AWS业务之所以能收获这样的成功,同样离不开硬件。云服务市场初期的竞争很简单,由于硬件用的都是英特尔、AMD这些厂商的服务器产品线,所以差距不大,只能靠虚拟化技术之类的软件架构以及更高的性价比来吸引客户。但为了进一步降低成本,云服务厂商们也纷纷开始自研芯片,亚马逊、谷歌还有阿里巴巴都是如此。
一次成功的收购对于云服务的基石实例来说,虚拟化是至关重要的。亚马逊此前用到的都是Xen这一开源虚拟化技术,随后在发现Xen在硬件虚拟化上的一些限制之后,亚马逊开始转向另一个开源虚拟化技术KVM。
但也正是这一转变让他们有了重大发现,那就是尽管英特尔和AMD的服务器CPU在虚拟化上越来越成熟,但KVM能与ASIC紧密结合在一起反而能发挥出更大的优势。为此,他们决定发展自己的芯片设计业务。
2015年,亚马逊以未公开的金额收购了一家来自以色列的初创芯片公司Annapurna Labs,而这时的Annapurna Labs甚至没有任何公开的产品,但亚马逊很明显看中了他们在服务器芯片上的开发实力。果不其然,2015年起,带有Annapurna Labs标志的ASIC芯片开始出现在Project Nitro中,只不过大部分ASIC芯片都只是作为网络/存储卸载卡上,每个实例的硬件主体大部分还是英特尔的x86 CPU。
2018年,第一代AWS Graviton面世,作为亚马逊自研的ARM服务器CPU方案,基于该处理器的实例在使用成本上要低于基于x86的方案,收获了不少用户的同时,也扩展了ARM的云端开发生态。这之后公布的第二代与第三代AWS Graviton,都为通用工作复杂提供了更高的性价比。
之所以有这么快的迭代速度,与亚马逊以IP为导向的设计路线有关。以AWS Graviton2和Graviton3为例,这两者分别运用了ARM Neoverse N1和Neoverse V1的方案,并不需要亚马逊像Ampere Computing这样的服务器芯片厂商一样,开始考虑自研ARM IP。
AI/ML带来的新一波热潮提供通用计算托管平台的亚马逊也没有止步于此,他们看上了新的市场,那就是AI/ML。作为“新电力”的人工智能正在为各个行业带去新的生机,但所需的算力也成了转型过程中最大的难题。最初大家指望用CPU来解决AI算力的问题,然而面对全新的计算方式,CPU很快就显得心有余而力不足。
但要去做GPU需要的技术积累可不少,市面上也只有英伟达的GPU在AI/ML上打出了名号,所以亚马逊和许多AI芯片初创公司一样,还是打算从ASIC上出发,推出了Inferentia和Trainium这两款推理和训练芯片。
不过Inferentia和Trainium与Graviton的定位是一样的,亚马逊并不指望从性能上打败如日中天的GPU,而是希望提供一个成本更低延迟更低并支持更多算法的方案,继续发挥云服务在即用即付这一高性价比商业模式上的优势。
与此同时,亚马逊作为全球市占比第一的云服务厂商,单靠自己的硬件是没法实现这样的地位的,所以无论是英伟达的GPU还是英特尔Habana Labs的AI加速器,亚马逊也都有合作部署。
即便Inferentia和Trainium带来了一定的成本和功耗优势,但要想打破当下以GPU主导的AI/ML生态,还面临着不少挑战,英伟达的CUDA已经打造了一个相当庞大的开发社区,要想让开发者迁移到ASIC硬件上,还有庞大的移植工作需要完成。这也是为何亚马逊的Annapurna Labs部门目前开放的100多个职位中,硬件开发的其实只有10多位,余下的大部分还是软件开发岗,大部分AI芯片初创公司也在面临着这类困境,并非独此一家。
结语在大部分服务器CPU、AI/ML加速器初创公司眼中,直接把硬件卖给各大数据中心和互联网公司并不是唯一的销售途径,能傍上亚马逊、谷歌和阿里巴巴这样的大腿不仅能盈利,还能提高自己产品的普及程度。
这也是为何Ampere Computing的Altra处理器开始陆续出现在Azure、谷歌云和阿里云等平台上,云服务平台自研芯片归根结底还是为了提供性价比更高的方案,但他们的客户还在猛增阶段,只靠闭门造车肯定是没法扩大市场份额的,拥抱更大的硬件生态才能实现共赢。
审核编辑:彭静最新内容
手机 |
相关内容
浅谈芯片常用的解密器
浅谈芯片常用的解密器,芯片,评估,修复,安全性,硬件,解密,ad7705brz芯片解密器是一种用于解密芯片内部信息的设或软件。芯片解密器在DigiKey 凭借品牌更新荣获四项 Mar
DigiKey 凭借品牌更新荣获四项 MarCom 大奖,四项,机构,明尼苏达州,公司,行业,产品,全球供应品类丰富、发货快速的商业现货技术元件PODsys:大模型AI算力平台部署的开源
PODsys:大模型AI算力平台部署的开源“神器”,开源,模型,平台,运行,计算,用户,PODsys(Platform for Open-source Distributed System)是芯朋微:服务器配套系列芯片已通过客
芯朋微:服务器配套系列芯片已通过客户验证 可应用于AI服务器,服务器,客户,芯片,验证,人工智能,公司,芯朋微是一家专注于人工智能芯片与GPU能效齐平,低功耗AI公司的转型
与GPU能效齐平,低功耗AI公司的转型,公司,低功耗,硬件,市场,能源,需求,随着人工智能(AI)技术的快速发展,对于低功耗AI公司的需求也越来越基于电力载波通信的远程开关设计可
基于电力载波通信的远程开关设计可使用线驱动器CN6212,驱动器,载波,调制解调器,连接,软件编程,芯片,基于电力载波通信的远程开关设异构计算时代,RISC-V架构发展应该更
异构计算时代,RISC-V架构发展应该更大胆一些,时代,异构计算,低功耗,功耗,开放源代码,计算,随着74HC273D人工智能、大数据、云计算等什么是监控云服务器,监控云服务器的
什么是监控云服务器,监控云服务器的组成、特点、原理、分类、操作规程及发展趋势,云服务,发展趋势,分类,实时,监控系统,安全监控,CD4