• 1
  • 2
  • 3
  • 4

首页 / 行业

燧原科技发布第二代云端人工智能推理加速卡云燧 i20

2021-12-15 09:28:00

燧原科技发布第二代云端人工智能推理加速卡云燧 i20

AI芯片

数量级效率优势,原生适配AI计算:光芯片的下一个技术突破要来了

近年来,人工智能等技术的快速发展让计算机的算力需求暴增,但随着摩尔定律失效,传统芯片性能提升速度却开始大幅放缓。全世界都在寻找新的解决方法,光芯片的发展正让人看到希望。

我们经常会看到光芯片技术、光学神经网络的研究登上 Nature 和 Science 等顶尖科学杂志。在一些研究中科学家们指出,光学开关的速度要比现在商用的顶级硅芯片的晶体管快 100 到 1000 倍。

1万美元的L4自动驾驶解决方案面世,实测1小时表现如何?

高阶自动驾驶想要成功商业化,除了取决于感知、决策、执行各个层级的成熟度,降本也是至关重要的一点,否则不仅难以大规模投用,更难与乘用车结缘。

据艾瑞咨询的一项报告显示,仅L4级自动驾驶的硬件,在2018年底的成本就达到50万元左右,还有可能更高。而到今年,百度采用ANP-Robotaxi架构的Apollo Moon自动驾驶运营车,已将整车成本降至48万元,这还计算了其原型车北汽极狐阿尔法T的费用。

三年完成两代产品迭代,燧原科技的推理芯片性能又提升了三倍。

12 月,燧原科技在线上发布会上发布了第二代云端人工智能推理加速卡「云燧 i20」。

这是时隔五个月以来,燧原科技在今年连续第二次发布新产品。今年 7 月,燧原在 WAIC 世界人工智能大会上发布了第二代加速训练卡「云燧 T20」。

作为全新一代云端 AI 推理加速产品,云燧 i20 拥有迄今为止业内最大的 AI 加速卡存储带宽,高达 819 GB/s,远超行业同类产品水平。与此同时,该加速器全面支持从 FP32、TF32、FP16、BF16 到 INT8 的计算精度。单精度 FP32 峰值算力达到 32 TFLOPS,单精度张量 TF32 峰值算力达到 128 TFLOPS,整型 INT8 峰值算力达到 256 TOPS。对比第一代推理产品,云燧 i20 将浮点算力提升到 1.8 倍,整型算力提升到 3.6 倍。

达摩院成功研发存算一体AI芯片,性能提升10倍以上

12月3日,达摩院宣布成功研发新型架构芯片。该芯片是全球首款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,能效比提升高达300倍。

过去70年,计算机一直遵循冯·诺依曼架构设计,运行时数据需要在处理器和内存之间来回传输。随着时代发展,这一工作模式面临较大挑战:在人工智能等高并发计算场景中,数据来回传输会产生巨大的功耗;目前内存系统的性能提升速度大幅落后于处理器的性能提升速度,有限的内存带宽无法保证数据高速传输。

AI热点

老电影和图片变清晰的秘密!分辨率提升400%的AI算法已开源

如上图, 从100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升400%的技术到底意味着什么?

它意味着:

老照片、老电影、动漫等画质可快速提升,分辨率自由调节

产业算法效果可以随着数据质量的提升大幅提高

在网络信号较差时,也能快速查看高清视频或图片

影像传输带宽与存储空间大幅压缩,传输成本也将大大减少

增大模型依然有用,DeepMind用2800亿参数的Gopher,测试语言系统极限

近年来,国内外各大 AI 巨头的大规模语言模型(large language model,LLM)一波接着一波,如 OpenAI 的 GPT-3、智源研究院的悟道 2.0 等。大模型已然成为社区势不可挡的发展趋势。

然而,当前语言模型存在着一些问题,比如逻辑推理较弱。那么,我们是否可以仅通过添加更多数据和算力的情况下改进这些问题呢?或者,我们已经达到了语言模型相关技术范式的极限?

Gopher:2800 亿参数,接近人类阅读理解能力

今日,DeepMind「一口气」发表了三篇论文,目的之一就是解决当前语言模型存在的问题。DeepMind 得出的结论是进一步扩展大规模语言模型应该会带来大量的改进。此前在一次电话简报会上,DeepMind 研究科学家 Jack Rae 表示,「这些论文的一个关键发现是大规模语言模型依然在进展之中,能力也在继续增强。这个领域并没有停滞不前。」

2600亿参数,60多项任务突破,全球首个知识增强千亿大模型鹏城-百度·文心发布

百度与鹏城实验室联合发布全球首个知识增强千亿大模型——鹏城 - 百度 · 文心(ERNIE 3.0 Titan),是目前为止全球最大的中文单体模型。同时,百度产业级知识增强大模型 “文心” 全景图首次亮相。

从 15 亿参数的 GPT-2 到 1750 亿参数的 GPT-3,我们已经看到了模型规模增长和训练数据增加所带来的显著收益,其中最重要的一点就是对标注数据的依赖显著降低,这使得很多数据稀缺的场景也能用上性能强大的 AI 模型,为 AI 的大规模工业化应用扫清了障碍。

原文标题:【AI简报20211210期】L4自动驾驶解决方案面世、达摩院成功研发存算一体AI芯片

文章出处:【微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁

人工智能推理芯片语言模型

  • 1
  • 2
  • 3
  • 4

最新内容

手机

相关内容

  • 1
  • 2
  • 3

猜你喜欢