性价比高的手机排行榜前十名新贵含光800 AI处理器GPU超越之选

2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在简短的介绍中推出了阿里的首款AI芯片——含光800。这款当时最强的AI推理芯片的发布不仅引发了巨大的关注,也可谓是高调亮相。今年,在阿里线上云栖举行的一场芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s。主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑、图像视频审核、拍立淘等。”

更令人关注的是含光800在具体应用中的表现。在去年的文章中,我们提到科技巨头自研芯片,是因为有大量数据,在内部的AI需求推动下,他们希望通过自研芯片来提升效率和性价比。周五的线上分享中,龙欣也指出,阿里巴巴内部有广阔的AI应用,这些应用包括电商应用、视觉应用、语音交互、自然语言理解、机器翻译等。

一个典型案例就是拍立淘,它拥有两千多万日活用户,当这些用户使用该功能时,要通过一张图片,从4亿多商品中搜索,在30多亿张图片库中进行匹配,并根据用户习惯进行个性化推荐,这就需要极强的大规模处理能力。

因此,为了提升这种硬件到软件方案上的性价比,加速卷积和矩阵乘,同时支持反卷积、三维卷积以及插值操作,以及针对特定模型如ResNet-50优化;同时提供高能效低延迟、高密度计算与存储减少I/O需求;并且支持权重稀疏压缩和量化压缩,以及可编程模型扩展功能,使得含光800特别针对CNN算法模型进行设计,但保持一定灵活性,再匹配全栈软件支持以实现高性能加速。

去年张建锋发布含光800时说,“在业界标准ResNet-50测试中,其性能达到了78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。”不过龙欣昨天没有提及其峰值性能,而是强调其可用性。他表示,“作为并没有在公开市场发售过的芯片,它通过阿里云输出。”

为了让含光800能够开箱即用,对于购买实例的人员,可以自动安装NPU驱动和SDK。系统方面支持公共镜像CentOS 7.6/7.7 和 Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow 和 MXNet,并提供示范教程。此外,他还指出现在实际使用场景中的三大场景,其中每个都展示了它与GPU相比性能提升4至11倍:城市大脑、中小企业支付平台以及直播内容识别领域。

对于未来是否会再次看到包含新技术或改进版本的事迹,没有明确回答。但我们知道,即使有一群精英团队能够快速设计出一款新颖而先进的地球级别核心处理器,每一步将这项技术从概念转变为实际生产所需长时间努力,而且此过程软件将扮演更加直接作用。而获得客户认可采用则不是易事。这是一个故事刚刚开始讲述之初。

标签: 白家电