在2000元左右性价比高的手机中阿里含光800 AI处理器如同一位神奇的魔术师高调亮相后以其超凡的处
在2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋以简短而生动的语言向世人展示了他们自主研发的AI芯片——含光800。这款当时最强大的AI推理芯片,以其独特之处和高效性,赢得了众多行业专家的关注,就像一颗耀眼的明星,在科技界闪耀着自己的光芒。
一年之后,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣继续讲述了含光800近一年来的发展进展。龙欣表示,含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,这使得更多用户能够直接体验到它的强大性能。他指出,含光800主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核、拍立淘等。
更令人振奋的是,是关于含光800在实际应用中的表现。尽管这款芯片尚未对外发售,但通过阿里云输出,它已经展现出了令人瞩目的成绩。在具体场景中,比如拍立淘这样的应用中,由于需要处理大量图片进行搜索和推荐,对于AI能力提出了极高要求。因此,通过自研硬件到软件方案提升性价比成为了阿里的目标。
对于这个目标,含光800在设计时就考虑到了深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对特定模型如ResNet-50、SSD/DSSD等进行优化。此外,它还具备高能效、低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等多项功能,使其成为当前市场中业界标准ResNet-50测试性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
至于具体数字方面,在城市大脑中的实时处理交通视频显示使用传统GPU需40颗,而使用含光800仅需4颗;拍立淘商品库每天新增10亿商品图片,用传统GPU识别需1小时,而用含光800可缩减至5分钟。此外,还有行人检测应用、中车辆检测应用以及内容识别应用等领域,都展示了含光800相较于主流GPU表现出的显著优势,如帧率增加11倍或8.5倍,以及加速比达到了11次或10.8次增长。
此次分享虽然没有给出最新峰值性能数据,但强调了它作为并没有在公开市场发售的芯片,可供购买实例自动安装NPU驱动和SDK,并提供公共镜像支持,同时预装深度学习框架,如TensorFlow、MXNet示范教程,便于用户快速开箱即用。而且,他还特别指出,与主流GPU相比,在三大场景中提供4-11倍性能提升,从而证明了其作为一个强大的工具,有着广阔的人工智能领域潜力。