阿里含光800 AI处理器如同神兵利箭般高调亮相其芯片封装精巧无比在三大关键场景中展现出与GPU相比
阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在2019年杭州云栖大会上隆重发布了自家的AI芯片含光800,引发科技界巨大关注。近日,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣详细介绍了含光800推出后的一年来的最新进展,并展示了其在实际应用中的卓越表现。
据龙欣介绍,含光800 NPU实例已经对外服务,无需白名单即可购买,支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽。该芯片主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核及拍立淘等。
更值得关注的是,尽管含光800尚未正式对外销售,但其性能已通过阿里云输出。在实际应用中,它在三大场景中显示出了与GPU相比4-11倍的性能提升。例如,在城市大脑中实时处理交通视频时,只需4颗含光800即可完成,而传统GPU则需要40颗;拍立淘商品库每天新增10亿商品图片识别时间由1小时缩短至5分钟。
龙欣强调,含光800作为一款并未公开市场销售的芯片,其设计目标是提供高效、高密度计算与存储,同时支持权重稀疏压缩和量化压缩。此外,该芯片还具有指令集支持,可编程模型扩展,以满足不同算法需求。
在行人检测应用中,4核含光800可以同时处理100路视频,比主流GPU多3倍;而车辆检测则达到85路视频,比主流GPU增加7.5倍。此外,在ResNet50 V2模型下,4核含光800实现20000 FPS帧率,对比主流GPU提升11倍;Inception V4模型下,则为5000 FPS,与主流GPU相比提升10.8倍。在直播增强方面,即使是点播HDR模式,也能实现66 FPS,与英伟达A100相比提高6.6倍。
尽管此次分享没有提供更多语言类应用示例,但从现有的数据来看,可以明显看到当今许多行业对于高效AI处理能力的迫切需求,以及自研芯片对于提升效率和性价比至关重要的地位。