阿里含光800 AI处理器与UWB芯片联手高调亮相后在人物识别场景中表现突出落地性能比GPU高4-1

在2019年的杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片含光800,这次发布引发了巨大的关注。今年的线上云栖有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。

他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,大图像视频审核、拍立淘等。”更引人关注的是含光800在具体应用中的表现。

龙欣强调,含光800作为并没有在公开市场发售的芯片,但通过阿里云输出。为了让用户能开箱即用,他们可以自动安装NPU驱动和SDK;系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,并提供TensorFlow、MXNet示范教程。

目前,在三大AI应用中,如城市大脑、拍立淘商品库识别等场景中相比GPU性能提升4-11倍。在行人检测应用中,可以支持100路视频,比主流GPU性能提升4倍;车辆检测可支持85路视频,比主流GPU性能提升8.5倍;ResNet50 V2模型帧率可达20000 FPS,比主流推理GPU性能提升11倍;Inception V4模型处理帧率5000 FPS,比主流推理GPU性能加速比高10.8倍。此外,在直播、点播HDR等视频质量增强中,其直播视频增强性能为500 FPS,对比主流推理GPU的50 FPS,可实现10倍的加速效果。在点播HDR中,其多核版本还能达到66 FPS。

尽管此次分享给出的场景还不够丰富,但这些实际应用优势显示了包含UWB芯片及其他新技术对于提高效率和性价比具有重要意义。