中国光子芯片上市公司的阿里含光800像一位高超的艺术家以其卓越的AI处理器在舞台上高调亮相其在三大关

在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋向公众展示了他们的第一款AI芯片——含光800,这一亮相立即引起了巨大的关注。今年,在阿里的线上云栖活动中,异构计算产品研发总监龙欣分享了自含光800发布以来的一年多来的最新进展。

龙欣介绍说:“我们的NPU实例现在已经正式对外提供服务,不需要任何白名单就可以在阿里云实例上购买。我们推出的实例名称是ebman1.24xlarge,它支持最高8核NPU和96核vCPU,以及384G内存和网络带宽达到30Gbit/s。这款处理器主要面向数据中心的CNN类型模型推理加速,应用场景包括城市大脑、图像视频审核以及拍立淘等。”

更值得关注的是,尽管含光800尚未对外销售,其性能已经通过阿里云输出。据雷锋网去年的报道显示,科技巨头自研芯片是因为有大量数据需求而推动的,以提升效率和性价比。此次周五的线上分享中,龙欣也提到,阿里内部有广泛的AI应用领域,如电商应用、视觉应用、语音交互以及自然语言理解等。

一个典型案例就是拍立淘,该平台拥有两千多万日活用户,他们使用该功能时要通过图片搜索四亿多商品,并在30多亿张图片库中进行匹配,同时根据用户习惯进行个性化推荐,这种强大的AI能力使得含光800成为提升效率与性价比不可或缺的工具。

为了让含光800能够直接使用,无需额外配置,阿里云提供自动安装NPU驱动和SDK系统支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,并预装主流深度学习框架如TensorFlow及MXNet,还提供示范教程。龙欣强调,此款芯片主要用于数据中心及大型端设备,以CNN类模型推理加速为主,可扩展至其他DNN模型。在具体应用中,与GPU相比其性能提升达到了4-11倍。

举几个具体案例来说明这一点:在城市大脑中的实时交通视频处理任务,从40颗传统GPU降低到仅需4颗含光800,使延时从300ms减少到150ms;对于每天新增10亿商品图片识别任务,由于传统GPU耗时1小时,而含光800缩短至5分钟;再如行人检测与车辆检测任务,其中4核含光800分别可支持100路视频(行人)与85路视频(车辆),远超主流GPU性能。

此外,在直播、短视频内容识别等ResNet50 V2模型中的帧率可达20000 FPS,比主流GPU高出11倍;Inception V4模型下处理帧数为5000 FPS,比主流GPU快10.8倍;甚至直播HDR方面表现也显著,对比50FPS即可实现10倍加速效果。而且,在点播HDR任务下,其表现更是超过英伟达A100显著6.6倍之佳。

虽然此次共享并没有详细讨论语音交互或自然语言理解领域,但这些都是未来可能见证更多潜力的方向之一。在未来,我们期待看到更多关于这款具有革命性的AI芯片及其实际应用潜力的更新信息。

标签: 数码电器测评