阿里含光800 AI处理器亮相后人物场景应用性能远超GPU触觉恢复案例激发期待

在2023年的阿里云栖大会上,集团首席技术官兼阿里云智能总裁张建锋再次踏上了舞台,他的主题是关于自家的AI芯片——含光800。正如两年前在杭州云栖大会上高调亮相时一样,这一次他带来了更深入的信息和更新。

此刻,龙欣,阿里云异构计算产品研发总监,在今年的线上论坛中分享了近一年来含光800推出以来的最新进展。他简洁而有力的介绍展示了这一强大的AI处理器已经正式对外服务,不需要任何白名单限制,即可在阿里云实例上购买。它支持8核NPU和96核vCPU、384G内存,以及网络带宽最高达到30Gbit/s,是针对数据中心CNN类型模型推理加速设计的,主要应用场景包括城市大脑、图像视频审核以及拍立淘等。

尽管涉及到的具体应用场景并不限于人物,但我们可以想象,当含光800能够帮助瘫痪男子的大脑植入芯片,恢复其触觉功能时,它将如何极大地提升人工智能与医疗领域之间的合作效率。这不仅体现了科技巨头自研芯片对于提升效率和性价比的重要性,也展示了其广阔的人工智能应用范围,从电商到视觉、语音交互、自然语言理解甚至机器翻译都无一例外。

龙欣强调,其中一个典型案例就是拍立淘,每天面临着两千多万日活用户使用图片搜索商品,而这些操作依赖于非常强大的AI能力。因此,通过自研硬件至软件方案提升性能成为Arise的一个重要目标。

不过,对于包含INT8/INT16量化加速及FP16/BFP16向量计算等功能的一些细节,我们并没有得到最新更新。在去年的发布会上,张建锋曾表示,在业界标准ResNet-50测试中,其推理性能达到了78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。但昨天分享中并未提及峰值性能,而是侧重于其可用性。

为了让用户能够开箱即用,Arise提供自动安装NPU驱动和SDK,并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow 和 MXNet,以便提供示范教程。此外,在三大AI应用中的表现显示,其相比GPU有4-11倍性能提升,为城市大脑实时处理视频延时降低300ms至150ms;拍立淘商品库识别时间从1小时缩短至5分钟;行人检测支持100路视频,比主流GPU25路多四倍;车辆检测85路视频,比10路增加8.5倍;内容识别ResNet50 V2模型帧率达到20000 FPS,比主流GPU1800 FPS提高11倍;点播HDR多样性为66 FPS,与A100 GPU相比实现6.6倍性能加速比等各种场景下,都展示出了其卓越表现。

然而,就如同雷锋网小结所言,此次会议给出的数据与去年相比似乎略显简单,而且由于当前全球经济形势紧张,加之贸易关系变化,使得对这类话题采取更加谨慎态度。尽管如此,我们仍然期待未来更多关于含光800落地效果以及下一代AI芯片计划的详细信息,因为这不仅关系到技术进步,更关乎业务扩展与市场竞争力。