满足多样性算力需求,华为计算业务将如何布局

倾听梦里花落声 10天前   阅读数 17 0

这是华为在全球分析师大会2020上分享的一个真实案例。

过去,高速收费站的人工收费方式费时费力、效率低下,遇到早晚高峰或者节假日,收费站往往成为交通最拥堵的地方。为简化通行流程、提升通行效率,彻底解决交通拥堵难题。国家在2019年开始全面取消省级收费站,人工收费逐渐被自动化和智能化的ETC设备所取代。

这背后不仅仅是设备对于人工的简单替代,还涉及到车辆识别、里程计算、移动支付、业务系统打通等多项工作。为此,华为提供了一整套完善的解决方案,包括TaiShan服务器、Atlas智能小站在内的一系列计算设备以及后端ModelArts一站式AI开发平台,通过多样性算力来支撑起整个智慧交通体系的运作与管理。

根据华为介绍,在部署这套解决方案之后,高速收费站客车平均通行时间从15秒降低到2秒,货车平均通行时间从29秒降低到3秒,大幅提升了通行效率,有效解决了交通拥堵的难题。

在华为看来,高速收费仅仅是计算改变人们生活的场景之一。在如今的世界中,随着数字化进程加速,计算正在深刻改变着各行各业,多样性计算将会在更多行业场景中发挥着越来越重要的作用。

为什么需要多样性算力

“持续创新,满足世界多样性算力的需求。”--这是华为计算产品线副总裁姜涛在华为全球开发者大会上所传递出的清晰声音。

如何满足多样性算力需求,华为计算业务的突破与坚持

华为计算产品线副总裁姜涛

那么,为什么世界需要多样性算力?

这跟当前的趋势密不可分。随着像5G、云计算、大数据等数字化技术不断应用,产生了两大明显趋势:其一,接入设备开始从传统PC向移动智能终端转移,直接带来了部署模式从PC应用到移动应用再到移动应用云化;其二,万物互联带来了海量数据的产生,直接推动了云边分工与协同,云数据中心承载海量数据的分析、处理和存储,并且形成中心训练和边缘推理的云边协同。

这些趋势带来对多样性算力的直接需求,要求算力可以实现云端同构、高并发、高吞吐、超高性能,以及更优能效的AI。

华为计算产业打算怎么干

在本次大会上,华为公司高级副总裁、云与计算BG战略与产业发展部部长张顺茂在《拥抱数字化转型机会,共赢计算新时代》主题演讲中强调:云与计算是生态型产业;因此,做大产业的蛋糕比做大市场份额更加重要。

在云与计算的生态产业中,横向建立稳定、持续、可共赢的生态,纵向则让应用生态百花齐放,华为的工作就是提供足够有养分的黑土地。在黑土地中,多样性算力其实就是黑土地中不可获取的各种养分,它可以为各种场景、应用提供最为合适的算力,让应用真正实现百花齐放。

如何满足多样性算力需求,华为计算业务的突破与坚持

 

姜涛介绍,华为计算产业战略主要是四个方面:架构创新,投资全场景处理器族,商业策略“有所为有所不为”,构建开发生态。2019年,华为实现了对x86、AI、ARM算力产品的全面布局,构建起“x86+ARM+GPU+NPU”多种计算形态产品,满足不同行业、不同业务规模的用户需求。

当前,华为计算业务包括通用计算平台、AI计算平台以及智能加速部件、智能管理引擎等,可以满足各行各业对于多样性计算的需求。相关数据显示,2019年华为计算设备发货量同比增长了8%。

华为Atlas:让AI触手可及

在多样性计算中,AI算力可谓是至关重要,它支撑起各种人工智能场景应用。不过,人工智能与行业场景应用的结合才刚刚开始,与AI算力相关的产品虽然非常之多,但是AI算力在行业应用中依然面临着不小的挑战。

其一,不同场景采用不同的计算架构很普遍,这给开发者带来了极大的挑战。开发者需要适配不同开发平台做模型转换,开发者不能实现一次性开发与多次部署,导致目前AI开发效率并不高。

其二,人工智能应用在数据中心、互联网中已经开始得到较为广泛的应用,但是随着5G商用提升,大量行业应用开始向边缘应用延伸。数据中心测的AI算力对于功耗容忍度大,边缘侧对于功耗则比较敏感。因此,AI算力需要同时关注数据中心侧和边缘侧。

其三,人工智能芯片越来越走向专用化,芯片架构创新大部分集中在专用架构,不再局限于传统兼顾GPU的处理方式。

为此,华为AI发展战略从一开始确定了在全栈、全场景中采用统一的架构,满足各个行业的数据中心和各种边缘场景的AI应用需求,为开发者构建起一致性的开发体验,一次性开发,可以在多种产品上做多次部署。

如何满足多样性算力需求,华为计算业务的突破与坚持

 

目前,华为Atlas 全场景AI解决方案涵盖了云、边、端各种场景,产品有Atlas 900 AI集群、Atlas 800 AI智能服务器、Atlas 300 AI加速卡、Atlas 500 Pro AI智能边缘服务器、Atlas 500 AI智能小站、Atlas 200 DK AI开发者套件以及Atlas 200 AI加速模块。华为Atlas系列产品的形态可谓是异常丰富,像Atlas 900是数据中心级的训练集群,而Atlas 200则是只有火柴盒那么大小的加速卡。

以Atlas 900为例,目前为业界最顶尖的AI 训练产品,数千颗AI处理器互联,半精度(FP16)算力达256-1024 PFLOPS;除了处理器之外,还引入了HCCS、智联网络等,让其性能极为出色。此外,Atlas 900还是业界首款支持全液冷的AI集群,这样大幅降低了整个数据中心的能耗。

像鹏城云脑Ⅱ采用Atlas 900 AI集群为底座,整个AI集群的PUE<1.1,具有最佳集群网络,HCCL集合通讯支持100TB全互联无阻塞专属参数同步网络。在这样强大能力支撑下,鹏城云脑II获得源源不断的澎湃算力,支撑起科研工作者对计算机视觉、自然语言处理、自动驾驶、医疗等各类研究。

另外,在疫情期间,华为的AI解决方案也发挥了至关重要的作用。在疫情早期,由于检测手段匮乏,通过CT影像来判断病例是主要手段,但是随着越来越多的人进行CT拍摄,光靠医生人工来分析CT影像已经彻底不行。

此时,华为通过部署Atlas 800智能服务器,通过大量样本数据的不断训练和算法的不断迭代,很快就实现了对CT影像病情的快速识别,并且准确率持续提升达到了99%。如今,华为这套AI抗疫解决方案已经广泛部署在全球多个国家的医院。

除了提供强大的产品与解决方案之外,华为在AI生态上将会持续走开放的道路。据悉,目前华为已经在36所高校中开设了AI课程,并且有3万多开发者进入到华为计算框架的开发,还拥有超过100家行业ISV,打造了超过50个行业AI解决方案。

总体而言,随着数字经济的快速发展,数字经济与实体经济的融合开始产生大量新的应用场景,在大数据、AI、物联网等数字化技术带动下,算力需求正在走向细分化和差异化。华为计算业务持续的创新能力、全面的产品布局、丰富的行业解决方案以及开放的生态策略,将会为华为云与计算“黑土地”注入持续的养分,满足用户多样性的计算需求。


注意:本文归作者所有,未经作者允许,不得转载

全部评论: 0

    我有话说: