当前位置: 财声传媒网 -> 财经

国产AI训练集群进入超算领域明年算力规模将达1000PFLOPS

发布时间:2019年12月02日 08:05   来源:金融界   关键词:训练   阅读量:19401   
导读:随着自动驾驶、4K/8K视频、AR/VR、物联网等应用兴起,社会的生产力、生产资料和生产工具正发生变革。在华为CloudAI产品与服务总裁侯金龙看来,算力已成为新生产力,数字、数据成为新生产资料,而5G+云+AI则成为了新生产工具。根据华为...

随着自动驾驶、4K/8K视频、AR/VR、物联网等应用兴起,社会的生产力、生产资料和生产工具正发生变革。在华为CloudAI产品与服务总裁侯金龙看来,算力已成为新生产力,数字、数据成为新生产资料,而5G+云+AI则成为了新生产工具。

根据华为GIV2025全球产业洞察预测,到2025年数据总量180ZB,是2018年数据量的5.5倍。但在当前,仅有不到2%的企业数据被保存,而其中只有不到10%的数据得到分析和利用,数据的价值远没有得到充分挖掘。

为了更好地让算力匹配日益增加的数据分析处理需求,近两年来AI正在和云与网络深度融合,全球巨头企业也纷纷构建自己的AI超级计算平台。放眼全球,谷歌、英特尔、英伟达都在着力打造AI导向的大型数据中心;而在国内,过去两年间,由BAT、华为等企业瞄准不同行业或技术门类的15家国家新一代人工智能开放创新平台已分批确立。

鹏城云脑机房 图片来源:每经记者 王晶 摄

11月29日,鹏城实验室与华为在深圳共同发布鹏城云脑Ⅱ基本型,它采用搭载华为鲲鹏、昇腾处理器的Atlas 900集群提供的算力,由鹏城实验室研究云脑平台关键技术,支撑AI领域诸如计算机视觉、自然语言、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。

明年算力规模将迈入1000P FLOPS 据悉,Atlas 900由数千颗昇腾910 AI处理器组成,是全球最快的AI训练集群。在衡量AI计算能力的标准ResNet-50图片分类模型下,Atlas 900只用59.8秒就完成了训练,在同等精度下比原世界纪录快10秒。Atlas 900可广泛应用于科学研究与技术创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。

对包括《每日经济新闻》记者在内的媒体透露:ldquo;鹏城云脑Ⅱ原型系统现已实现100P FLOPS(每秒百亿亿次计算)的算力。明年,鹏城云脑Ⅱ将达到1000P FLOPS,成为领先的AI研究平台。rdquo;而当今世界上最强的超级计算机算力约为235P,1000P算力则相当于50万台电脑的算力之和。

ldquo;Atlas 900是一个集群系统,它不是算力的简单叠加。1000P建起来后可以想像,AI训练速度会更快,会极大推进AI的研究进程。原来做一件事情,(耗时)是分钟甚至小时的级别,有了1000P的系统,只需要秒级别就可以了。AI集群不仅仅是算力的堆砌,更重要的是把庞大的算力高速、无阻塞的连接起来,并用分布式集群软件协同起来。rdquo;华为云副总裁朱照生说道。

据记者现场了解,目前双方正在联合攻坚AI集群的规模进化以及AI功能的进化,解决散热、组网等影响AI集群扩展的关键问题,为实现1000P级AI算力扫清障碍。

生态建设是发展难题 不过,随着AI算法和需求的不断发展,算力不足、训练时间长一直是困扰人工智能领域的主要矛盾,而造成这一问题的主要原因在于,算力的供应被少数厂商垄断。目前,英特尔以X86架构占据了服务器芯片九成以上的市场份额。

事实上,想要挑战英特尔的垄断地位,仅靠技术还不够,生态系统的建立才是难点。此前,Gartner半导体和电子研究副总裁盛陵海曾对记者分析称,在目前英特尔X86所统治的服务器市场,ARM阵营最大的问题在于生态,这是很难突破的壁垒。

对此,华为的解决方案是硬件开放、软件开源,使能合作伙伴,同时发展生态。侯金龙表示:ldquo;未来三年,我们会投资15亿美元发展整个生态合作伙伴。开发者是产业的灵魂,计算产业没有开发者是没有用的。我们现在和各个高校一起,把基于鲲鹏和昇腾的计算架构体系与各个高校联合起来开发教材,让学生至少可以学习我们这个体系,以后不仅仅懂X86也可以懂鲲鹏,会在这个平台上进行开发。rdquo;

侯金龙强调称,数字世界如果只是建立在一个没有选择的基础上,将是非常危险的。在服务器方面,现在这个世界只有一种选择就是X86,希望未来会出现第二种选择。

封面图片来源:每经记者 王晶 摄

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

~全文结束~

分享到微信

热门文章