拳皇98ol终极之战火焰流格斗家|拳皇98ol魅不知火舞是什么魂|
te
览潮网> 原创> 华为推出全球最快AI训练集群Atlas 900,对手是谁?

华为推出全球最快AI训练集群Atlas 900,对手是谁?

览潮网9月19日讯 (记者 唐刚)“华为现在的状态就像今天上海的天气一样,秋高气爽、云淡风轻。”

9月18日上午,在上海举办的2019华为全联接大会上,华为副董事长胡厚崑发布了一款重量级产品——全球最快的AI训练集群Atlas 900。

Atlas 900已经通过华为云EI集群服务对外开放。 ?#30340;?#20154;士分析,Atlas 900主要的竞争对手仍是英伟达和谷歌。

华为发布Atlas900

第四届HUAWEI CONNECT 2010(华为全联接大会)如期而至。

今天上午,华为?#29366;?#21457;布计算战略,基于架构创新、投资全场景处理器族、“有所为有所不为”的商业策略和构建开放生态,继续在计算产业投入。

华为副董事长胡厚崑称,两年前,华为发布了新的愿景使命,就是要“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。

华为认为,智能世界有三个特征,就是万物感知、万物互联、万物智能,要支撑这样一个智能世界,有两个关键的技术需要持续创新和投资:联接和计算。

会上,华为发布全球最快AI训练集群Atlas 900。这款产品汇聚了华为几十年的技术积累,是当前全球最快的AI训练集群。

全球最快的AI训练集群

在大型数据集上进行训练的神经网络架构涵盖从图像识别、自然语?#28304;?#29702;、视频实时分析和智能推荐系?#36710;?#21508;个方面,训练这些神经网络模型需要大量浮点计算能力。

近年来,单个AI处理器算力和训练方法上均取得了重大进步,但是在单一机器上,AI训练所需要的时间仍然长得不切?#23548;剩?#22240;此需要借助大规模分布式AI集群环境来提升神经网络训练系统的浮点计算能力。

此次发布的Atlas 900 AI训练集群由数千颗昇腾910 AI处理器互联构成,是当前全球最快的AI训练集群,代表了当今全球的算力巅峰。其总算力达到256P~1024P FLOPS @ FP16,相当于50万台PC的计算能力。

在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas900只用了59.8秒就完成了训练,这比原来的世界记录还快了10秒。胡厚崑称,这是什么概念?相当于短跑冠军跑完终点,喝完一瓶水才等到第二名。

“我们相信Atlas900的强大算力,可广泛应用于科学研究和商业创新。?#28909;?#22825;文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原来可能花费好几个月的工作,现在交给Atlas900,就是几秒钟的事情。”胡厚崑称。

胡厚崑展示了一张南半球的星空图,这张图上有20万颗?#20999;牽?#29992;人眼是看不见这么多?#20999;?#30340;,这些画面来自于SKA(平方公里阵列射电望远镜)的数据。

当前条件下,天文学家要从这20万颗?#20999;?#20013;,找出?#25345;?#29305;征的星体,相当困难,需要169天的工作量。现在用上Atlas900,只用10秒,就从20万颗?#20999;侵屑?#32034;出了相应特征的星体。

胡厚崑称,为了让大家马上就能用上Atlas900的超强算力,华为已经把它部署到华为云上,并以极优惠的价格向全球科研机构和大学开放,欢迎大家申请使用。

对手是英伟达和谷歌?

在训练方面,目前英伟达独树一?#27169;?#21344;据了大部分市场。

最大玩家英伟达的GPU抓住了计算设?#24863;?#27714;的关键时机,在图形渲染、人工智能和区块链领域的计算表现突出,希望成为真正的算力平台。英伟达在训练方面的代表芯片是Tesla V100。

算法巨头谷歌则另辟蹊径,以ASIC类型的芯片来满足自身训练和推理的需求。具体来看,谷歌的TPU通过脉动阵列(systolic array)这一核心架构来提升算力,2018年发布的TPU3.0版本采用8位低精度计算节省晶体管,速度能加快最高100PFlops(每秒1000万亿次浮点计算)。

此外还有英特尔,他们都推出了自己的AI训练芯片。

8月23日,华为宣布推出自研AI训练芯片昇腾910,以及AI计算框架MindSpore。

华为表示,昇腾 910是全球最快的人工智能处理器,性能是竞争对手英伟达Tesla v100的两倍。

Ascend 910在FP16和IN8下的运算速度分别达到256万亿次和512万亿次,最大功耗为310W。

相比之下,GPU Tesla V100最高?#21830;?#20379;125万亿次浮点运算,最大功耗为300W,而谷歌搭载4个asic的TPU 2.0则可达到180万亿次浮点运算。

业界主流AI训练芯片能力对比

就在华为发布昇腾910的前几天,英特尔发布了两款AI芯片(Nervan神经网络处理器系列)NNP-T和NNP-I。其中,NNP-T用于训练,NNP-I用于推理。在?#23637;?#21019;业公司Nervana后,英特尔终于给出了成绩单。

MindSpore与谷歌的TensorFlow、百度的PaddlePaddle框架并列,明年开源。华为希望借此框架帮助开发者实现一次性开发,并在云网边端?#20132;?#36801;移。

从国内来看,华为MindSpore之外,人工智能框架还有百度的PaddlePaddle、阿里的X-DeepLearning,商汤科技的SenseParrots(?#24418;?#24320;源)。另外,AI大神贾杨清开发了全球知名的深度学习框架Caffe,他今年从Facebook离职,加入阿里。

日前,华为创始人任正非在内部?#19981;?#20013;再次?#24247;?#20102;AI产业的重要性,他表示,5G只是小儿科,人工智能才是大产业,才是华为发展的战略要地。

人类社会未来二三十年最大的推动是人工智能。如果科技是一顶?#20351;冢?#37027;么人工智能将是这顶?#20351;?#19978;的明珠。

华为预测,到2025年全球智能终端将达到400亿,智能助理?#21344;奧式?#36798;到90%,企业数据使用?#24335;?#36798;到86%,智能将像空气一样无处不在。作为一种新的通用目的技术,人工智能将改变每个行业和每个组织。

更多科技生活相关信息,请关注公众号“晓说通信”(ID:txxxbwz)

0

一周热门

拳皇98ol终极之战火焰流格斗家