投资AI人工智能_ 腾讯投资的AI芯片公司仅20个月打造的云端训练芯片如何?

AI技术是保持大型企业领先的关键之一,各领域的大型企业,特别是科技大型企业,往往在AI上投资很多,但他们很快就会面临问题,芯片的计算能力不能满足AI算法的需求。 因此,国外谷歌、亚马逊、国内百度、蚂蚁开始独自开发AI芯片。

值得注意的是,公开资料显示,腾讯投资在去年8月前揭露了对AI芯片的投资,当时燧原科技宣布在腾讯领投的Pre-A回合中获得了3.4亿元人民币投资。 本周三,隋原科技发布首个云训练芯片,该芯片从开发到开始批量生产仅需20个月时间,根据该芯片云T10快递卡的单精度计算能力达到20 TFLOPS,是业界最强的。

但是,燧原科学技术最早的芯片和速力卡云燧T10的发表只是创业成功的起点。

燧原科技CEO赵立东

挑战AI云芯片市场的勇气

纵观当今的芯片市场,成功的芯片公司背后有着非常强大的生态,尤其是在高性能的计算领域,生态的重要性更加明显。 因此,即使新的AI热引起芯片行业的罕见创业热,选择边缘AI芯片也是因为与云AI芯片相比,技术难度较低,可以避免云AI芯片垄断的市场结构。

燧原技术明显是罕见的云AI芯片创业公司。 为什么敢于挑战云AI芯片,隋元科学技术的赵立东CEO在发表会上表示,我们的自信来源于天、地之利、人与和。 天天CPU、GPU生态成熟,切入困难,但深度学习爆发性发展仅7年,这是一个更开放的战场,有更大的发展空间。 地利现在是制作AI高端芯片的黄金时代,中国有广泛的应用、人口红利、大量数据、市场机会,国家政策领先,资本支持。 人和在上海近20年来集成电路领域积累了大量集成电路人才的同时,上海在AI领域的发展能够提供成熟的算法、软件和架构人才也是隋原科学技术选择上海的重要原因。

针对这个问题,隋原科学技术的创始人、COO张亚林接受雷锋采访时,隋原高举小费是我们CEO决定的,这包含着我们的国家感情,希望能够选择创业。 AI发展的一大挑战是模型不足,而新模型被国外大公司如谷歌掌握,其中重要的是TPU。 我们希望提供更强的计算能力,让中国人也拥有更多的AI模型。

燧原科学技术创始人兼COO张亚林

不容忽视,两位重要创始人的经验也很重要。 CEO赵立东本科毕业于清华大学电子工程系,之后获得美国犹他州立大学电子和计算机系硕士学位。 2007年加入AMD,担任计算部高级总监、产品工程部高级总监,负责CPU/GPU/APU和多个相关核心IP的研发,团队规模超过千人,参与了中国研发中心的建立。

COO张亚林也是AMD的一员,他本科毕业于复旦大学电子工程系,比赵立东晚一年加入AMD,担任资深芯片经理、技术总监,在AMD上海研发中心拥有微软XBOX-ONE系列主芯片、融合芯片APU等全球性芯片

2014年赵立东离开AMD加入紫光通信技术集团副总裁,2015年3月兼任紫光集团锐迪科微电子公司总裁,2017年3月兼任紫光集团副总裁。 张亚林决定和赵立东一起创业后离开AMD。

雷锋网认为,两个核心的创立成员都是在技术背景下诞生的,通过在AMD中积累丰富的经验,不仅可以判断市场对AI芯片的需求,而且有信心挑战AI云芯片。

首张云AI快递卡的单精度性能是世界上最高的

目前认为燧原科技融资和产品都很顺利。 隋原科技2018年3月19日在上海注册成立,1个月后完成了2400万元的种子贷款,开始了第一批云训练芯片的开发。 同年7月,完成了腾讯战略领域投资的3.4亿元人民币Pre-A回合融资。

即使在资本寒冷的冬天,今年5月,燧原科技也获得了红点投资于中国基金的3亿元a回合融资。 月球上有好消息,第一笔小费按计划穿越时间。

2018年4月至2019年9月芯片亮起开始硬件和软件联动,隋原技术仅14个月,产品正式发布和批量生产仅20个月。

因为大型CPU和GPU从设计到批量生产通常需要3年以上。 隋原科技之所以能够从设计到批量生产快速完成复杂芯片,是因为该团队拥有大量的处理器专家。 张亚林说,我们队现在有207人,其中大多数是从2000年开始设计处理器,经验丰富。 但是,从芯片的设计到批量生产之所以能够迅速实现,是因为团队文化非常同步,大家的目标是尽快落地批量生产,每个设计指标都受到严格的控制。

张亚林认为,能这么快发售云训练芯片是个奇迹。 因为这个芯片是从零开始设计的。

“DTU体系结构非常创新,我们最核心的处理器体系结构不是我们设计的,而是受专利保护。”张亚林介绍。

此外,基于可重构芯片的设计理念,DTU包括32个通用扩展神经元处理器( SIP ),并且将每8个SIP耦合至一个扩展智能计算单元( SIC )。 SIC之间通过HBM实现高速互连,通过片上调度算法,数据在传输中完成计算,最大限度地提高SIP利用率。

“端到端可重建的功耗较低,应用程序通常可以轻松移植。 云的可重构性通过使整个数学计算成为可编程指令集和可控管线来重构数学计算模型,从而保证了芯片的通用性,并且还适用于快速迭代的AI算法。 张亚林进一步说明。

最后,隋原技术基于辉煌12nm FinFET技术,集成了141亿个晶体管,芯片面积为480平方毫米,采用了先进的2.5D封装。 基于DTU的云燧T10也表现得很粗俗

最强计算能力:单精度( FP32 )下的计算能力20TFLOPS; 在半精度和混合精度( BF16/FP16 )下,运算能力为80TFLOPS,最大功耗为225W,能力比领先

模型共通:支持CNN、RNN、LSTM、BERT等常用人工训练模型,可用于图像、流数据、语音等训练场景

高速互联:采用隋原ESL互联技术,满足e级数据中心规模的部署需求

接口兼容性:与标准PCIe接口、主流AI服务器的广泛兼容性

生态开放:支持主流深层次的学习框架,通过SDK提供深层次的定制。

为了应对云数据中心大型训练集群的挑战,张亚林创造性地提出了200GB双向ESL互连技术,在1024个节点的集群规模中训练的线性度达到了86%。 与InfiniBand网络相比,使用相同的互连带宽可以显着降低网络的复杂性和成本。 云燧T10将于2020年第1季度发售。

云燧T10的性能是什么水平简单比较的话,友商同级的最新旗舰卡的单精度运算能力是16.4TFLOPS,云燧T10单卡的单精度运算能力是20TFLOPS。 友商旗舰的耗电量为250W,云燧T10的最大耗电量为225W。 ResNeT-50机型的Benchmark无论是FPS还是FPS/W云燧T10,都比友商旗舰性能优越。

以更小的芯片面积实现更高的成本以及以更高的每瓦计算能力实现更高的有效计算能力,这也是业界越来越关注的AI芯片指标。

市场战略关系到成败

尽管更高效的计算能力确实能吸引客户,但获得用户的易用性和迁移成本也很重要。 在产品层面,隋原科技在推出硬件产品的同时,还推出了软件平台的管理计算,目前已经完全支持TensorFlow,明年上半年支持PyTorch、MXNet、ONNX等主要深层次的学习框架,完全控制 提供调试、协调工具链,在硬件级开放SDK,为深度开发人员提供细粒度计算能力编程接口。

赵立东在接受采访时说,我们建立了最基础的TensorFlow堆栈,但是要提供完全方便使用、友好的界面和工具,不能一朝一夕,需要更长的时间。

在不断完善软件平台的同时,有独特的方法可以无缝地转移燧原技术。 赵立东表示,在热启动即产品开发过程中,与行业合作伙伴进行技术交流和项目合作,将市场需求融合到产品开发过程中。 这样可以在实际场景中使产品更快落地。

据张亚林介绍,我们与客户有限接触时,首先要适应他们的主要模式和业务形态,从他们的业务模式中进行泛化和提取,通过交流得到很多信息,然后适应,客户变得容易过渡。

但是,对于燧原科技这家创业公司来说,在精力有限、面对强有力的竞争对手时,战略和合作伙伴的选择是很重要的。 燧原科技选择的早期客户都是可以支持现有产品的合作伙伴。

据赵立东介绍,目前,我们已经与腾讯通用人工智能应用场景项目开展了密切合作,将来还会扩大到AI应用场景。

隋元选择云服务公司、传统领域的行业服务公司、AI超计算中心、智慧城市为合作伙伴。 赵立东说,三个方向可能的伙伴。 我们希望合作伙伴和纯粹的供应商和客户的关系,而不是一起深入合作,为他们深入定制。 在这一点实现破冰的突破,从点到点,从点到线,从线到面扩大。

深度定制也是隋原技术进入云AI芯片市场的战略。 赵立东说:“在垄断市场上,所有顾客都希望有新的选择,因此他们有一点谈判能力,市场就有这样的痛苦。 除此之外,我们还在寻求更高的性价比和能源效率,特别是在落地场景中能够实现的有效性能。”

“科技公司希望在竞争中不同,要想取得更好的成绩就需要区别化。 但是在垄断市场,想要的技术支持非常有限,差别化的实现也受到限制。 因此,我们希望与客户密切合作,实现客户差异化,”赵立东进一步说。

然而,随着AI模型的成熟,市场云AI培训需求的增长率降低,云AI推理的市场规模迅速增长,预计2022年将超过培训市场。 与此相对,赵立东,云AI训练的需求不会下降,因为价格的原因还有很多公司没有进入,这也是我们最初发表的云训练小费的原因,这是市场上最紧迫的需求,也是最大的量。 将来还会推出云推理芯片,但由于推理比培训芯片对功耗和成本更加敏感,因此也要慎重选择市场的切入点。

雷锋网的总结

隋原科技成立于2018年的资本冬季,不仅融资不受影响,还成为当前腾讯投资的AI芯片创业公司。 其重要原因是腾讯提出的产品热启动概念与隋原科技创始人的理念不符。 作为少数云AI培训芯片的创业公司,隋原科学技术从产品开发到批量生产仅仅20个月,是创业团队实力的体现,当然其执行力也非常充分。

但是性能参数清晰的芯片发布和批量生产是AI芯片才刚刚开始公司的成功,燧原科技经济高效、节能的硬件、持续完善的软件平台、差异化和定制的市场战略更多

向云AI培训芯片市场挑战是困难的,风险很大,但云T10的发布给中国AI的发展带来了信心。

大家都在看

相关专题