工业和信息化部主管 中国电子报社主办
收藏本站 投稿

半导体

寒武纪7纳米AI训练芯片量产,创始人陈天石却只在朋友圈发了9个字

360截图20210125075120778.jpg

1月21日,寒武纪在官网披露7纳米AI训练芯片思元 290 智能芯片及加速卡、玄思1000智能加速器相关信息,并表示该系列产品去年已经实现规模化出货。该披露信息中有几个关键词:“7nm””量产”“AI训练芯片”。网友评价寒武纪太低调了,其他AI芯片大厂发布一颗7纳米芯片,得开各种发布会让全世界知道,而寒武纪只是在官网披露一下,没有任何其他动作。

异常低调的发布

《中国电子报》记者查看了寒武纪创始人陈天石的微信,他只是于昨天早上9:02分在微信朋友圈发布了一条只有9个字的信息“思元290正式亮相”,转发的是寒武纪公司公众号内容,非常低调。但这并不影响资本市场的敏感嗅觉,昨天寒武纪的股价上涨了17.73%,收报170元。随着寒武纪的训练产品线集中亮相,寒武纪从训练芯片到云、边、端等业务布局已经清晰呈现。

思元290芯片以及这些加速卡为何物?在AI芯片市场处于什么样的地位?对于寒武纪与业界有什么突破价值?

人工智能芯片有很多种分类方法:按功能来说,分为训练芯片和推理芯片;按应用场景来说,分为云端和终端芯片;按照技术架构来说,分为冯诺依曼架构和非冯架构芯片,诸如类脑芯片等。这次寒武纪推出的思元290智能芯片是其首颗训练芯片。为什么要做AI训练芯片? AI训练芯片市场有多大?其红利有多“红”?实际上,看看英伟达公司股价这些年在市场上的“一骑绝尘”,就很好理解。

随着AI算法突飞猛进的发展,越来越多的模型训练需要巨量的算力支撑,才能快速有效实施,可以说算力是人工智能应用取得突破的决定因素。目前,英伟达在全球云端训练芯片市场一家独大,其GPU+CUDA计算平台被认为是最成熟的AI训练方案。此外,还有第三方异构计算平台OpenCL+AMD GPU以及云计算服务商自研加速芯片这两种方案,全球各路芯片厂商基于不同方案,都推出了针对于云端训练的人工智能芯片。

从介绍来看,寒武纪推出的首颗训练芯片思元290,采用台积电7nm制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。相比此前寒武纪推出的思元270芯片,思元290芯片可实现峰值算力提升4倍、内存带宽提高12倍、芯片间通讯带宽提高19倍,可提供更优性能功耗比,以及多 MLU 系统的扩展能力。

产品具有标志性意义

思元290芯片有三大关键亮点。

其一采用7纳米工艺制程。目前能够提供7纳米制程芯片的设计企业,除了海思、英伟达等,寒武纪是少数进入这个阵营的创业企业。赛迪顾问集成电路产业研究中心分析师李秧认为,其工艺水平实现7纳米制程,无论在中国还是全球都是比较领先的,而且支持训练。从技术上看是具有标志性意义的。

思元290问世,网友“无关风月”在相关新闻下评论称:“武纪真是低调,发7nm制程的芯片,居然显得如此的平静。目前英伟达的RTX 30系也才用到7nm制程工艺。”工艺越高意味着复杂度也越高,能集成的晶体管数也越多,这次思元290晶体管数超过了460亿个。

网友“无关风月”提及的英伟达RTX 30系列,是去年9月由英伟达创始人兼CEO黄仁勋在自家厨房发布(黄仁勋最近喜欢在家中厨房举行直播发布会),RTX 30基于8纳米工艺由三星代工,黄仁勋认为RTX架构是英伟达有史以来提升最大的产品迭代。

其二是寒武纪的多芯互联技术MLU-Link™。目前,算法模型复杂度在不断增加,对算力和训练的速度提出了更高的要求,为了构建更强大的计算平台,需要多芯片之间进行互联。而寒武纪最新推出的多芯互联技术,首次用在了思元290芯片上。有了这个技术,多卡矩阵就可以很轻松地链接起来。业内人士认为,每颗思元290的多芯互联总带宽能达到600GB/s,这个数据与世界上最快的卡相当。同时称,寒武纪的mlulink多芯互联技术应用起来很方便,尤其是对于算力中心,高效而简洁。据介绍,寒武纪首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超过4100万亿次每秒(4.1 PetaOPS INT4),一台玄思 1000 计算单元就足以替代一个小型传统超级计算中心。

其三是寒武纪对应用生态的支撑进一步提速。寒武纪称Neuware™提供完善的开发工具包和社区支持,帮助用户在思元290芯片上进行方便、灵活的定制开发及部署工作。

软件平台和工具链是芯片公司构建生态的必备武器,英伟达之所以能够聚集起强大的AI生态,不仅仅是因为其芯片性能强大,与其软件平台和工具链的完善息息相关。某种意义上说,英伟达的“硬实力”得益于其“软”实力,一定也不为过。

寒武纪称,其Neuware™软件栈为思元 290 芯片提供完善的软件及应用生态,支持业界主流的TensorFlow和PyTorch等深度学习框架,用户不需要改变使用习惯,即可在思元 290 芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理。

寒武纪从终端 IP 场景开始,连续推出了寒武纪1A、寒武纪1H、寒武纪1M 系列处理器,其后布局云端智能芯片及加速卡系列产品思元100和思元270,在2019 年推出基于思元 220 芯片的边缘智能加速卡。由此建立起覆盖云边端、训练、推理的产品矩阵,并打造了平台级基础系统软件Cambricon Neuware。这次发布思元290之后,寒武纪的产品布局就实现了“训推一体、端云融合”。短短几年,寒武纪就成为少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业。

财报预测仍将持续亏损

此前,有机构希望邀请陈天石去大型会议做演讲,陈天石婉拒并表示目前希望专注把产品和技术做好。或许,对于芯片公司而言,产品是面对市场的核心之剑,做好产品就是最好的宣传。

寒武纪财报显示,2020年上半年营收8720.34万元,同比下降11.01%,亏损2.02亿元,其中研发费用占营收比重为318.1%,同比增加182.69%;去年前三季度营收1.58亿元,同比上涨42.97%,亏损约3.095亿元,研发费用4.33亿元,同比上涨32.78%。财报称,公司预测四季度仍将持续亏损,主要系公司目前仍属于大规模研发投入阶段。

现在是芯片企业最好的时代。埋头苦干,给出更优的产品,或许是芯片企业迎接这个时代最好的姿态。

责任编辑:赵强


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2021年全国两会

3月5日,第十三届全国人民代表大会第四次会议在北京人民大会堂开幕。党和国家领导人习近平、李克强、汪洋、王沪宁、赵乐际、韩正、王岐山等出席,栗战书主持大会。初春的北京,处处生机盎然。第十三届全国人民代表大会第四次会议5日上午在人民大会堂开幕。近3000名全国人大代表肩负人民重托出席大会,认真履行宪法和法律赋予的神圣职责。

2021年全国工业和信息化工作会议

12月28-29日,全国工业和信息化工作会议在京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,认真落实习近平总书记重要指示批示精神和中央经济工作会议部署,总结2020年工业和信息化工作,分析形势,部署2021年重点工作。工业和信息化部党组书记、部长肖亚庆作工作报告。

2020年中国家电市场报告

3月22日,中国电子信息产业发展研究院发布了《2020年中国家电市场报告》(以下简称《报告》)。《报告》显示,2020年,我国家电市场零售额规模达到8333亿元,在疫情冲击之下显示出较强的韧性;电商渠道对家电零售的贡献率首次超过50%,网络零售对家电消费的促进作用进一步提升;高端产品、生活家电大幅增长,有效促进了消费升级和产业转型。

世界超高清视频(4K/8K)产业发展大会

会议

2020世界显示产业大会

11月20日,由工业和信息化部、安徽省人民政府共同主办的2020世界显示产业大会在合肥市举行。在开幕式上,工业和信息化部部长肖亚庆、韩国驻华大使张夏成发表视频致辞。安徽省委副书记、省长李国英,工业和信息化部副部长王志军出席开幕式并致辞。

2020世界超高清视频(4K/8K)产业发展大会

11月2日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2020世界超高清视频(4K/8K)产业发展大会在广州市召开。广东省委书记李希出席开幕式,省长马兴瑞出席并致辞。国家广播电视总局局长聂辰席、工业和信息化部副部长王志军、中央广播电视总台副台长蒋希伟出席开幕式并致辞。

2020世界VR产业大会云峰会

10月19日—20日,由工业和信息化部、江西省人民政府主办的2020世界VR产业大会云峰会在南昌举行。在10月19日的开幕式上,中共中央政治局委员、国务院副总理刘鹤发来书面致辞。江西省委常委、南昌市委书记吴晓军,工业和信息化部副部长王志军,江西省委书记、省人大常委会主任刘奇先后致辞。开幕式由江西省委副书记、省长易炼红主持。

世界显示产业大会

本周排行