工业和信息化部主管 中国电子报社主办
收藏本站 投稿

人工智能

英伟达CEO黄仁勋:我们正处于AI的“iPhone时刻”

3月21日晚,英伟达创始人兼CEO黄仁勋再次穿着标志性的皮衣亮相,并在2023年的GTC大会上进行了主题演讲,介绍并发布了适用于节能加速数据中心的新芯片Grace和BlueField-3、让计算光刻变得更“聪明”的cuLitho技术、正在生产中的“现代化AI工厂”-NVIDIA DGX H100 AI超级计算机(以下简称DGX)以及通过一个浏览器就可以将DGX即时地接入每家公司的NVIDIA DGX Cloud。而最让人印象最深刻的,就是黄仁勋在本次演讲中多次提出的全新概念:“我们正处于AI的‘iPhone时刻’”。

黄仁勋介绍,所谓AI的“iPhone时刻”,即AI技术正在迎来爆发式增长,将成为数十年来最有前途的技术领域之一。因此,在此次GTC 2023上,英伟达发布了多款针对AI的最新技术。

让计算光刻变得更“聪明”的cuLitho

首先,英伟达在GTC会议上发布了cuLitho,该项技术是计算光刻领域的一项突破,能够用于先进制程芯片的设计和制造,可以将计算光刻变得更“聪明”,将用时提速至40倍。

黄仁勋介绍,所谓计算光刻就是为芯片生产制作光掩模的技术,掩膜是一种平面透明或半透明的光学元件,上面有芯片加工所需的图案,按照是否需要曝光将图案转移到光刻胶层上。光刻加工过程开始后,通过控制光刻机的曝光和开关操作,可以将光束根据掩膜上的图案进行分割和定位,使得光束只照射到需要曝光的区域,从而将芯片上的图案转移到光刻胶层上,实施芯片光刻。因为每种芯片都要经历多次曝光,所以光刻中使用的掩膜数量不尽相同。NVIDIA H100(台积电4N工艺,800亿晶体管)需要89张掩膜,Intel的14nm CPU需要50多张掩膜。

此前“精雕细琢”的计算光刻依赖CPU服务器集群,而如今,英伟达最新发布的cuLitho,可以实现在500套DGX H100(包含4000颗Hopper GPU)完成与4万颗CPU运算服务器相同的工作量,但速度快40倍,功耗低9倍。可见,GPU加速后,生产光掩模的计算光刻工作用时可以从两周减少到八小时。台积电可以通过在500个DGX H100系统上使用cuLitho加速,将功率从35MW降至5MW,从而替代用于计算光刻的4万台CPU服务器。黄仁勋表示,英伟达将继续与台积电、ASML和Synopsys合作,将先进制程推进到2纳米及更高精度制程。

加速又能降功耗的数据中心芯片Grace

过去的十年中,云计算每年增长20%,成为了价值1万亿美元的巨大行业,大约3000万台CPU服务器完成了大部分的处理工作。但随着摩尔定律的终结,CPU性能的提高也会伴随着功耗增加、碳排放超标等问题,云计算的发展因此受到限制。对此,黄仁勋指出,数据中心应当加速各种工作负载,既可以减少功耗,又可以节省能源,促进新的增长。

为了在云数据中心规模下实现高能效,英伟达推出了Grace。Grace包含72个Arm核心,由超高速片内可扩展的、缓存一致的网络连接,可提供3.2TB/s的截面带宽,Grace Superchip通过900GB/s的低功耗芯片到芯片缓存一致接口,连接两个CPU芯片之间的144个核。内存系统由LPDDR低功耗内存构成,以便在数据中心中使用,它提供可1TB/s的带宽,是目前系统的2.5倍,而功耗只是其八分之一。整个144核Grace Superchip模组的大小仅为5x8英寸,而内存高达1TB。

黄仁勋表示,Grace的性能和能效非常适合云计算应用和科学计算应用,在微服务方面,Grace的速度比最新一代x86 CPU的平均速度快1.3倍,而在数据处理中则快1.2倍,整机功耗仅为原来服务器的60%,云服务提供商可以为功率受限的数据中心配备超过1.7倍的Grace服务器,每台服务器的吞吐量提高25%。在功耗相同的情况下,Grace使云服务提供商获得了两倍的增长机会。

目前Grace正在进行样品调测阶段,华硕、Atos、GB、HPE、QCT Supermicro、Wistron和ZT都在为Grace构建系统。

可以加速云计算平台的BlueField-3

此外,在现代软件定义的数据中心中,操作系统在执行虚拟化、网络、存储和安全任务时,会消耗近一半的数据中心CPU核心和相关功耗。数据中心必须加速每个工作负载,从而降低功耗并释放CPU,给可创造收入的工作负载。

英伟达为此推出的NVIDIA BlueField是一款卸载并加速数据中心操作系统和基础设施软件。据了解,Check Point、思科、DDN、Dell EMC等超过二十个英伟达生态系统的合作伙伴,都在使用BlueField的数据中心加速技术来更高效地运行其软件平台。

目前BlueField-3已投入生产,并被领先的云服务提供商所采用以加速其云计算平台,比如百度、CoreWeave、京东、Microsoft Azure、Oracle OCI和腾讯游戏。

“现代化AI工厂”-NVIDIA DGX H100 AI超级计算机

黄仁勋表示,旗下的NVIDIA DGX H100 AI超级计算机(以下简称DGX)已成为AI领域的必备工具,他曾亲手将全球首款产品交给了OpenAl,自此之后,《财富》杂志评选出的100强企业中,有一半企业已经安装了DGX。

DGX配有8个H100GPU模组,通过NVLINK Switch彼此相连,以实现全面无阻塞通信,协同工作时,就像一个巨型GPU。而8个H100计算网络是AI超级计算机的重要系统之一,400 Gbps超低延迟的NVIDIA Quantum InfiniBand,具有网络内计算功能,可将成千上万个DGX节点连接成一台AI超级计算机。DGX现已全面投入生产。

微软宣布Azure将向其DGX开放私人预览版,Atos、AWS、Cirrascale、CoreWeave、戴尔、Gigabyte、谷歌、HPE、Lambda Labs、联想、Oracle、Quanta和SuperMicro也将很快开放系统和云服务,DGX的市场将获得了显著增长,

一个浏览器就可以接入DGX的NVIDIA DGX Cloud

英伟达还正式推出生成式AI及超级计算云服务——Nvidia DGX Cloud。黄仁勋介绍,该服务允许客户在云端访问其DGX,且用户只需要打开浏览器即可使用,十分简单快捷。目前,这一产品已经在Oracle云基础设施应用,不久也将在Microsoft Azure、Google云平台和其他平台使用。此外,黄仁勋表示,采用英特尔Sapphire Rapids处理器的DGX H100 AI系统已经正在生产中,未来将通过OEM和云服务合作伙伴的搭载的方式来面世。

4款全新生成式AI工作负载的推理平台

此外,英伟达还推出了四款推理平台。分别是适用于AI视频,可提供比CPU高出120倍的AI视频性能,同时能效提高了99%的NVIDIA L4;适用于图像生成,针对图形以及AI支持的2D、视频和3D图像生成进行了优化的NVIDIA L40;适用于大型语言模型部署的NVIDIA H100 NVL;适用于推荐模型的NVIDIA Grace Hopper。

这些平台将NVIDIA的全栈推理软件与最新的NVIDIA Ada、Hopper和Grace Hopper处理器相结合,包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平台针对AI视频、图像生成、大型语言模型部署、推荐系统推理等需求激增的工作负载进行了优化。

黄仁勋表示:“生成式AI的兴起需要更加强大的推理计算平台。生成式AI应用的数量是无限的,它唯一的限制就是人类的想象力。为开发人员提供最强大、灵活的推理计算平台将加快新服务的创造速度,这些新服务将以前所未有的方式改善我们的生活。”

责任编辑:许子皓


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

2023年全国工业和信息化工作会议

1月11日,全国工业和信息化工作会议在北京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,认真贯彻落实中央经济工作会议精神和党中央、国务院决策部署,总结2022年工作,部署2023年重点任务。

第5届中国—东盟信息港论坛

2022年9月16日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、广西壮族自治区人民政府联合主办的第五届中国—东盟信息港论坛将在广西南宁开幕。该论坛主要围绕数字经济发展和智能互联、数据互通、合作互利等开展交流研讨、建言献策,进一步推进互联网经贸服务、人文交流和技术合作。

2022“三品”全国行

为贯彻落实《国务院关于印发扎实稳住经济一揽子政策措施的通知》要求,加快推进数字化助力消费品工业“三品”战略实施,进一步提振消费信心、挖掘消费潜力,巩固增强消费对经济发展的基础性作用,工业和信息化部近期组织开展2022“三品”全国行活动。中国电子报特开辟2022“三品”全国行专栏,报道活动进展、专家观点、政策解读,敬请关注。

2021年中国家电市场报告

3月3日,中国电子信息产业发展研究院(又称赛迪研究院) 发布了《2021年中国家电市场报告》(以下简称《报告》)。《报告》显示,2021年,我国家电市场全面复苏,零售规模达到8811亿元,同比增长5.7%,整体基本恢复至疫情前2019年的水平。

世界超高清视频(4K/8K)产业发展大会

会议

2022世界显示产业大会

11月30日,由四川省人民政府、工业和信息化部主办的2022世界显示产业大会在四川省成都市开幕。全国政协副主席、民革中央常务副主席郑建邦以视频方式出席开幕式并致辞。四川省委书记王晓晖出席开幕式并宣布大会开幕。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

2022世界VR产业大会

11月12日,由工业和信息化部、江西省人民政府共同主办的2022世界VR产业大会在江西南昌召开。国务委员王勇出席大会开幕式并发表重要讲话。江西省委书记、省人大常委会主任易炼红,工业和信息化部党组成员、副部长王江平,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2022CITE第十届中国电子信息博览会开幕峰会

8月16日,第十届中国电子信息博览会(CITE 2022)在深圳举办。深圳市人民政府副市长张华,广东省工业和信息化厅党组成员、副厅长曲晓杰,工业和信息化部电子信息司副司长史惠康出席开幕式并先后致辞。

2021世界VR产业大会云峰会

10月19日—20日,由工业和信息化部和江西省人民政府共同主办的2021世界VR产业大会云峰会在南昌举办。国务委员王勇出席大会开幕式并发表讲话,江西省委书记易炼红,工业和信息化部副部长王志军,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2021世界超高清视频(4K/8K)产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2021世界超高清视频(4K/8K)产业发展大会在广州召开。5月9日,广东省委书记李希出席开幕式,广东省省长马兴瑞、国家广播电视总局副局长孟冬、中央广播电视总台编务会议成员姜文波出席开幕式并致辞。

世界显示产业大会

本周排行