工业和信息化部主管 中国电子报社主办
收藏本站 投稿

半导体

100分钟161次提“AI”,英伟达黄仁勋又放大招

英伟达 小.jpg

3月22日晚11点,英伟达CEO黄仁勋在GTC大会上又演讲了,演讲地点从自家厨房搬到了公司。此次演讲,老黄将关注的重点聚焦在“AI”上。100分钟的演讲共提及161次“AI”,从英伟达当前支持的 AI应用,到更支持AI技术实现的处理器,再到英伟达提供的AI平台Omniverse。看来老黄这次是打算跟AI死磕了。

天气预报AI模型提前一周预测灾难性天气

“传统的数值模拟需要一年的时间,而现在只需要几分钟。”黄仁勋介绍称,英伟达与包括加州理工学院、伯克利实验室在内的多家科研机构合作开发的FourCastNet的天气预报AI模型,将能够预测飓风、极端降水等天气事件。黄仁勋称,FourCastNet由傅里叶神经算子提供动力支持,基于10TB的地球系统数据进行训练。依托这些数据,以及 NVIDIA Modulus 和 Omniverse,可实现提前一周预测灾难性极端降水的精确路线。

GTC 3.png

不仅是在极端天气愈加频繁的情况下发挥作用,英伟达的产品也使因疫情而愈加普遍化的在线办公更加智能化。配合在线会议的发展,黄仁勋在演讲中正式发布NVIDIA Riva。这是一种先进且基于深度学习的端到端语音AI,可以自定义调整优化,已经过预训练,客户可以使用定制数据进行优化,使其学习特定话术,以应对不同行业、国家和地区的需求。

另一种为应对在线办公而生的SDK(Software Development Kit,软件开发工具包)Maxine,也在黄仁勋此次视频演讲中呈现。这是一个AI 模型工具包,目前已拥有 30 个模型,可以帮助用户在参与线上会议的时候与所有人保持眼神交流,即便是正在读稿也不会被发现,还能实现语言之间的实时翻译。

“搭积木”技术建成AI工厂

“这是全球 AI 计算基础架构引擎的巨大飞跃,隆重推出 NVIDIA H100”。在演讲中,黄仁勋再次推出新产品。H100采用 TSMC 4N 工艺,具有 800 亿个晶体管,是首款支持 PCIe 5.0 标准的 GPU,也是首款采用 HBM3 标准的 GPU,单个H100 可支持 40 TBps 的 算力。从另一个角度来说,20块 H100 GPU 便可承托相当于全球互联网的流量。Hopper架构相较于前一代Ampere架构实现了巨大飞跃,其算力达到4 PetaFLOPS 的 FP8,2 PetaFLOPS 的FP16,1 PetaFLOPS 的 TF32,60 TeraFLOPS 的 FP64 和 FP32。H100 采用风冷和液冷设计,据黄仁勋介绍,这是首个实现性能扩展至 700 瓦的 GPU。在 AI 处理方面,Hopper H100 FP8 的 4 PetaFLOPS算力是 Ampere A100 FP16 的 6 倍。

GTC4.png

不仅注重速度和算力,H100也注重数据使用的安全性。

“通常,敏感数据处于静态以及在网络中传输时会进行加密,但在使用期间却不受保护。”黄仁勋假设了一个场景,若一家公司具有价值数百万美元的AI模型,而在使用期间不受保护,则该公司将面临着巨大的数据风险。他声称,Hopper 机密计算能够保护正在使用的数据和应用,能够保护所有者的 AI 模型和算法的机密性和完整性。此外,软件开发者和服务提供商可在共享或远程基础架构上分发和部署宝贵的专有 AI 模型,在保护其知识产权的同时扩展业务模式。

黄仁勋隆重发布的全新AI计算系统DGX H100展现出英伟达像搭积木一样拓展处理器性能的技术。借助 NVLink 连接,DGX 使八块 H100 成为了一个巨型GPU:拥有6400 亿个晶体管,具备32 PetaFLOPS的 AI 性能,具有640 GB HBM3 显存以及 24 TB/s 的显存带宽。

仅仅连接GPU还不够过瘾,英伟达“搭积木”的技术可以再将8块GPU连接成的DGX进行连接。黄仁勋推出NVIDIA NVLink Switch 系统,借助 NVLink Switch 系统,计算系统可扩展为一个巨大的拥有 32 个节点、256 个 GPU 的 DGX POD, HBM3 显存高达20.5 TB,显存带宽高达 768 TB/s。每个 DGX 都可借助 4 端口光学收发器连接到 NVLink Switch,每个端口都有 8 个 100G-PAM4 通道,每秒能够传输 100 GB数据,32 个NVLink 收发器可连接到 1 个机架单元的 NVLinkSwitch 系统,以此实现超强的拓展性。

GTC 5.png

黄仁勋称英伟达正在建造 EOS——英伟达打造的首个 Hopper AI 工厂。搭载18 个DGX POD、576 台 DGX、4608 个 H100 GPU。在传统的科学计算领域,EOS 的速度是 275 PetaFLOPS,比 A100 驱动的美国速度最快的科学计算机 Summit 还快1.4倍。在AI方面, EOS 的 AI 处理速度是 18.4 ExaFLOPS,比全球最大的超级计算机——日本的 Fugaku 快 4 倍。

从H100到使用8块H100 构成的AI计算系统DGX H100,再到使用256个GPU的DGX POD以至于HopperAI工厂,英伟达像搭积木一样,构建起一套辅助AI计算的硬件系统。

与英特尔打擂台的Grace有望明年供货

在去年的GTC大会上,英伟达推出了首颗数据中心CPU——Grace。按照英伟达的介绍,这是一颗高度专用型处理器,主要面向大型数据密集型 HPC 和 AI 应用。与英特尔CPU坚守的X86架构不同, Grace另起炉灶采用ARM架构。黄仁勋声称,服务器用上这款CPU后, AI性能将超过x86架构CPU的10倍。这套言论无疑将使用Arm的Grace与使用x86架构拉起了擂台。

GTC 6.png

此次GTC大会,黄仁勋称Grace 进展飞速,有望明年供货。不止于此,老黄将“搭积木”技术继续应用在了Grace技术上。通过Grace与Hopper连接,英伟达打造了单一超级芯片模组Grace-Hopper。黄仁勋称Grace-Hopper 的关键驱动技术之一是内存一致性芯片之间的 NVLink 互连,每个链路的速度达 900 GB/s。Grace CPU 也可以是由两个通过芯片之间的 NVLink 连接、保证一致性的 CPU 芯片组成的超级芯片,可拥有144个CPU核心,内存带宽高达 1 TB/s。

接着,老黄给出了Grace 和 Hopper能够打造的不同排列组合方案:2 个 Grace CPU 组成的超级芯片;1 个 Grace 加 1 个 Hopper 组成的超级芯片;1 个 Grace 加 2 个 Hopper 的超级芯片;搭载 2 个Grace 和 2 个 Hopper 的系统;2 个 Grace 加 4 个 Hopper 组成的系统;2 个Grace 加 8 个 Hopper 组成的系统等。

“老黄”与“小黄”的对话透露出何种玄机

老黄的这次发布会,再次请出了英伟达仿照自己的形象设计的虚拟人——Toy Jensen。而这次,虚拟人Toy Jensen出现的主要目的,是展示英伟达用于构建虚拟形象或数字人框架的Omniverse Avatar。

GTC 7.png

在Toy Jensen完成过一轮百科功能展示之后,兴致勃勃地站在老黄对面展示起了自己的出生地——Omniverse Avatar。这是一个基于 Omniverse 平台构建的框架,用户可以快速构建和部署虚拟形象。“小黄”Toy Jensen的声音、面部均由英伟达的系列工具提供。“小黄”的声音由 Riva 的文本转语音 RADTTS 合成,Omniverse 动画的动画图形可定义并控制其动作, Omniverse Audio2Face 可驱动其面部动画。NVIDIA 的开源材质定义语言 (MDL) 可增加触感,使“小黄”的衣服看起来更有合成皮革的视觉感受,而不仅仅是塑料。最终,“小黄”的形象通过 RTX 渲染器能以实时高保真的程度呈现。得益于 Riva 中的最新对话式 AI 技术和 Megatron 530B NLP 模型,“小黄”得以与真人进行对话。不仅如此,归功于一款使用 Omniverse Avatar 构建的应用Tokkio ,“小黄”还能连接到更多类型的数据,它将客户服务 AI 引入零售店快餐餐厅,甚至网络。

责任编辑:姬晓婷


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2022年全国两会

北京3月5日电 第十三届全国人民代表大会第五次会议5日上午在北京人民大会堂开幕。近3000名全国人大代表肩负人民重托出席大会,认真履行宪法和法律赋予的神圣职责。人民大会堂万人大礼堂气氛隆重热烈,主席台帷幕正中的国徽在鲜艳的红旗映衬下熠熠生辉。

2021年中国家电市场报告

3月3日,中国电子信息产业发展研究院(又称赛迪研究院) 发布了《2021年中国家电市场报告》(以下简称《报告》)。《报告》显示,2021年,我国家电市场全面复苏,零售规模达到8811亿元,同比增长5.7%,整体基本恢复至疫情前2019年的水平。

落实工作会精神 推动高质量发展

2022年要聚焦制造强国和网络强国建设目标,把工业稳增长摆在最重要的位置,统筹推进强链补链、技术攻关、数字化转型和绿色低碳发展,加大对中小企业支持,提升信息通信服务供给能力。工业和信息化部政务新媒体“工信微报”推出“落实工作会精神 推动高质量发展”栏目,刊发工信系统2022年工作新思路,敬请关注。

2022年全国工业和信息化工作会议

12月20日,全国工业和信息化工作会议在北京以视频形式召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届历次全会精神及中央经济工作会议精神,认真贯彻落实党中央、国务院决策部署,总结2021年工作,分析当前形势,部署2022年重点任务。

新思想引领新征程·红色足迹

党的十八大以来,习近平总书记在地方考察调研时多次到访革命纪念地,强调要从中国革命历史、优良传统和精神中汲取养分。追寻红色足迹,感悟初心使命。即日起,本报推出“新思想引领新征程·红色足迹”专栏,跟随习近平总书记的红色足迹,访当事人、忆当年事,重温总书记的重要论述和重要指示精神,生动回顾红色圣地光荣的革命历史、优秀的革命传统...

世界超高清视频(4K/8K)产业发展大会

会议

2021世界VR产业大会云峰会

10月19日—20日,由工业和信息化部和江西省人民政府共同主办的2021世界VR产业大会云峰会在南昌举办。国务委员王勇出席大会开幕式并发表讲话,江西省委书记易炼红,工业和信息化部副部长王志军,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2021世界显示产业大会

6月17日,由工业和信息化部、安徽省人民政府共同主办的2021世界显示产业大会在合肥市开幕。安徽省委书记李锦斌出席开幕式并宣布大会开幕,安徽省省长王清宪、上海合作组织秘书长弗拉基米尔·诺罗夫、工业和信息化部副部长王志军出席开幕式并先后致辞。

2021世界超高清视频(4K/8K)产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2021世界超高清视频(4K/8K)产业发展大会在广州召开。5月9日,广东省委书记李希出席开幕式,工业和信息化部部长肖亚庆、广东省省长马兴瑞、国家广播电视总局副局长孟冬、中央广播电视总台编务会议成员姜文波出席开幕式并致辞。

CITE2021第九届中国电子信息博览会开幕论坛

4月9日,第九届中国电子信息博览会(简称CITE2021)在深圳举办。深圳市人民政府市长陈如桂、广东省人民政府副秘书长陈岸明、工业和信息化部电子信息司司长乔跃山出席开幕式并先后致辞。

2020世界显示产业大会

11月20日,由工业和信息化部、安徽省人民政府共同主办的2020世界显示产业大会在合肥市举行。在开幕式上,工业和信息化部部长肖亚庆、韩国驻华大使张夏成发表视频致辞。安徽省委副书记、省长李国英,工业和信息化部副部长王志军出席开幕式并致辞。

世界显示产业大会

本周排行