工业和信息化部主管 中国电子报社主办
收藏本站 投稿

半导体

CPU上跑AI,可以很“香”

随着AI大模型的参数规模不断扩大,其对算力的需求也在急剧提升。为了满足这一需求,各行各业都在积极研发和建设大规模的算力基础设施,导致多种专用AI加速芯片处于供不应求状态,不仅采购困难且成本高昂。因此,一些企业将目光转向目前最为普及的硬件产品——CPU(中央处理器)。近日,第五代英特尔至强可扩展处理器的出现,让业内再一次看到,利用CPU同样能提升AI的工作效率,在CPU上跑AI,也可以很“香”。

640-24.png

CPU在AI领域的新使命
据了解,与训练相比,AI推理对算力资源的需求相对较小,对于一些推理任务较轻的业务或行业来说,相比专业的AI加速芯片,选择CPU更具成本效益。同时,由于CPU是目前最为普及的硬件,因此大多数企业都乐于利用部署更为广泛、基于CPU的IT基础设施和架构,避免异构平台的部署难题。在传统架构中引入AI加速,是CPU在这个时代的新使命。
第五代英特尔至强可扩展处理器应运而生。该处理器的核心数量增加至64个,配备了320MB的L3缓存和128MB的L2缓存。不论单核性能还是核心数量,相比上一代处理器都有了明显提升。在相同功耗下,第五代至强可扩展处理器平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近3倍。
同时,第五代至强可扩展处理器的每个内核均具备AI加速功能,与上代相比,其训练性能提升29%,推理能力提升42%。

640-25.png

在AI负载处理能力方面,第五代至强可扩展处理器也有明显提升。从第四代至强可扩展处理器开始,就引入了英特尔高级矩阵扩展(英特尔AMX)作为内置AI加速引擎,这一创新使得CPU能够更高效地处理AI工作负载。五代至强中还同样内置了英特尔AVX-512指令集,配合运行速度更快的内核和速度更快的内存,进一步提升了AI性能,使得生成式AI无需独立的AI专用加速器即可执行更多工作负载。通过在自然语言处理推理方面的性能飞跃,它能更好地帮助企业支持智能助手、聊天机器人、预测性文本、语言翻译等工作负载的响应速度。采用该处理器之后,开发者能够推理和调优多达200亿参数量的大语言模型,且在运行参数量低于200亿模型的响应时延不超过100毫秒。
为云服务厂商保驾护航
生成式AI的爆发在给云计算产业带来全新机遇的同时,也带来了挑战。由于大模型需要庞大的算力支持,云厂商需要尽快升级数据中心算力以应对AI需求,并持续降低TCO(总拥有成本),为用户提供价格合理的算力资源。此外,AI应用开发还涉及大量隐私敏感数据的云端存储和使用,云厂商需要对已有硬件基础设施进行更新换代,以保障这些数据的安全可靠,打消用户的后顾之忧。
第五代英特尔至强可扩展处理器从软硬两方面来为云服务厂商搭建良好的生态环境。在硬件方面,通过英特尔SGX/TDX解决方案为云端数据提供端到端的硬件级防护能力。在软件方面,英特尔已经在Pytorch、Tensorflow和OpenVINO工具套件的行业标准框架中提供了针对第五代至强可扩展处理器的优化,使得云厂商和用户能够以较低的门槛,快速利用如英特尔AMX等处理器功能,打通AI应用的算力瓶颈。

640-26.png

第五代英特尔至强可扩展处理器如同一个强大的后盾,为云服务厂商提供了坚实的算力支持。它不仅降低了运营成本,还为数据安全筑起了一道坚固的屏障。更重要的是,它优化了AI应用开发,让云服务厂商也能体会到在CPU上跑AI的“香甜”。
企业开启“尝鲜”模式
英特尔CEO帕特·基辛格在2023英特尔ON技术创新大会中曾表示:“在这个人工智能技术与产业数字化转型飞速发展的时代,英特尔保持高度的责任心,助力开发者,让AI技术无处不在,让AI更易触达、更可见、透明并且值得信任。”
据了解,数据中心如今有70%的推理运行采用英特尔至强可扩展处理器。随着第五代至强可扩展处理器的诞生,一些企业开启了“尝鲜”模式,其产品也在AI性能方面有明显提升。
11.11期间,京东云便通过基于第五代英特尔至强可扩展处理器的新一代服务器,成功应对了业务量激增,与上一代服务器相比,整机性能提升达123%,AI计算机视觉推理性能提升至138%,Llama 2推理性能提升至151%。轻松 hold 住用户访问峰值同比提高170%、智能客服咨询量超14亿次的大促压力。

640-27.png

基于第五代英特尔至强可扩展处理器,火山引擎第三代弹性计算实例整机算力提升了39%,应用性能最高提升了43%。在性能提升的基础上,火山引擎已通过其独有的潮汐资源并池能力,构建百万核弹性能资源池,能够以近似包月的成本提供按量使用体验,降低上云成本。
使用第五代至强可扩展处理器的内置加速器时,可将每瓦性能平均提升10倍,能耗低至105W,同时还能运行针对工作负载优化的高能效SKU。

640-28.png

在搭载第五代英特尔至强可扩展处理器及其内置的英特尔AMX、英特尔TDX加速引擎后,阿里云打造了“生成式AI模型及数据保护”的创新实践,使第8代ECS实例在安全性和AI性能上都获得了显著提升,且保持实例价格不变,普惠客户。
包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。

640-29.png

如果将数据中心比喻为巨型计算机,那么CPU就是其“大脑”。第五代英特尔至强可扩展处理器作为“超级大脑”,对于数据中心的高效运行和AI应用的实现都起着至关重要的作用。
AI落地的时代开始了,CPU的“春天”也要来了。

责任编辑:沈丛


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2023中国电子报编辑选择奖

12月26日,“2023中国电子报编辑选择奖”获奖名单正式出炉。本次评选采用企业自荐和编辑推荐两种方式,综合考量影响力、创新性、成长性等多个维度,围绕企业、技术、产品、解决方案等赛道评出20个奖项。

2024年全国工业和信息化工作会议

12月21日,全国工业和信息化工作会议在京召开。会议坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大和二十届二中全会精神,深入学习贯彻习近平总书记关于新型工业化的重要论述,认真落实中央经济工作会议和全国新型工业化推进大会部署要求,总结2023年工作,部署2024年任务。

深入学习贯彻党的二十大精神·工信系统在行动

当前,全国工业和信息化系统正进一步深入学习党的二十大精神,将二十大精神贯彻落实到具体举措和实际行动。为深入学习宣传贯彻党的二十大精神,中国电子报推出“深入学习贯彻党的二十大精神·工信系统在行动”专栏,通过调研采访报道各地贯彻落实党的二十大精神的具体举措、典型案例,反映各地实干担当、求真务实的精神风貌。敬请关注。

学习贯彻习近平新时代中国特色社会主义思想主题教育

学习贯彻习近平新时代中国特色社会主义思想主题教育开展以来,全国工信系统牢牢把握“学思想、强党性、重实践、建新功”的总要求,多措并举扎实推进主题教育高质量开局、高标准起步。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

世界超高清视频(4K/8K)产业发展大会

会议

2023全球数字贸易创新大赛

11月22—23日,2023全球数字贸易创新大赛总决赛在杭州举行。大赛是第二届全球数字贸易博览会重要活动之一,今年为首次举办。大赛设置人工智能元宇宙和区块链Web3.0两个赛道,吸引了近200家优秀企业及项目团队参与,其中,100余家入围半决赛,24家进入总决赛。

2023世界VR产业大会

10月19日,由工业和信息化部、江西省人民政府共同主办的2023世界VR产业大会在江西南昌开幕。江西省委书记、省人大常委会主任尹弘,工业和信息化部副部长徐晓兰,江西省委常委、南昌市委书记李红军出席开幕式并致辞。开幕式由江西省委副书记、省政府省长叶建春主持。

2023世界显示产业大会

9月7日-8日,由四川省人民政府、工业和信息化部主办的2023世界显示产业大会在四川省成都市召开。四川省委副书记、省长黄强,工业和信息化部党组成员、副部长张云明,重庆市政府党组成员、副市长江敦涛,德国联邦经济发展和对外贸易协会主席米夏埃尔·舒曼出席开幕式并先后致辞。

2023世界超高清视频产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2023世界超高清视频产业发展大会在广州召开。5月9日,广州市委副书记、市长郭永航,中央广播电视总台副台长胡劲军,国家广播电视总局副局长朱咏雷,工业和信息化部总工程师赵志国,广东省委副书记、省长王伟中出席开幕式并先后致辞。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

世界显示产业大会

本周排行