工业和信息化部主管 中国电子报社主办
联系合作 投稿

人工智能

大模型效率的关键是框架层和模型层协同优化

近日,《AI大模型技术能力评估报告2023》发布。百度文心大模型3.5以12项指标的7个满分,综合排名第一。其中,代表基础能力的算法模型和代表产业应用情况的行业覆盖两项重要指标,百度皆获得满分。

百度AI技术生态总经理马艳军表示,通用大模型是行业大模型的底座和基础。如果没有通用大模型作为基础,只是泛泛去讲行业大模型,实际上与以前的普通模型没有本质区别,无法带来质的飞跃。

谈起大语言模型,大家通常会感知到它能理解我们说的话,可以进行多轮对话,且有逻辑性。能理解、有逻辑、会推理,这些都是很客观的能力,是具备理性思考的能力;同时,大模型还让人们觉得它能创作,有文采。未来大语言模型的能力还会进一步突破数实的边界,产生更大的价值。而这些都是大语言模型核心技术的突破带来的改变。

马艳军认为,要想真正建好一个行业大模型,通用的底座模型能力是基础和根本。如果没有通用模型,只是一个细分场景一个细分场景地分别开发,就回到了原来打造普通模型的起点,难以实质性降低AI落地应用的门槛。

以文心一言为例,文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。文心一言的底座模型是文心大模型。2019年,百度推出文心大模型1.0,然后持续演进到2.0、3.0版本,今年5月份升级到3.5版本。通过飞桨深度学习平台与文心大模型的协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

业内普遍认为,大模型产业化依然面临诸多挑战,比如模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,质量参差不齐等。要训练出一个真正好用的大模型,实际上依赖的是一整套的底层软件栈,需要算法、算力和数据的综合支撑。比如,要加速大模型训练过程,不是单纯“快”就行了,还得充分考虑算法特点,保证模型效果持续提升。再比如,需要支持大模型的自适应分布式训练,具备弹性容错能力,保障在大规模硬件集群上持续稳定训练。在这个过程中,需要深度学习框架平台与硬件相结合。

能不能提升推理部署性能进而降低服务成本,关系到能否真正实现大模型的规模化落地。马艳军表示,框架层和模型层的协同优化是提升大模型效率的关键,一方面持续提升模型效果,另一方面真正把大模型的训练和推理部署效率提上来,做到更高的性价比,才可能更快实现产业化落地。

责任编辑:宋婧


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2023中国电子报编辑选择奖

12月26日,“2023中国电子报编辑选择奖”获奖名单正式出炉。本次评选采用企业自荐和编辑推荐两种方式,综合考量影响力、创新性、成长性等多个维度,围绕企业、技术、产品、解决方案等赛道评出20个奖项。

2024年全国工业和信息化工作会议

12月21日,全国工业和信息化工作会议在京召开。会议坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大和二十届二中全会精神,深入学习贯彻习近平总书记关于新型工业化的重要论述,认真落实中央经济工作会议和全国新型工业化推进大会部署要求,总结2023年工作,部署2024年任务。

深入学习贯彻党的二十大精神·工信系统在行动

当前,全国工业和信息化系统正进一步深入学习党的二十大精神,将二十大精神贯彻落实到具体举措和实际行动。为深入学习宣传贯彻党的二十大精神,中国电子报推出“深入学习贯彻党的二十大精神·工信系统在行动”专栏,通过调研采访报道各地贯彻落实党的二十大精神的具体举措、典型案例,反映各地实干担当、求真务实的精神风貌。敬请关注。

学习贯彻习近平新时代中国特色社会主义思想主题教育

学习贯彻习近平新时代中国特色社会主义思想主题教育开展以来,全国工信系统牢牢把握“学思想、强党性、重实践、建新功”的总要求,多措并举扎实推进主题教育高质量开局、高标准起步。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

世界超高清视频(4K/8K)产业发展大会

会议

2023全球数字贸易创新大赛

11月22—23日,2023全球数字贸易创新大赛总决赛在杭州举行。大赛是第二届全球数字贸易博览会重要活动之一,今年为首次举办。大赛设置人工智能元宇宙和区块链Web3.0两个赛道,吸引了近200家优秀企业及项目团队参与,其中,100余家入围半决赛,24家进入总决赛。

2023世界VR产业大会

10月19日,由工业和信息化部、江西省人民政府共同主办的2023世界VR产业大会在江西南昌开幕。江西省委书记、省人大常委会主任尹弘,工业和信息化部副部长徐晓兰,江西省委常委、南昌市委书记李红军出席开幕式并致辞。开幕式由江西省委副书记、省政府省长叶建春主持。

2023世界显示产业大会

9月7日-8日,由四川省人民政府、工业和信息化部主办的2023世界显示产业大会在四川省成都市召开。四川省委副书记、省长黄强,工业和信息化部党组成员、副部长张云明,重庆市政府党组成员、副市长江敦涛,德国联邦经济发展和对外贸易协会主席米夏埃尔·舒曼出席开幕式并先后致辞。

2023世界超高清视频产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2023世界超高清视频产业发展大会在广州召开。5月9日,广州市委副书记、市长郭永航,中央广播电视总台副台长胡劲军,国家广播电视总局副局长朱咏雷,工业和信息化部总工程师赵志国,广东省委副书记、省长王伟中出席开幕式并先后致辞。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

世界显示产业大会

本周排行