工业和信息化部主管 中国电子报社主办
收藏本站 投稿

产业新闻

百度发布大语言模型“文心一言”

3月16日,百度的大语言模型文心一言终于“千呼万唤始出来”。从ChatGPT横空出世以来,作为第一位推出中国版ChatGPT的玩家,百度的这场发布会,让业界等得“好辛苦”。特别是就在文心一言发布会的前一天,ChatGPT的开发者OpenAI又扔下一枚重磅炸弹——升级了ChatGPT背后的大模型GPT4,这无疑让百度压力山大。

顶着重重压力,百度终于迈出这一步,兑现了此前的承诺。发布会上,百度创始人、董事长兼首席执行官李彦宏通过五个Demo(视频短片),展示了文心一言在文学创作、商业文案创作、数理推算、中文理解和多模态生成这五个使用场景的表现。值得一提的是,在中文理解、多模态生成等场景上,文心一言做到了ChatGPT没做到的事情。

在发布会上,李彦宏提问文心一言“洛阳纸贵”是什么意思?文心一言正确解释了成语“洛阳纸贵”的含义,还按照李彦宏的要求在短时间内用“洛阳纸贵”作出了一首藏头诗。

中国版ChatGPT之所以备受期待,部分原因就是博大精深的中国文化和复杂的中文语义短期内只有掌握中国用户数据的中国公司才能具备。作为扎根于中国市场的大语言模型,百度文心一言具备中文领域最先进的自然语言处理能力。“洛阳纸贵”这个例子就比较清楚地展示了百度在中文上的天然优势。

但李彦宏也坦言,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,这是百度接下来加紧训练、不断完善的方向之一。

在生成式AI大模型的演进中,多模态已经成为业界公认的发展趋势和竞争焦点。昨天OpenAI发布的GPT4也体现出这一能力——GPT4能够处理图片信息以及带有文本和照片的文档、图表或屏幕截图等图文交错的信息,并以文字的方式输出,但并没有体现出文字生成图片、语音甚至视频的能力。

百度的文心一言却具备这一能力。发布会上,文心一言应李彦宏的要求,为2023世界智能交通大会创作了一张海报,并用四川话讲述了“智能交通最适合哪个城市发展”,还将上述内容生成了一条视频。

此前,ChatGPT曾在回答中国经典数学题“鸡兔同笼”问题中翻车。发布会上,李彦宏向文心一言提出了“鸡兔同笼”的问题。文心一言经过演算,认为可能是题目出错了,于是李彦宏又重新问了一遍,文心一言不但给出了正确的答案,还详细给出了解题步骤。

文心一言发布会前夕,很多人都在质疑百度是否真的Ready了。对此李彦宏回应,其实从某种意义上说百度已经为此准备了多年,百度十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。“但也不能说我们完全Ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,我自己测试感觉还是有很多不完美的地方。”李彦宏直言。

从今天的发布会来看,文心一言似乎并不是人们预期中那样具有革命性的产品,而更像是对百度AI技术储备的一次中期考验,展现百度也有追逐最先进人工智能产品的研发能力。

按照李彦宏的说法,百度是全球为数不多、在芯片-框架-模型-应用这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

除了讲产品、讲技术,李彦宏还用大量篇幅介绍了自己的生态——从百度承认文心一言的存在到现在,短短一个月的时间,已经有超过650家合作伙伴宣布加入文心一言生态。

这实则点明了AI得以形成良性循环的关键点——商业闭环。

上一波被誉为AI风潮的缔造者——Deepmind推出的阿尔法狗,就是因为缺乏泛化能力和应用场景而“昙花一现”。因此,这一波的生成式AI浪潮中,OpenAI也开始逐渐重视ChatGPT的大规模商用问题——开放API,并将使用这项技术的价格削减了90%。

虽然‘文心一言’的内测体验不能称作完美,但为什么现在发布呢?李彦宏的回答是:“因为百度的各个产品现都在等着这样的产品,我们的客户和合作伙伴也在等着这样的技术。”

他断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

如果你也期待见到一个真正的“中国版 ChatGPT”,不妨再给文心一言时间和耐心。或许“士别三日,当刮目相看”,对于AI模型更是如此。从目前的Demo来看,文心一言在基本功能上都能与ChatGPT打个平手,面向公众开放后,文心一言可以通过用户们大量的搜索请求进行学习和改进,从而提升处理相应问题的准确性和速度。毕竟ChatGPT也是通过不断出错、反复标记训练才达到了今天的高度。

责任编辑:齐旭


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

2023年全国工业和信息化工作会议

1月11日,全国工业和信息化工作会议在北京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,认真贯彻落实中央经济工作会议精神和党中央、国务院决策部署,总结2022年工作,部署2023年重点任务。

第5届中国—东盟信息港论坛

2022年9月16日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、广西壮族自治区人民政府联合主办的第五届中国—东盟信息港论坛将在广西南宁开幕。该论坛主要围绕数字经济发展和智能互联、数据互通、合作互利等开展交流研讨、建言献策,进一步推进互联网经贸服务、人文交流和技术合作。

2022“三品”全国行

为贯彻落实《国务院关于印发扎实稳住经济一揽子政策措施的通知》要求,加快推进数字化助力消费品工业“三品”战略实施,进一步提振消费信心、挖掘消费潜力,巩固增强消费对经济发展的基础性作用,工业和信息化部近期组织开展2022“三品”全国行活动。中国电子报特开辟2022“三品”全国行专栏,报道活动进展、专家观点、政策解读,敬请关注。

2021年中国家电市场报告

3月3日,中国电子信息产业发展研究院(又称赛迪研究院) 发布了《2021年中国家电市场报告》(以下简称《报告》)。《报告》显示,2021年,我国家电市场全面复苏,零售规模达到8811亿元,同比增长5.7%,整体基本恢复至疫情前2019年的水平。

世界超高清视频(4K/8K)产业发展大会

会议

2022世界显示产业大会

11月30日,由四川省人民政府、工业和信息化部主办的2022世界显示产业大会在四川省成都市开幕。全国政协副主席、民革中央常务副主席郑建邦以视频方式出席开幕式并致辞。四川省委书记王晓晖出席开幕式并宣布大会开幕。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

2022世界VR产业大会

11月12日,由工业和信息化部、江西省人民政府共同主办的2022世界VR产业大会在江西南昌召开。国务委员王勇出席大会开幕式并发表重要讲话。江西省委书记、省人大常委会主任易炼红,工业和信息化部党组成员、副部长王江平,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2022CITE第十届中国电子信息博览会开幕峰会

8月16日,第十届中国电子信息博览会(CITE 2022)在深圳举办。深圳市人民政府副市长张华,广东省工业和信息化厅党组成员、副厅长曲晓杰,工业和信息化部电子信息司副司长史惠康出席开幕式并先后致辞。

2021世界VR产业大会云峰会

10月19日—20日,由工业和信息化部和江西省人民政府共同主办的2021世界VR产业大会云峰会在南昌举办。国务委员王勇出席大会开幕式并发表讲话,江西省委书记易炼红,工业和信息化部副部长王志军,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2021世界超高清视频(4K/8K)产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2021世界超高清视频(4K/8K)产业发展大会在广州召开。5月9日,广东省委书记李希出席开幕式,广东省省长马兴瑞、国家广播电视总局副局长孟冬、中央广播电视总台编务会议成员姜文波出席开幕式并致辞。

世界显示产业大会

本周排行