工业和信息化部主管 中国电子报社主办
收藏本站 投稿

人工智能

GPT铸魂,人形机器人再“进化”

近日,伴随微软ChatGPT、谷歌Bard、百度文心一言等大模型之争愈演愈烈,生成式AI在全球范围内掀起轩然大波。与此同时,人形机器人赛道也悄悄地升温了。ChatGPT背后的造物主OpenAI领投人形机器人公司,引发投资热。浙商证券中性预估,2030 年全球人形机器人市场规模有望达 855 元,未来十年市场规模料将增长超120倍。多位业内专家指出,依托大型语言模型的训练,机器对人类意图的理解有了跨越式的质变提升,人形机器人即将迎来新一轮“进化”。

GPT为人形机器人注入“灵魂”

1928年,在美国纽约市高级俱乐部,一个由墙板制成的粗糙的类人形体(头部、铰接的手臂和腿)开启了人类对于人形机器人的无限想象。这个类人形体被称为“Herbert Televox”,由美国西屋公司打造,身体核心部分是Televox控制单元。1928年的广告是这样描述Televox的:“这是未来会成为仆人的一款新设备。”

经过近百年的发展,从粗糙的外形到越来越接近人类的外表,从没有行动能力到可以行走、攀爬、跳跃,人形机器人的进化之路越走越快。然而,由于算法复杂度和数据规模的限制,目前市面上多数人形机器人还只能在少量垂直应用方向上实现接近或超越人类的智能表现,无法在更加开放、复杂的领域实现从“弱人工智能”向“强人工智能”的关键一跃。

优必选.jpg

民生证券研报指出,ChatGPT将为人形机器人注入“灵魂”,有望大幅推动产业的商业化落地。“人机交互最好的载体就是人形机器人。人形机器人的发展离不开语音、视觉、运动控制等多方面的研究,通过引入ChatGPT在人形机器人中的应用,人形机器人与人类的交互体验将会指数上升。以ChatGPT为代表的语言大模型是人形机器人的第一个杀手级应用,代表通用AI赋能通用服务机器人的开始。”优必选科技副总裁、人形机器人事业部负责人付春江对《中国电子报》记者说道。

在他看来,大模型关键技术可拓展到人形机器人的视觉、决策、推理、动作等方面,使人形机器人能部署到更复杂的开放环境中,使人形机器人的感知和动作形成闭环,让其能够在日常生活中发挥更大作用。比如,可以弥补语言模型和真实世界的鸿沟,让它更会“说话”;可以提升模型推理能力,利用环境反馈形成闭环,让它可以探索更多应用环境。

Forrester 分析师卢冠男在接受《中国电子报》记者采访时指出,长期而言,大模型不仅能够更好地训练机器学习算法和处理更复杂和更大规模的数据集,而且有助于机器人更好地理解人类语言、行为和环境,通过与包括智能仿生材料在内的其它软硬件技术发展的融合,加速人形机器人在任务完成、自主学习、适应能力、仿生体验等领域的进化。但在短期内,ChatGPT并不会为人形机器人带来实质影响。

卢冠男坦言:“ChatGPT 会改善的AWA(自动化办公助手)的能力。但AWA 并不依赖人形机器人的形态呈现,更多是以RPA(机器人流程自动化)、NLP(自然语言处理)、DPA(数字流程自动化)和AIOps (智能运维)等产品形态体现。”

新一轮进化方向已逐渐显现

人形机器人的新一轮进化方向是怎样的?在“强人工智能”时代,人形机器人又该如何学习和进步,不断刷新能力与体验上限?Forrester VP 研究总监戴鲲在接受《中国电子报》记者采访时分析说:“下一代人形机器人的进化方向将聚焦于三个方面:更高的智能水平,实现自主决策和动态交互;更强的感知能力,获取环境与人类行为信息,更好地完成任务;更灵活的操控能力,实现多种姿态和运动模式,与人类和其它机器人进行协作。”

达闼创始人、CEO黄晓庆对《中国电子报》记者表示,基于“云(云端大脑)、网(安全网络)和端(机器人终端)”架构的云端机器人将会成为5G时代的“杀手级”的应用,如果可以量产出会做饭、会清洁、会对话、会照顾老人小孩的家庭保姆级机器人,这将会是数万亿的市场。

机器人的“云”大脑通过在云、边、端分布式算法、算力和大数据形成机器人智能;通过5G等无线安全高速“网”络连接云端大脑和机器人本体;机器人本体在“端”侧完成各种任务。云端大脑通过人工增强、多模态融合AI和数字孪生等先进技术,实现机器人智能地自我学习、不断进化与成长。

达闼机器人.jpg

黄晓庆指出,ChatGPT 的出现,恰恰证明机器人需要一个云端大脑。因为ChatGPT 是不可能装在一个小小的计算机里的,它必须装在一个云里面,变成个云服务。ChatGPT本身是单模态的,所以它无法支持机器人。而基于多模态的人工智能大模型要能够支持多模态,文字、语言、视觉、运动都要支持,这就是达闼在做的RobotGPT。

“人形机器人是一个多任务、通用型机器人平台,未来它在工业生产、社会服务等领域将有非常多的应用场景。”付春江说道。他认为,具身智能是人形机器人下一阶段的重点进化方向,ChatGPT可以认为是人类创造出一个超级语言大脑,人形机器人是超级大脑载体,ChatGPT通过人形机器人与物理世界发生联系,交流和互动,根据物理世界中真实的反馈,利用比如强化学习来学习在世界游走,抓取, 行为,推理和决策的能力,学会在现实世界里生存。

多模态大语言模型(LLM)可以使ChatGPT发展成GPT-X (GPT-4, GPT-5…), 给予GPT-X 视觉,听觉,触觉,味觉和嗅觉,具身智能给予GPT-X身体,脚和手。GPT-X使人形机器人和人类及周围环境交互自然,依托于GPT-X 强大的自主学习能力,人形机器人走进千家万户和服务各行各业就会成为现实。

距离规模化量产还有多远?

人形机器人是全球科技创新领域最重要的一个方向,也是机器人的最高级形态。戴鲲分析称,与普通机器人相比,人形机器人一方面可以通过面部表情、语音和身体语言等多种方式来与人类进行交流,更加自然和准确地理解人类情感,更好地适应人类需求,特别是在人口老龄化加速,对精神陪伴和物理陪护需求日益增加的社会背景下具有日益增加的迫切性。

另一方面,一般情况下人形机器人具备常规的普通机器人所没有的灵活性和柔韧性,如手腕关节的运动和抓取力等,从而更好地完成特殊场景的操作任务。技术层面的稳定性与可靠性以及用户需求层面的仿生体验真实性与安全性都是人形机器人需要解决的关键问题。

随着科技的发展以及社会生产对效率要求的提高,人形机器人产业发展迎来窗口期。弗若斯特沙利文预测,到2026年,全球人形机器人市场规模将达到80亿美元;高盛预计,到2035年,在蓝海市场情景下,人形机器人市场能够达到1540亿美元的规模,接近截至2021年全球电动汽车市场以及全球智能手机市场的三分之一。

放眼国际市场,OpenAI以2350万美元领投挪威人形机器人公司X1;波士顿动力Atlas 机器人凭借优异的运动性能引领技术发展;特斯拉推出的人形机器人“擎天柱”惊艳四座,特斯拉CEO埃隆·马斯克称擎天柱未来产量可达数百万台,预计价格不到2万美元(约合人民币14.23万元);亚马逊、三星等也纷纷注资赛道。

再看国内,小米自研的首款全尺寸人形机器人CyberOne(铁大)已经做好了面向海外市场的准备;优必选自主研发的大型人形机器人Walker X和熊猫机器人优悠等已经出现在世博会、两会等重要场合,正在冲刺人形机器人第一股;达闼推出的人形机器人Gingerxr-1,已经发展到2.0的版本,柔性关节从1.0版本的34个增加至41个,7自由度能负重5公斤的灵巧手,续航时间超过24小时,还能切换不同角色,通过视觉和语音感知人类情绪。

尽管赛道火热,付春江坦言,人形机器人要从“可用”走向“实用”,并达到理想的商业化状态,在软件或AI方面,需要解决人形机器人多维感知和决策能力,解决通用智能问题,来满足半结构化环境的适应能力和任务能力。硬件方面,要解决高功率密度,实现低能耗,关键元器件性能提升,整机量产导入和成本控制。

比如,制约人形机器人运动性能的关键模块——伺服驱动器占据了一半以上的整机成本。尽管近年来,在多方努力下,人形机器人的核心零部件成本一直在稳步下降,像优必选已经率先将双足真人尺寸人形机器人的成本降低至10万美元以下,但要让人形机器人真正走进千家万户仍然任重道远。

再比如,制作柔性关节需要用的减速器长期被国外机器人“四大家族”垄断。人形机器人所用的减速器体积更小、重量更轻,而且材质也不相同。达闼自主研发生产的智能柔性关节(SCA),在同样性能下,体积只有传统伺服器系统1/10。

与此同时,人形机器人对软件方面的关键技术依赖度极高。AI 算法及软件平台能力决定了最终人形机器人的核心服务能力。过去传统机器人架构下,人形机器人产业化部署面临智能化水平低、价格高、难量产、隐私安全和数据保护无法保障等难题。

不过,黄晓庆指出,这些难题都将随着“云-网-端”架构的推广而得以解决。一个可为智能机器人共享的云端大脑,将支持海量的机器人共同进行训练和学习,不断进化,最终实现机器人通用智能服务。

ChatGPT、多模态融合AI的RobotGPT等先进技术,将从“质”上促进机器人从“功能”进阶到“智能”,让机器人智能地自我学习、不断进化与成长。如同手机“功能机”向“智能机”的升级,伴随新一轮进化,人形机器人将走入千家万户,真正改变我们的生活。

赛迪顾问报告显示,尽管目前各家人形机器人仍处于原型机研发的早期阶段,但它所带来的潜在技术变革和对某些生产生活场景的改变值得高度关注。目前较有潜力的人形机器人发展方向主要面向制造业、航天探索、生活服务业、高校科研等,预计2025年,人形机器人将有望实现制造业场景应用的突破,小批量应用于电子、汽车等生产制造环境。

责任编辑:宋婧


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2022年中国家电市场报告

3月29日,中国电子信息产业发展研究院(又称赛迪研究院)发布了《2022年中国家电市场报告》(以下简称《报告》)。《报告》显示,2022年,我国家电市场零售总额为8352亿元,同比下降5.2%,但线上渠道和下沉市场家电零售额增长明显,稳住了市场总盘,体现了我国家电市场的韧性。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

2023年全国工业和信息化工作会议

1月11日,全国工业和信息化工作会议在北京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,认真贯彻落实中央经济工作会议精神和党中央、国务院决策部署,总结2022年工作,部署2023年重点任务。

第5届中国—东盟信息港论坛

2022年9月16日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、广西壮族自治区人民政府联合主办的第五届中国—东盟信息港论坛将在广西南宁开幕。该论坛主要围绕数字经济发展和智能互联、数据互通、合作互利等开展交流研讨、建言献策,进一步推进互联网经贸服务、人文交流和技术合作。

2022“三品”全国行

为贯彻落实《国务院关于印发扎实稳住经济一揽子政策措施的通知》要求,加快推进数字化助力消费品工业“三品”战略实施,进一步提振消费信心、挖掘消费潜力,巩固增强消费对经济发展的基础性作用,工业和信息化部近期组织开展2022“三品”全国行活动。中国电子报特开辟2022“三品”全国行专栏,报道活动进展、专家观点、政策解读,敬请关注。

世界超高清视频(4K/8K)产业发展大会

会议

2022世界显示产业大会

11月30日,由四川省人民政府、工业和信息化部主办的2022世界显示产业大会在四川省成都市开幕。全国政协副主席、民革中央常务副主席郑建邦以视频方式出席开幕式并致辞。四川省委书记王晓晖出席开幕式并宣布大会开幕。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

2022世界VR产业大会

11月12日,由工业和信息化部、江西省人民政府共同主办的2022世界VR产业大会在江西南昌召开。国务委员王勇出席大会开幕式并发表重要讲话。江西省委书记、省人大常委会主任易炼红,工业和信息化部党组成员、副部长王江平,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2022CITE第十届中国电子信息博览会开幕峰会

8月16日,第十届中国电子信息博览会(CITE 2022)在深圳举办。深圳市人民政府副市长张华,广东省工业和信息化厅党组成员、副厅长曲晓杰,工业和信息化部电子信息司副司长史惠康出席开幕式并先后致辞。

2021世界VR产业大会云峰会

10月19日—20日,由工业和信息化部和江西省人民政府共同主办的2021世界VR产业大会云峰会在南昌举办。国务委员王勇出席大会开幕式并发表讲话,江西省委书记易炼红,工业和信息化部副部长王志军,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2021世界超高清视频(4K/8K)产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2021世界超高清视频(4K/8K)产业发展大会在广州召开。5月9日,广东省委书记李希出席开幕式,广东省省长马兴瑞、国家广播电视总局副局长孟冬、中央广播电视总台编务会议成员姜文波出席开幕式并致辞。

世界显示产业大会

本周排行