工业和信息化部主管 中国电子报社主办
收藏本站 投稿

软件服务

百度余凯:学习是智能的本质 经验就是数据

新浪科技讯 1月17日消息,在上午的2015年极客公园创新大会中,百度深度学习研究院(IDL)副院长余凯作了《百度大脑所思考的人机关系》的主旨演讲。在他看来,经验就是数据。而随着过去的经验数据,能够不断的学习、提升,今天可能不聪明,但明天会变得更聪明,这是智能的本质。所以,学习是智能的本质。

余凯认为,有关智能非常重要的方面就是经验。在人工智能领域叫做经验数据。所以,经验就是数据,数据就是经验。

演讲中,余凯介绍了深度学习领域。他指出,百度深度学习落地,是在搜索、广告投放、图象识别、语音识别,这些方面,都有相当的进展。

此外,余凯还提到了自动驾驶技术,并现场展示了百度自动驾驶自行车。

以下为余凯演讲全文:

各位朋友,早上好!天气非常寒冷,但我们的热情遗憾非常火热,因为梦想在我们心中,这是为什么大家今天早上来到这里。

在我演讲之前,先给大家放一段有趣的视频。

正如大家所看到的,这辆车开进了我们的会场,它正在从我的左侧往它的右侧开过来,它上面没有人,它自平衡的在行走,看起来有点“诡异”。

时间很快,大家可能没有看清楚,没有关系,有机会大家可以在会场外面看。

为什么我们会做这样一个有趣的自行车,它是真正的自行车,我们以前的自行车不是自己行走的,这才是真正的自行车。

为什么做这个事情?这就涉及到我今天给大家演讲的话题,就是百度大脑所思考的人机关系。

百度在过去两年时间里,在人工智能这个技术上投入了非常多精力,无论在技术投入、成果和人才布局上面,受到了广泛关注。这是麻省理工学院的科技评论杂志今年8月份的一篇文章,讲中国的一个互联网巨人开始有梦想,讲的就是这方面的情况。

大家可能会好奇,什么是人工智能?这是一个很严肃的学术话题,但在今天这个会场,我想我们抱着对科技的热情,我们不需要那么严肃,可能大家跟我一样是一个科技粉丝,看过这样一个电影。这个电影硝基漆人叫做哇里,从个案例上可以稍微看一下人工智能具有什么样的方方面面。

首先,看一下,这个小机器人有感知的能力,有眼睛,可以感知这个环境,比如说哪个地方是路,哪个地方是障碍物。在这个感知基础上它会思考,然后理解。理解什么呢?比如说,这个地方是平地是可以走的,这个地方是突然下去的坡或者砍不能走,这就是理解。在理解的基础上,完成自己的任务,去控制、去决策。

所以你看,从感知、理解到决策,在一个小的机器人身上,它体现的淋漓尽致,这就是非常直观的来感觉人工智能涉及的几个方面。

我们看,在今天的市场上,充斥着“智能”这个词汇,我们看到有智能手机、智能手表、智能水杯、智能汤勺,Google前段时间说在做智能汤勺,百度也在做智能筷子,还有智能手环、智能冰箱,等等等等,为什么我们叫它们智能的产品?它们是不是真的有智能?我们思考一下。

OK!我们把所有的产品放在一边,另外一边是60、70年代的老式收音机。它们有什么不同?它们都是在人操控的情况下,去完成一些任务。从这个角度来讲,它们看似并没有太多的不同。去思考这个问题,实际可以帮助我们去区分现在这些智能产品,哪些可能是不一定具有智能的。

那我想,一个思考的角度是说,举个例子,如果在座的跟我是同一个年纪的话,在小学的时候可能学过一篇课文,这篇课文是讲一个板凳的故事,有一个科学巨匠爱因斯坦,当时做一个很粗陋的小板凳,根据这个来说可以说他不聪明,跟他的小伙伴比可以得出一个结论他不是太聪明,但爱因斯坦每天都在做很多板凳,每次都在提升,根据他过去的经验和教训去改进他的下一次。所以,你动态的看,会发现是个不断学习成长的曲线。

所以说,这里面智能的能力的本质在于什么呢?在于,你是不是随着经验不断的演化,不断的进步。正如今天这个会场我们的主题叫“觉醒、进化”,实际上进化是智能的本质。这里面的经验是什么呢?经验就是数据。那么,随着过去的经验数据,能够不断的学习、提升,今天可能不聪明,但明天会变得更聪明,这是智能的本质。所以,学习是智能的本质。

这里面就提到了一个有关智能非常重要的方面,就是经验。在人工智能领域,我们叫做经验数据。所以,经验就是数据,数据就是经验。

这就涉及到今天经常提到的所谓的大数据,是因为现在迎来了一个伟大的时代,这个时代就是一个大数据的时代。

我们从一个角度来看,移动互联网给我们带来了怎样的深刻变化。这是2005年在圣彼得堡教堂门口,很多信众在等待教皇选举的结果,8年以后新一代教皇重新选举,同样是那批信众,同样在那个地方,我们看到了移动互联网怎么改变了世界,每个人都连接了设备,这些设备无时不刻都在产生数据。

我们看到,在今天可能在座的每个人跟我一样,连接平均2-3个设备,比如我的口袋里面就有两个手机。但是,这个数据到2020年是一个不断爆炸性增长的趋势,甚至更加夸张的孙正义说到2020年每个人要连接1000个设备,我相信这个不一定那么夸张,你可能每个钮扣都是一个智能的连接设备。

所以说,移动互联网时代万物互联,随之而来的是什么呢?就是数据的爆增。大量的数据给我们带来前所未有的机会。所以,我们从万物互联到大数据时代,大数据时代随之而来的就是无处不在的智能。

最近几年,在人工智能领域我们经常听到,最引人注目的领域叫做深度学习,为什么深度学习跟大数据时代这么悄然的发生在同一时代?这里面有深刻的时代背景。我们看一下曲线,横轴是数据规模,纵轴是系统服务的能力,随着数据的增长是怎样的变化过程。

我们看到,传统的人工智能算法,它的问题是说,数据增长到一定程度以后,它的效果不再提升。对于深度学习,我们看是怎样的曲线。随着数据不断的增长,它的效果会不断提升。

所以说,深度学习能够帮助我们吸收数据所带来的红利。如果从技术的角度是这样看,那么从商业的角度你会看到,如果你的商业模式,也是随着数据的增长呈现这样曲线的话,那说明什么?那我要恭喜你,你有了一个非常好的竞争壁垒,为什么呢?收集数据需要时间,别人要获得同样的能力,他需要花同样的时间,或者更长的时间,所以你永远跑在前面。其实搜索引擎就是这样的模式,就是基于大数据的商业模式,实际是有很好的竞争壁垒的。

百度在过去两年时间里面,在深度学习领域,可以说做了很多领域。在今天,百度大脑已经取得了相当的进展,它无时不刻的在学习、演进和进化的系统,它具有相当强的工程能力。在两个月前我给大家介绍的时候说百亿级参数构建世界上最大的深度学习网络,今天我把这个百亿级改成了千亿级,我们今天能构建更大规模的深度神经网络,在此基础上我们可以做很多很多事情。

具体落地的有哪些呢?深度学习,一开始它的基础是跟大脑结构的启发。今天我们是从统计和计算的角度看待这个问题,当然另外也有很多学者是从仿真大脑生物学角度做这方面的研究,我想这两方面应该是牵头并进、互通有无、互相帮助的。

至于谈到,在百度大脑深度学习落地在什么地方?我们可以看到,在搜索、广告投放、图象识别、语音识别,这些领域,都有相当的进展。比如说我们看搜索,在深度学习之前绿色这个bra领先我们的竞争对手,在用了深度学习之前领先优势拉升了两倍还多,这是首次把深度学习成功的应用于搜索引擎。从另外一个角度讲,它可能也是目前深度学习技术,用在自然语言方面最成功的一个例子。

当然,在广告投放这个领域,整个百度的凤巢广告系统,今天已经进入深度学习的时代,它的广告点击率提升非常显著,具体的数字因为是商业秘密我不能讲,但是百分比两位数的提升,所以这对公司的营收产生了巨大贡献。

在语音这块,可以说在过去两年里面,语音识别率不断提升,在移动搜索的中文语音识别,我们是世界领先,应该是世界上最好的。

在图像领域,这例子是在去年我们在物体检测上面,单个模型实验是世界上最好,百度是第一,Google是第二。

大家还可能会关心,在过去几年里面,技术的发展,比如说在图像分类这个领域,它是怎样的量变到质变的过程。我们还是看图像分类这个例子:在这边我给大家演示的是最近几年里面世界上的成绩是怎样变化的,2010年的时候世界最好成绩在那个地方,随着深度学习的发展,我们看到,每年都是以很快的速度向前演进。最近的结果,2014年底的时候,这个结果到了5.9%%错误率,这是百度做到的,也是世界上最高的图象识别准确率。大家可能会很关心,它离人类在这个图象识别问题上,人类的能力是什么水平。人类的水平在这个地方,它差不多接近5%%的错误率。所以大家可以看到,我们平常每天上班、工作,但是不一定知道这个技术,最近这几年,由于大数据的发展,由于深度学习的发展,包括工业界、学术界的投入,最近几年是怎样的变化。可以说,这个进展是非常喜人的。

比如说我们刚刚讲到图像,下面讲到语音,反应到我们一个集中的产品就是百度翻译这个APP,你可以在纽约街头说句中文话,马上语音识别翻译成中文,然后自动翻译成英文。还可以自动拍照,比如外国人来上海看到这个菜单,拍照识别成英文。用人工智能的技术,也可以帮助小朋友有快乐的童年,不用花那么多时间做作业,可以花更多时间玩儿,我的小时候如果有这个工具我会非常开心,当然它不是帮你做题,而是告诉你知识点在什么地方。

人脸识别的技术发展,也跟大家汇报一下最新的成果,去年Facebook人工智能实验室,他们宣布他们做到世界上最好的成果,是97.35%%的准确率。前几天,我在百度的同事,他们取得了一个更激动人心的进展,这是目前世界上最好的人脸识别准确率,达到99.62%%。

朋友们可能也会问,现在人类的能力达到什么水平,我可以告诉大家,斯坦福大学的科研人员,最近他们用人做了一个测试,人在这个数据上达到的是99.2%%。

当然,我必须给大家澄清,在一个数据极上,机器的算法做到人的水平,但整体来讲机器比人还是有非常大差距的,我们还在努力中。

大家小时候可能做过看图说话,看到这幅图片要用自然语言描述这个图片的故事是什么。比如说,我们对于左边这幅图,如果用自然语言或英文描述,一个黄色的图景,也可以说,下午的阳光照进房间,描述这样一个场景。这些语言,实际上不是人来写的,而是机器生成的。

很多很多人工智能的算法,它在不断积累它的势能,这会改变人们的生活,在方方面面,比如说机器人领域,一个具体例子就是高度自动化的驾驶,这是百度深度学习研究院团队的同学们改装的各种车,这边是我们的一个车上感知器的演示,这里面集成了雷达、红外、摄象头,每一个感知器覆盖了不同方面,有它各自的优势跟劣势,然后集成在一起对环境感知,对道路的情况有一个理解,然后它自动的能够去行驶。

这是我们基于这些传感器,对道路有三维的理解,这个理解实际上可以做到比人更精确。比如说,我们对道路上的车,今天的导航系统只知道你在哪条路上,不知道你在哪个车道上面,我们能够利用更先进的感知系统,能够使车定位在车道上面,精度是10-20厘米的距离。

我们可以预见,在后面的1-2年时间里,整个导航系统会发生翻天覆地的变化。比如说在北京的街头上立交桥的时候,有的时候前面面临3-5个分杈口,到底怎么走看二维地图你会懵掉,马上科技就会帮助你发生改变。

这是我们在车里做的仿真系统,利用深度学习开发图象识别技术,用低成本完成这个任务。

我们对自动驾驶的认识是认为,完全没有人的自动驾驶不是我们追求的目的,这是很难做到的,有可能在十年之远的距离也许能够做到。这中间是逐步实现的过程,它从辅助驾驶,也就是通过感知器,去通知这个司机发生了什么状况,他并不直接去操控车,然后到主动安全,比如发生小孩过马路,感知到会主动控制车停下来,这是主动安全。然后特定环境下,比如高速上的自动驾驶,在大型物流中心的自动驾驶,到高度的自动化驾驶。整个过程,我们认为是从辅助驾驶到人车一体的自动驾驶。就是说,整个系统是让人去享受交通系统带来的便捷和安全,但并不是取代人。所以,我们强调的是人车一体的自动驾驶。

这就回到我一开始我演讲的题目,就是对人机关系的思考。我们稍微回顾一下人工智能的原点,很大程度上是因为图灵测试,致力于研发能够取代人的智能机器,这样做是不是好?站在今天,我们不仅要跟随先贤的思维,而还要自己思考。

在过去百度做的产品我们可以稍微反思一下,有两个产品:第一个是PK大咖,给自己照张相能够找到跟自己很像的明星,因为每人个都有做明星的梦想。另外是拍照写识,识别了图像之后还生成一首诗。大家对两者的认知,从用户反映来讲,大家可能可以猜得到,拍照写诗用户的性能不是那么大,它只是显示机器有多么伟大,而跟人到底有什么关系呢?这是绝缘的。

左边这幅图是人工智能历史上里程碑的历史,IBM的深蓝,它的象棋能力达到了冠军的水平,然后就没有然后了。右边也是个人工智能的技术,它就是搜索引擎,搜索引擎使得在北京的一个小孩子,跟在遥远山村的小孩子,只要有网络,使他获取信息、获取知识的能力是一样的,可以让每个人变得更聪明,这实际就会对社会产生巨大的影响。

再回到我们一开始开场的视频,这辆自行车它可以跟着你走,你在跑步的时候,也许你有衣服、有大衣,可以放到上面,有水,可以放到上面,你可以自己轻松的跑,跟随你跑到自己的房间。大家想到了什么?这是车吗?我想在座有人的答案跟我是一样的,它像一个小黑马,跟你是朋友的关系,这就是我们对人机关系的思考。

我们认为,伟大的技术,它之所以伟大,不是说让机器更伟大,它最重要的意义是在于让每个平凡的人更伟大、更有创造力,他的生活更美好。

所以,最后我修改一下毛泽东同志的语录:世界是我们的,她也是机器人的。但是,归根到底,她是属于能够创造机器人,能够机器人和谐共处,并且利用机器人为我所服务的人的。

谢谢大家。

文章关键词: 人工智能百度余凯

责任编辑:李佳师


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

聚焦2021年全国两会

3月5日,第十三届全国人民代表大会第四次会议在北京人民大会堂开幕。党和国家领导人习近平、李克强、汪洋、王沪宁、赵乐际、韩正、王岐山等出席,栗战书主持大会。初春的北京,处处生机盎然。第十三届全国人民代表大会第四次会议5日上午在人民大会堂开幕。近3000名全国人大代表肩负人民重托出席大会,认真履行宪法和法律赋予的神圣职责。

2021年全国工业和信息化工作会议

12月28-29日,全国工业和信息化工作会议在京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中、五中全会精神,认真落实习近平总书记重要指示批示精神和中央经济工作会议部署,总结2020年工业和信息化工作,分析形势,部署2021年重点工作。工业和信息化部党组书记、部长肖亚庆作工作报告。

2020年中国家电市场报告

3月22日,中国电子信息产业发展研究院发布了《2020年中国家电市场报告》(以下简称《报告》)。《报告》显示,2020年,我国家电市场零售额规模达到8333亿元,在疫情冲击之下显示出较强的韧性;电商渠道对家电零售的贡献率首次超过50%,网络零售对家电消费的促进作用进一步提升;高端产品、生活家电大幅增长,有效促进了消费升级和产业转型。

世界超高清视频(4K/8K)产业发展大会

会议

2020世界显示产业大会

11月20日,由工业和信息化部、安徽省人民政府共同主办的2020世界显示产业大会在合肥市举行。在开幕式上,工业和信息化部部长肖亚庆、韩国驻华大使张夏成发表视频致辞。安徽省委副书记、省长李国英,工业和信息化部副部长王志军出席开幕式并致辞。

2020世界超高清视频(4K/8K)产业发展大会

11月2日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2020世界超高清视频(4K/8K)产业发展大会在广州市召开。广东省委书记李希出席开幕式,省长马兴瑞出席并致辞。国家广播电视总局局长聂辰席、工业和信息化部副部长王志军、中央广播电视总台副台长蒋希伟出席开幕式并致辞。

2020世界VR产业大会云峰会

10月19日—20日,由工业和信息化部、江西省人民政府主办的2020世界VR产业大会云峰会在南昌举行。在10月19日的开幕式上,中共中央政治局委员、国务院副总理刘鹤发来书面致辞。江西省委常委、南昌市委书记吴晓军,工业和信息化部副部长王志军,江西省委书记、省人大常委会主任刘奇先后致辞。开幕式由江西省委副书记、省长易炼红主持。

世界显示产业大会

本周排行