艾瑞网

互联网

商汤科技CEO徐立:人工智能突破与行业未来

来源:艾瑞网    作者:yangkun      2017/6/7 10:54:03

导语:我认为人工智能的阶段,它是一种阶段跳跃式突变的,每一个阶段的变化,需要基础的算法突破和核心技术的研究,原创的技术,才是推动整个人工智能变化的核心。

【艾瑞网 直播】2017年6月6日-7日,由艾瑞集团主办的2017艾瑞(北京)高峰会议在北京国贸三期大酒店举办。

本届艾瑞峰会汇聚互联网核心力量,以“创想·聚能”为主题点燃行业精英释放互联网原力,共同探讨互联网经济与社会变革。作为中国互联网行业极具影响力的品牌峰会,在这里除了感受行业尖端脑力的碰撞,也能随着艾瑞集团15年成长的经历,窥探理解中国互联网行业的脉搏。

以下是商汤科技CEO徐立发表题为“人工智能突破与行业未来”的演讲实录。

xl.jpg商汤科技CEO徐立

徐立:大家好!非常荣幸收到杨总的邀请,来到艾瑞讲一讲,我们商汤对人工智能,对行业的一些看法。

我觉得艾瑞这个活动,我们特别喜欢,艾就是喜爱,瑞就是爱研究,作为研究人员应该都来,我们公司有超过一百多名博士,单方面,是人工智能密度最高的企业,博士密度最高的企业。

这一页一定要替公司打一个广告,介绍一下公司到底做什么。商汤是人工智能平台性的公司,我们想要做的是利用现代人工智能最火热的深度学习,打造深度学习平台,我们把深度学习的平台应用到各类垂直的技术应用突破上,把商汤形容为业内的公司,我们在内功强了之后,应用十八般兵器,和我们打通结合,进行迭代。

接下来讲人工智能的突破,很多人拿这张图问我,人工智能经历了三波浪潮,经历了不同时代,这一波人工智能兴起的时候,商汤有什么看法。看了半天,看不懂。首先,这个图,所有的起点,应该倒着看,这一波人工智能兴起,讲的是深度学习,深度职能颠覆。倒推过去有三个高峰,每个高峰都和这一波人工智能兴起息息相关,我仔细想的时候,一九五几年只有几个人提人工智能,抛开前两次浪潮不说,第三次浪潮,我出生了,我03、04年毕业的时候,行业做人工智能行业的这些人,出来都找不到工作,都不敢说自己是学人工智能的,怎么那个时候是说浪潮开始了呢?我们也很疑惑。仔细想一下,人工智能细分行业太多了,第二个最关键的是,人工智能的突破,是一个突变,不是渐变的模式。

讲一下人工智能的细分行业,大家知道的非常多,这波人工智能关键的钥匙,我们称中间大的大脑叫深度学习,把传统的人手工智能设计的智能,渐渐转化成纯数据的智能,它给了大家超越极限的可能性,我们在语音识别、机器视觉、自然语言理解上拥有非常强大的空间和落地的点,商汤做的是机器视觉,我比较喜欢这个词,我们是用机器实现我们的愿景,我们作为十几年的公司,突然在这一两年,你转做人工智能,我们有点不太适应,不过渐渐就会习惯了。关键核心是中间的算法能力,其实是打开了大家的思想空间,可以做下棋,甚至无人驾驶,包括还可以作为高考,自动高考的机器人,其实是一种帮助大家能够打开对未来想象的核心工具。

人工智能的细分领域,这是Google。他把各种书上面的关键字都输入进去,人工智能每个细分行业,发展全都不一样,在08年,计算机视觉基本上是无人问津的行业,人工智能都不想说自己是做计算机视觉的,做计算机视觉的,都不想说自己做人工智能的,因为都找不到工作。人工智能低谷的时候,出现两个高峰,专家系统,机器人,所以刚才第一张图,有点牵强。讲到这一波信息,到底发生了什么事情,主要是深度学习的突破,我们做一个这样的检索,Google搜索深度学习的关键词,深度学习这个词,从06年就开始有了,之前叫神经网络,那个词搜索更低,大部分的时间,即使到2012年都是平的,说明什么呢?说明跟我们的印象是一样的,人工智能就是一夜变火了,那一夜到底发生了什么事情?大家公认的事情,就是深度学习之父,就是头脑当中识别物体。第二个使用了GPU实现这样一个视觉识别。这就是两个非常大的含义,第一个,视觉,我们人眼睛所看到的东西,就叫视觉内容,70%以上的是互联网内容,第二个用GPU是颠覆性的变化,我们做大数据分析,背后需要非常强大的运算能力,但是使用CPU,使得创业公司,小公司,有机会在很短时间内,用同样廉价的计算能力,获得大公司集群获得的能力,举个例子,我们做人脸识别,最早在深圳的超算上,花28天进行迭代,在六块GPU卡上用6个小时,这就是GPU的威力,带给大众的人工智能的普及性。

中国在这里面起到什么作用?我也很好奇,做了同样的搜索。得到这样的答案。很有意思的一张图,人工智能进入五年来,以及关于深度学习近五年来,在全球搜索的热度,可以看到中国一枝独秀,远超美国,加拿大、欧洲。大家有没有发现,有什么奇怪的地方?Google在中国是被禁掉的,这也就是说,近五年来,中国人民通过反欺诈能力,翻到了国外,搜索深度学习,干倒了美国人。这是多大的热情。我也想说,所以说人工智能在中国有新的机会,它拥有新的应用场景,比如说我们做人脸检测,还有全体分析,我摆一个摄像头,很轻易获得应用场景数据。所以人工智能的中国热,真的不是假的。美国去年白宫出了一个报告,中美人工智能的发现,中国已经超越美国,这只是开始,未来在这个当中,会起到越来越大的作用。

我认为人工智能的阶段,它是一种阶段跳跃式突变的,第一个阶段,其实是很传统的,我列出视觉行业里面,最著名的文章,人脸检测,第一个阶段称为技不如人的阶段,那个阶段,所有智能基本上通过专家的知识转到系统当中,人工指导的智能,比如说以前做人脸检测,有各种各样的模板,眼睛下面那条要黑一些,鼻子比周围白一些,并且是对称,有了这样的模板之后,可以做人脸检测,可以想到,这些知识和设计,最后决定检测的结果,这是人可以知道的。从哲学商来说,人知道机器,机器一定会超过人。现在人工智能,主要是一种生产力的工具,作为生产力的工具,没有超越人,就好像当年的蒸汽机,怎么样会有很大的行业应用?所以在那个阶段,做机器视觉的时候,都说做得不好。

现在我们进入第二个阶段,叫做超越大众阶段,我们近年来在2013年、2014年的时候,被我们诸多领域验证了,机器在垂直领域里面,可以做到超越人的水平,普通人的水平。包括在人脸识别。商汤的团队,在人脸识别领域,第一个超越人。包括各个细分领域。为什么这里说是超越大众,超越普通人呢?是因为,我们做人工智能,必须要把人的知识传达给机器,那就需要标注数据传达机器的过程。在超越普通人的过程当中,因为大众或者普通人的知识,其实是比较容易获得的,比如说我们人脸的检测,眼耳口鼻,在座各位,很容易指出眼耳口鼻在哪里,也不需要上一个博士才能获得。

再比如说,我们提供视频鉴黄的服务,我们当时深圳HRO就跑到我们公司来,就跟我说,说徐总,发现一个事儿,我们深圳有一个团队,天天躲在一个小房间里看黄片,我说不是,我们做一个视频鉴黄的分析,我们后来在办公室提了一个牌子,禁止自娱自乐。从马路上拉一些人过来,在小房间里就能干,这是普通人大众的数据,大众的知识很容易获得。但只是在现在这个阶段,但是所谓的大众知识获得,只能通过降成本这件事情,更核心的是超越专家,专家稀缺不可获得。

比如说艾瑞的霍总也讲医疗,一些大的方向,医疗是特别需要专家的,医生老专家特别厉害,我知道有一些医生,通过一张片子,可以很轻易的判断,你是骨科的什么问题,甚至肺癌的早期都能看到,这些专家,都要挂专家号,平时找不到。如果说需要把这位专家的知识,传达给电脑,需要多久呢?我们一般需要百万级别的数据,算了一下,大概七八百年的时间,他就可以把这个数据了解了。

这是不可能发生的阶段。所以在这里每一个阶段的变化,需要核心算法的突破,我把AlphaGo放在第三阶段的中间,为什么?是因为大家说AlphaGo超过世界上最好的专家,但是AlphaGo是通过读取人类记录的50万个棋谱,把所有人的经验记录下来,它基于这个往前走的。但是最近又把它往右移了一下,因为现在的AlphaGo,通过算法的演进可以更少地依赖于深的知识,但是还是依赖,但是在未来的话,我相信这一部分,第二往第三阶段的跳跃,还是靠核心算法的突破。我们其实在第一和第二阶段之间,大部分人都没有超过普通人,试想超过普通人,化学效应会非常大,真正的还是基础核心的研究,原创的技术才是推动整个人工智能变化的核心。

这是前面讲的算法的突破。后面讲讲对行业的看法,我们认为,所谓的基础的算法突破和核心技术的研究,其实很关键的一点,是要在应用场景循环打通的,商汤在做两件事情,第一是在应用当中定义问题,第二超越人类的水平,我举一个例子,一直讲说人脸识别,这是我们开发的人脸识别系统,比较传统和高清的,看得比较干净的人脸识别系统。现实当中,我们面临是这样一些真实场景,这是我们一些真实的案例,你可以看到,这边左右两个人,都是同一个人,你发现年龄跨度特别大,发型完全不一样,第三个到底是不是同一个人。都会非常怀疑。右边这张也是传统的,是店面的安装摄像头捕获的画面,分辨率这么低,在这个时候,我们用实际应用场景定义来解决,我们画这样一张图,图片很小,分辨力很低。

做人脸识别怎么办?美国FBI给了一个例子。这是一部电影,《谍影重重》。FBI在里面需要找到自己想要的人,通过电脑找到了目标对象。放大一看,这么不清楚。但是FBI是有魔法的,说变,就变成这样子了。好厉害!这是左边这张图,说一声变,就变成右边的高清了,现实当中可行吗?我们也怀疑,所以刚才的案例,同样的场景,大家想美国是不是有这个技术了?中国没有,我们也试一下,把左边的这张图变成右边的结果,这是我们的目标,现实情况呢?现实情况的算法,只能是这个样子。是清楚了,大家看得很清楚,但是如果说你要用左边这张照片,通缉犯的照片,来抓右边的照片,这有一种你在逗我的感觉。这里面的核心还是说核心算法的突破。它的应用广泛吗?很有意思。我们发表了算法,发表了这个成果之后,日本有一个网站,马上用了我们的成果,这个网站很有意思。原来这个waifu,就是太太的意思。日本人的太太就是漫画,他用网站做的事情,就是把漫画放大两倍,看到原始的细节。

我们来看一下这个事情研究是不是重要,在这里面核心的算法突破,Twitter在16年、17年都有这样相关的任务,因为他们都是在应用当中找到这个问题。他们的图像存储,压缩传输都是非常重要的,需要这样一个过程。我们很早就在应用场景当中时机的需求和数据驱动的方法,从14年到17年,把这个链条完整地传输出来。我们可以达到什么样的结果。我们来看看我们的结果。比原来漂亮一些,这个结果恢复出高清的,关键是用它识别人,我们来看看真实的场景,这就是刚才的真实场景,小图片。我们可以用我们的方法恢复出细节。小图片恢复出细节。在真正的实战当中也起到非常大的作用。这是我们的一个同事,这是在深圳实时对比,他们已经在公安完全上线了,这是后来我一看,这是华为的罗总,非常不好意思。跟我们很好的关系,跑去深圳的市局,一搜搜出来了,一看年龄差别很大。还有另外一个同事,可以看到模糊的,不清晰的,甚至有问题的。所以才会有人说,商汤的算法,一骑决尘,因为它真的是基于传统的链条。我们每个人的生活都被改变了。我们在安防里面,会记行踪甚至是车,都在摄像头里面被体现了,大家都不知道而已。

智能认证,比如说手机的登录,或者ATM取过钱,用过人脸,现在在深圳都有这样的应用,包括用手机做支付的时候,刷脸,现在高考系统,也已经用人脸来做验证,在试点当中,忘了带准考证,也可以考试。让考生不那么紧张。

这是稍微远一点间接的使用。以下人工智能进入社交APP领域比较多,现在苹果,小米、华为的手机相册,里面都有自动的人脸分类。再比如说,大家在朋友圈传过猫耳朵、兔耳朵,也是人工智能具体的体现,我们是背后算法平台的提供者。再比如微博的分析。

最后讲一下商汤在人工智能行业,我们希望通过商汤的合作伙伴,一起来定义问题,第二把这个问题做到超越准确率。

讲一讲我们商汤的愿景,我们还是希望坚持原创,让AI引领人类进步。

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15057083号-1