艾瑞网

互联网

云从科技创始人周曦:计算机视觉 人工智能入口与产业化思考

来源:艾瑞网    作者:yangkun      2017/8/30 11:16:16

导语:计算机视觉,其实是关于图像和视频的识别,实际上是属于人工智能感知里面非常重要的一部分,确实是可以改变各行各业的方方面面。

【艾瑞网 直播】2017年8月30日,由艾瑞集团主办的2017艾瑞(深圳)年度高峰会议在深圳瑞吉酒店召开。

随着互联网时代的高速发展,商业模式不断迭代迅速,立足根本、探寻源头的思考方式显得更为重要。本次峰会就以“追本溯源”为主题,聚焦“人工智能”、“科技金融” 、“大数据”、“创新营销”等多个行业热点,汇聚行业领袖及大咖,共同探索互联网前行的方向!

以下是云从科技创始人周曦发表题为“计算机视觉 人工智能入口与产业化思考”的演讲实录。

周曦.jpg云从科技创始人 周曦

周曦:先介绍一下我自己,我是一个科研人员,我从2003年开始做声闻识别,声闻识别就是识别声音是谁在讲话。2003年我们在中科大是美国声闻识别的冠军,2004、2005年我们做语音识别,在那个时候微软的两个研究院还是我们做科研这块很神圣的地方。

2006年我在科大讯飞呆过一段时间,那个时候科大讯飞还没有上市,语音识别还不像今天这么有前景,当时我觉得就前景的是图像识别。我看到一个视频,在游泳池下面放一个摄像头,可以看到一个人在水下是溺水还是在玩水。我当时发现图像有更多的东西可以帮助到人,所以2006年我到了美国,我开始做图像和视频这一块。我从2007年到2011年我们拿的6个世界冠军。到了2010年我开始想一个问题,我们好像是在学术圈做了很多的事,但是没有帮助到大家。因此在2011年我们回到中国做研究,我们希望把这个技术产业化。其实我们做人工智能很多年的时间,1968年好莱坞都认为我们未来会这样或者是那样,但是我们一直没有做到过,我们搞的研究领域很远,但是没有实现,这个问题出现在什么地方。

我做的是叫计算机视觉,其实是关于图像和视频的识别,实际上是属于人工智能感知里面非常重要的一部分,我分了一下从我们软件层面来说分感知用这个三个层面来说到人工智能。感实际上是我们技术上叫传感器,我们人的感觉来说相当于我们的五官,视觉、听觉等等这些东西就是感。

知是什么,我们看到这个画面我们去理解,我们看到今天在座的每个人,他们的什么表情,你们去理解这件事叫知。用是我们下一步要采取什么样的行动,比如说我们要去营销他,还是帮助他,还是有什么其他的举措。

计算机视觉为什么重要?跟人一样,我们70%、80%的信息都是来自于视觉的,听觉比较少。即使是我们讨论听觉,大家知道亚马逊做了一个系统,早期是一个音箱,后来亚马逊把它变成了一个语音识别的操作系统,让所有的硬件服务商可以接入,之后在美国创建了一个新的入口,这个也导致我们国内有大量的厂商跟风做了很多很多的语音识别的音箱,但是在国内做这件事情好像没有亚马逊成功,这个问题出在哪?实际上中国人的使用习惯和生态和美国人是有很大不同的。

我想跟大家分享的是说,一个语音识别就可以用亚马逊这样的巨大的突破,但是计算机视觉是比这个多得多,现在动态识别就是所谓的安防、金融等等的分析,如果是和自然语音结合,可以应用在各行各业,计算机视觉是一个非常大的入口的应用,我们为什么搞了这么多年,其实并没有搞出什么东西来,甚至没有搞出一个真正让产业产生巨大革命的东西呢?这个问题出在哪?我自己的判断,最大的一个问题是出在技术不成熟上面,我也很喜欢好莱坞拍的这些电影,但是我们从来没有做到过。今天前面的嘉宾也讲过,现在已经对人工智能的伦理进行探讨,会不会反抗人类,但是实际上非常可惜的是我们人工智能的水平其实还远没有大家想的这么高。

大家是不是有看到在上周五的晚上中央电视台一台有一个节目,中央电视台聚集全国最顶尖的人工智能做对抗,看现在是人聪明还是机器聪明,第一期我们人工智能输掉了。结果有很多人跟我们打电话,大家觉得人工智能怎么会输给人呢?非常抱歉就是这样的,原因是什么呢?因为围棋是在一个固定的规则里面走,虽然是棋盘有19×19个格子,但是就是19个,棋盘上只有白子和黑子,它的搜索空间是256的一百万次方,所以在图片这么一个规则上,我们人工智能要完全的战胜人类是蛮难的,所以技术是目前很大的问题,这个是之所以我们没有看到大突破的原因。第二点是人工智能真正要发挥作用要需要把所有的东西整合在一起,光有技术解决不了问题,实际上需要智力资源、数据资源,如果没有这个做结合的话,光是有人脸识别技术,有语音识别技术不能帮大家解决问题。之所以人工智能能够火到这个地位,实际上前两年把这些资源准备好了,这个时候人工智能就起到了一个画龙点睛的作用。

人工智能到底能解决什么问题,存在一个我们是不是能和真正的行业做很好的整合的问题,三个问题整合在一起才可以把人工智能真正的用起来。我们首先要有平台,国家也是这样想的。所以国家发改委在今年年初的时候也选定了几个国家的平台,国家发改委选了百度腾讯和科大讯飞,和我们作为人工智能的大数据平台,做平台级的应用,有了这个平台以后,在上面我们还得需要是真正的深入行业去做这个事情。

在技术受限的情况下,还远远没有到大家说的把人搞定的问题,到底我们能够在行业里面有什么样的机会。其实我想跟大家说的是,今天人脸识别是什么,人脸识别基本上是图像识别里面很简单的应用,就是尚且还是很难,为什么它很难呢?当我们要去公安系统做这个事情的时候,他希望是在一张非常模糊的照片,可能拍半个脸的情况下,把它精确的识别。第二种如果今天监控十百万百万人在大街上有人经过的时候,如果一旦有失误,对公安系统将会是极大的浪费,这种情况下我们能做什么?人工智能这个平台部分,原来是把通用数据和计算资源都已经准备好了,人工智能要做人工智能的技术层和应用层。技术层是算法,应用层是和行业的整合,接下来在通过不同的区域把它推广到真正的使用中去。首先讲算法,在算法这个部分做人工智能的企业必须要把里面所有的算法仔细研究,这里包含多少算法呢?

以人工智能为例,听起来就是一个识别的算法,实际上是非常长的链条,从一个图片里面检测、跟踪、分割、3D旋正、光照、表情、分辨率等等所有的因素全部把它组合到一起,在我们所谓的深度神经网络,和用条件对抗网络等等一系列得到更好的效果。也就是说最后我们看其他是一个科研问题,实际上是大量的模块,同时是一个工程的问题。这块做好之后人工智能的平台上面的所有的模块有了之后可以去拓展到其他的应用,但是我还要再强调一遍,不同应用的难度是非常不一样的,同样是做图像,做无人驾驶的难度远远图像识别,所以我跟大家说无人驾驶是很难在未来几年使用的。

我们自己公司当然就是在这块做了非常大的研发布局,这个我不详细讲了,我们在美国的几个研发中心,在国内的几大研发中心,以及我们和上海交大的联合实验室,以及我们和一系列的国内外的都有联合实验室。

我们有这个技术我们能把客户解决什么问题,今天我到银行去,我跟银行说我们的识别很准,我们现在有最好的人脸识别系统,我们的识别率能到99.999%,这个跟银行有什么关系呢?银行关心的是什么?所以我们跟银行说这件事是没有意义的,我们要说的是另外一件事情,我们通常跟银行是这样说的。今天有一个网点,今天银行在十三五期间他说我们的银行的网点要变成产品的展示中心,变成用户的体验中心和我们的其他的服务的营销中心,这个就是新的三大中心的提法。

我们现在跟他讲的是我们现在要用人工智能帮你实现这一点,怎么实现所有的这些服务,所有的网点以后所有的人进入网点,每个客户来是你最好的营销机会,在这里会做很多的事,首先他是不是你的VIP客户,是不是来你这很多次,他有没有看你的理财广告,有没有看你的汇率变化,在跟你的客户经理交流的时候情绪是不是好,是不是把信息准确的传达到他,这个是人工智能要帮助做的事情,网点是不是一定要有人的网点,网点是不是一定要固定在一个屋子,我们是不是把所有的金融工具摆到金融大楼里面去,摆到所有的商场里面去,我们是不是有移动端,我们是不是把网点进入到各个方面,这个是我们跟银行探讨的问题。

因此我们把人工智能整合到这个步骤的时候,银行会觉得我们是他们最好的伙伴,包括云从会成为整个银行的各大供应商。

人工智能据目前有限的技术来说是不行的,必须结合场景来做,这个是我们在公安系统的场景,我们就不详细的介绍了。这一点我讲一点,在现在人脸识别中国的技术好于欧盟的,这个是因为我们中国在这一块的投入以及整个市场的体量,以及大数据的收集都是远超过欧盟的。

最终是我们的识别系统本身是一个系统,确实是可以改变各行各业的方方面面,但是有三个局限,第一它的技术并不是无敌的,在很多层面上不够使用的。第二必须要结合大数据,必须要结合智力资源。第三要深入行业,这三点做到的话,才可以真正的做到行业里面掀起一场人工智能的革命。谢谢大家!

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15057083号-1