互联网

高峰对话:智能、数据、赋能

来源:艾瑞网    作者:艾瑞网      2019-06-13

导语:“数能”的升级让一系列全新的应用场景呼之欲出,高峰对话分享将透彻解析未来的“数能变量”的机遇。

【艾瑞网 直播】6月13日,2019艾瑞(北京)年度高峰会议于北京国贸三期大酒店盛大召开,引领业界同仁共同预见智能未来。峰会以“数能驱动新变量”为主题,与全球科技领域大咖、数字营销专家、行业精英一起,把握时代先机,探索科技创新的潜能,领略最前沿的技术应用与行业发展。以大数据、人工智能、新零售、智创营销、5G技术、大文娱为着力点,链接行业价值,见证中国商业力量的崛起。

以下是“高峰对话:智能、数据、赋能”的演讲实录。

高峰对话.jpg高峰对话:智能、数据、赋能

主持人:
(左一)艾瑞咨询首席信息官  张一帆
对话嘉宾:
(左二至右)新浪集团首席信息官 王巍
量子保联合创始人、副总裁 焦霖楠
百分点首席数据科学家 杜晓梦
第四范式副总裁 柴亦飞

张一帆:各位好!我是艾瑞咨询的CIO张一帆,非常高兴能够邀请到四位重量级的嘉宾跟我们一起分享,在智能化时代的元年,把他们所知所学,工作经验中带来的无限能量分享给大家。通过一上午各位专家的分享,大家很清楚感受到了智能化的元年,真的已经来到我们的面前。每一个专家分享都不断强调一件事情,数据、数据、数据。数据这种生产资料看上去不像我们以前的建材,是个专业的供应商提供,也不像是货币,是由专门的监管机构来印制,看上去它来自于任何地方,来自于外部,来自于内部,想邀请一下各位嘉宾分享一下,你们看到的数据都来自于哪里,它们在我们智能化过程当中,到底带来什么样的意义和价值。

王巍:我抛砖引玉一下。新浪集团发展到今天,媒体的烙印打的非常深。从目前来讲,微博是我们的社交媒体平台,我们也有新浪新闻app,是移动时代的智能媒体平台。按照最新公布的数据来看,微博月活用户4.6亿,新浪新闻客户端,我们没有公布过数据,艾瑞有这方面的数据,艾瑞的数据还是很靠谱的,我们新浪新闻客户端月活用户1.5亿左右,在行业里面我们排名第三。

所以从用户数据量角度来讲,我们还是月活在上亿级双平台的媒体公司。我在新浪是负责信息方面的工作,新浪在数据处理这块很早就有自己的分布式数据处理平台,大概日均处理数据量在数十PB,累计已经处理好的数据近百PB。这是从我们数据处理角度来讲的。从业务角度来讲,以微博举例的话,我们怎么合理利用这样一个社交媒体平台的数据,是非常重要的。利用社交媒体开放的网络社交特色,我们存储了千亿用户的网络社交关系,通过用户的社交关系,用户跟实体的网状关系,我们推演出来开放式的知识图谱,这在中国互联网领域是独一无二的。在开放的知识图谱上面,我们做了相关的内容推荐,商业推荐,在这方面,我们还是有很多心得和体会,这也是我们的特色。

柴亦飞:第四范式服务更多客户过程当中来看,大家都知道人工智能的基础是数据,我们今天认为技术做得比较好的行业,之前的关注仍然是更偏结果性的数据,它描述的是一件事情最终的结果,我们对这件事情整个发生的过程之中,整个过程的数据的捕捉,其实是做得非常不足的。我们要观察什么样的过程导致什么样的结果,我们对它做什么样的预判,要完成这件事情的话,有大量的在过程中的数据化和信息化的工作要做。我现在看到各行各业都已经意识到这个问题,也开始在做这个事情。我相信未来不管我们今天在哪个数字化的阶段,都有非常多的工作可以值得去做的。

杜晓梦:数据概念,不是什么新的概念。我认为一切可以被记录下来的信号,都可以是数据。比如说古人的结绳祭祀,都是要记录下来。包括记史册这些。我们这个时代数据产生哪些变化,我们如何理解大数据的大这个概念,我们这个时代的数据,有很多新的特征,比如说多元异构性,比如说我们小数据的时代,分析更多的是结果型的数据,更多是数字型的数据,你的CRM数据,ERP数据,智能化时代,我们分析文本数据,图片,语音、影像等等,我们把这些数据打通了,完成一个工作,或者解释一个问题,这个是这个时代的特点。

因为我来自保险行业,所以说保险行业是非常严重依赖于数据的行业,我们知道保险公司有一个数据部门称之为精算部门,精算师主要工作是根据这些风险概率来对产品进行定价,比如说我们知道大概每年飞机失事率为百万分之一来定这个价格。大数据出现之后,特别新的消费场景出现之后,对于保险行业的定价带来很大冲击,现在新的网络安全险,包括退换货险,包括航连险,这些都需要跟第三方合作,进一步吸收获取数据,来对新的风险进行定价。所以说现在保险行业是非常急需和大数据公司和产品进行合作,更多的为更多场景保驾护航。

张一帆:四位嘉宾都讲到一件事情,当你的企业想拥抱智能化的路上,你需要大量的数据,而这个数据不简单的来自于外部,很重要的是内部能力的提高,从而使得大量内部的数据线沉淀下来,然后融合外部数据,才有可能产生比较好的作用力。我想同样有一个问题,通过大数据的手段,通过数字化手段,把数字资产沉淀下来,但是什么时候有那么一个信号,什么时候我真正可以走向智能化,到底是什么样的信号,或者在哪些方面比较容易入手智能化,四位有什么经验可以分享的?

焦霖楠:其实智能化第一步离不开数据化,如果没有完善的数据基础,建一个空中楼阁,达到智能化的产品。我们公司是专门做新型产品保险的定价,比如说我们有一个产品,我们为驾校考试的学生,考试不过的保险,如果考试不通过我们进行赔付,现在有数据化基础,我们要知道每个城市,每个省是什么样的定价水平,我们知道,我们应该给每个驾校大概定什么样的保费赔多少钱,这是一个基础,它需要大量的数据工作,需要每个城市抓取数据分析,第二个,我们根据这些历史数据的分析,来预测在什么样的时间段内,什么样地区的考生,他大概通过率多少,我们进行动态的定价算法。比如说什么样的驾校在哪个地区,什么样的用户,应该定什么样的价格比较合理。可能是逐渐地从数据化到智能化演变的过程,智能化离不开我们数据化的基础。通过各种真实数据的迭代运行,慢慢就成了智能化的结果。

杜晓梦:关于这个问题的话,我想谈一点感受,很多我们服务过的公司,在过去几年里面,他们会有一个误区,我要做技术,我要做大数据,我要做人工智能,其实没有很好的思考的一个问题是,我到底出发点是什么?我想跟大家去说的是,从过去到现在你的业务问题,其实都没有变化。零售还是做零售的事情,营销还是要把营销做好,服务还是要把服务做好,只不过说我们现在可以利用新的技术,更好的解决我的业务问题。现在大部分的人工智能和大数据解决的问题,它都不会是无中生有的问题,它都会是说怎么样把人的效率变得更高,所以其实我们要在做智能化和数据化之前,需要考虑清楚的是,我的业务核心到底是什么?我怎么样通过技术,来提升我业务效率,而不是说反过来,我先要建一个大数据平台,这种都是工具。

柴亦飞:从我们的观点来看,一个是说如果我们今天从企业管理层角度认为未来我的企业核心竞争力,在一个特别大的大场景上面,我其实毕其功于一役,把这件事情做到极致,我该买数据买数据,我该建AI大数据,就该做大数据的投入,今天找到核心竞争力的大场景,在这个行业没有显著大场景的话,AI的低门槛和普遍化和高效化是非常重要的事情,我如果每个场景都能提升50%,代价非常低,我让普通IT的人,原来不是作AI的人,花两个星期,就能尝试做应用,就能在整个企业里面,100个200个500个场景里面,很快能找到AI提升的点,这是两个都可以同时做的事情。

王巍:我还是从媒体角度讲这个问题,媒体很重要的三个流程就是采集、编辑、播放,播放现在也叫分发。在采集的过程当中,大数据时代,我们的内容越来越多了,在微博上面,每天播放量都是2000万到3000万级别的,视频量都是几百万级别的,我们怎么样能够在海量的数据上面去发现热点,而且是千人千面的热点。我刚才跟大家介绍过,我们有智能媒体平台,新浪新闻app作为媒体平台,我们后台使用的工具叫鹰眼,这个鹰眼做什么事情呢?

新浪集团整体的数据后台都是打通的,我们用的鹰眼工具,其实它是探针,监测包括微博,包括我们各种内容来源,实现全媒体监测,它不是一个传统意义上的程序,它其实是每隔几秒钟,或者是每隔几分钟,抓同一条新闻阅读量的变化,有了这样的探针以后,我们可以去发现潜在的热点。或者即将爆发的热点,微博从成立到现在,已经有快十年了,我们后台的数据累积下来所有的热点,包括垂直热点,它从引发、引爆到传播,到再传播的过程。所以我们后台大数据和机器学习的能力,能够学到一些典型的热点爆发的路径,从而帮助我们去预测热点,或者是预估热点。

举个简单的例子,微博上面的娱乐明星,可能是在半夜的时候删除她跟她老公的照片,在半夜12点的时候,我们的探针,我们热点预估的一套机制,能够及时发现这样一些潜在热点,准确地把相关的新闻推送给对娱乐感兴趣的用户。如果在人工编辑的时代,可能更勤快的编辑也是在第二天早上才发现这样一些行为数据,这个其实就是作为智能媒体,我们利用我们的大数据,利用我们微博开放数据平台,开放媒体平台,来及时发现热点,引爆热点的应用。

张一帆:大家也注意到一件事情,我们的王总,还有焦总,其实他们比较深的是关注在数据本身应用环节当中,他们有很多现实场景,直接很细节的应用条件和应用环境可以跟大家分享。不太一样的是柴总和杜博士,他们帮助客户解决问题,也就是为什么出现了说,数据化也好,数字化也好,智能化也好,本身是术,术是方法,并不是你有良好的工具你就一定赢,相反你是不是能够把好的工具放到你的业务工具中。事实上我们可以看到一件事情,把这一场转变,因为核心是业务问题,业务驱动方法论,业务驱动技术,在这个过程当中,我不知道各位你们遇到最困难的事情是什么?能不能分享一下?在这个过程当中,所有都会遇到。

王巍:我从我们行业角度来讲一下。做媒体平台,有一个很重要的问题,就是我们内容质量的问题,虽然现在这个时代,人人都是媒体,但是我们作为耕耘时间比较早的门户媒体和媒体平台,我们对内容质量的要求还是非常高的。在这个过程当中,会涉及到一个问题,我们讲到内容过滤,敏感内容过滤的问题。

在以前的时代,每天门户网站自产的内容,一天在几千条的量,我们有一个编辑团队来做这个事情就可以了。现在进入自媒体时代,内容量的增长是几何级的,在海量内容里面,我们不仅要挑出精选的内容,怎么样过滤掉敏感的或者是不安全的内容,一直是我们非常大的挑战,可能利用早期的模式识别技术,通过特征提取,来做相关内容的过滤也是有效的,但是效率不是很高。经过大数据,经过人工智能时代以后,我们看到更好的技术,比如说深度学习,就像去年Google开源的那个模型——“卷积神经网络”。

我们会看到这些模型,这些新的深度学习技术,做敏感内容过滤方面,非常有效地提升了我们的工作效率。就像主持人说的,敏感内容不断出现和我们的审批、审核效率是一个矛和盾的关系,我们只能不断地提升我们的模型效率,利用新的技术,利用人工智能技术解决这方面的问题。

柴亦飞:从我们来看,今天遇到最大困难,包括我们试图解决的事情,就是产能和供应量的问题,以现在AI技术水平,大规模应用AI技术到各行各业各种场景,还是很依赖于你有一些十年八年计算机或者是AI的博士,有很有经验的人才能有好的效果,从17、18年Google也做这样的事情,试图解放这件事情完全依赖于非常专业资深的人做这件事情,人不管是在客户侧,还是在我们2B的服务厂商这一侧,这些事情不强依赖于大量人力的投入和专业人才的供给,能让各行各业AI应用广泛的去爆发。我觉得在我看来,这件事情是整个行业要解决的最大的问题。

杜晓梦:一点的话,我们在服务这些各种各样行业做数字化转型,我们会看到一个比较痛的痛点或者是困难是,业务和技术之间的隔离,这个有的时候是很严重的,有的时候技术来负责推动大数据和人工智能在企业里面的落地。但是它有的时候会忽略掉业务的需求,或者是业务具体的痛点是什么,而从技术角度去开发各种工具和产品,这样的话,就会导致你做出来的智能化的工具和企业业务侧是推不动的。这个是我们看到比较大的困难,举个例子来说,美国一家知名的公司,他做得很好的一点就是业务和技术很好地结合,用它工具的人都是业务专家,业务专家懂了技术,从而去做一些破案等等工作。同样在中国,我们为公安一些领域开发的产品我们会发现,我们的技术人员不太懂公安的业务,同时公安的业务人员也非常不懂技术,所以他其实还存在一定的时间和空间需要我们把业务人员培养成技术专家。这个差距是要逐渐缩小的。第二个可能的困难,无论你在做企业,还是政府也好,其实做到全域数据的拉通有很大困难的,不仅在技术上,其实很多时候,部门之间的藩篱,以及一些政策性的问题,你无法把全域数据拉通,这是我们看到比较严重的两个困难。

焦霖楠:我们应用时候的两个困惑吧,一个是人工智能投入产出比,首先人工智能肯定会提升效率,带来效率的提升,关键是一个量级,它是百分之几的提升,还是量级的提升,这个在企业应用中会有一些考量。比如说我们做机器人客服和自动理赔,无需人工接入作判断,一方面需要有一支这样的团队,需要一个团队持续迭代更新这个事情,同时节省人力,看不出来特别明显的变化,如果智能达到一定量级之后,带来量级变化,应用起来会更加快一些。第二,还是人才的缺失。因为整个现在有一些算法,怎么样进行算法调优,还是需要更多人才的出现,以及更好数据提供商的出现。主要是这两方面。

张一帆:非常感谢在这个时间里头,大家在特定的时间,我们在高手如云的峰会当中,大家把自己的真知灼见分享出来,大家在智能化这条道路上,在数字化这条路上,有很长的路要走,假设我们用一句话,在最后这个时间讲,能不能总结一下,在你眼中数字化和智能化,这条路上,你们认为什么是最关键的?或者你们正在做的最关键的事情是什么?作为这次分享的句号。大家希望用什么样的话分享给大家?

焦霖楠:我觉得智能化肯定会来,我们也在路上。

杜晓梦:我觉得世界是由数字推动的,一定要有这个信念,你在过程里面会遇到很多的问题,一一的试错,但是一定要相信,未来的世界,一定是由数据推动的。

柴亦飞:我们在做的事情就是有一天把AI变成今天的水电煤。

王巍:数据是最重要的资产之一,贴近业务的使用数据,把数据变成AI赋能的重要手段和基础,是我们通向未来重要的途径。

张一帆:非常感谢,就像我们艾瑞这18年来,今年是第18个年头,我们艾瑞随着互联网行业,我们一直恪守自己的本分,做行业的记录者,用数据的方式,把行业客观展现给大家,我们使用数据希望向大家揭示这个世界的真相,也可能技术不断更新,但是从内心中你选择什么样的方式与数据一起并存,你如何跟数据进行对话,可能是一切的起点。再次感谢四位重量级嘉宾,给我们带来的分享。感谢各位的聆听。谢谢!

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号