互联网

深鉴科技联合创始人兼CEO姚颂:人工智能芯片产业发展之路:新阶段应对新思维

来源:艾瑞网    作者:      2018/5/24 10:54:23

导语:我们更多的是需要找到国外相对薄弱,我们有特色的应用,把芯片和整个产业应用场景结合起来,这才是未来发展上有希望的一条路。

【艾瑞网 直播】2018年5月23-24日,为期两天的2018艾瑞(北京)年度高峰会议聚焦 “智能·无界·决策”,在北京国贸三期大酒店盛大召开。艾瑞峰会汇聚众多互联网行业领军人物、创新者,企业决策者一起看清机遇,改变惯性,开拓认知商业新视野。

以下是深鉴科技联合创始人兼CEO姚颂发表题为“人工智能芯片产业发展之路:新阶段应对新思维”的演讲实录。

姚颂.png深鉴科技联合创始人兼CEO姚颂

各位好!非常高兴跟大家做个介绍。我是深鉴科技的CEO姚颂,大家可能知道我们是一家芯片公司,我今天跟大家讲一讲这个行业的发展思路。

深鉴是2016年正式成立,之前从2012年开始,在清华跟斯坦福两个实验室共同开始对于深度学习专用处理器体系结构的研究,到目前为止积累了一整套完全的自主知识产权的深度学习处理器的结构设计等软件应用。目前分布在三个行业,包括智能安防、智能驾驶和云计算。我们更多注重于基础层面。

我们几个人也都是清华的师兄弟了,包括联合创始人,也包括我的导师和师兄,目前团队都是出自于清华的电子系和微电子系。之前我们做了很多研究,跟商汤不同的是我们更注重于对于算法的优化、硬件设计、处理器结构的设计。在深度学习方面一个最好的学术机构ICLR拿过论文奖。在全球范围内率先研究与发表稀疏神经网络处理架构,在ISCA也拿过论文奖。为了节约时间,我更多向大家讲一讲我们的思路。

大家都在讲AI和芯片,我们公司也比较幸运,正好现在处在大家关注的交叉领域,这个芯片跟原来的芯片有什么区别呢?其实这是一个非常大的行业。

大家都在说AI芯片,到底什么是AI?我们说AI时,它有很多不同的方向。现在常用的机器学习只是其中一个方向而已,机器学习有决策数、有SBR、有各种各样不同的算法,机器学习只是AI的一个小部分而已。机器学习又有包罗万象的东西,它是各种各样的神经网络。但是深度学习又是大于神经网络的概念,比如说做物品的检测、图像的分割是像素级识别,这时不仅仅是一个神经网络,可能还要额外加一些东西。可能大家都在说我们是一家AI公司,AI芯片公司,但其实大家都需要想清楚自己是什么公司。

大家都在说AI芯片,之前有个报道说整个流水线上排的AI芯片都有30家了,真的有这么多的AI芯片吗?咱们芯片有通用芯片和专用芯片之分,通用芯片最后用的是CPU,所有应用都能从CPU跑起来。大家能从这些方面感受到AI,从AI到机器学习到深度学习,到部分的神经网络,AI也可以对应芯片这条轴从最通用到最专用都有可能。

比如说我能把所有的机器学习都跑下来,来设计一种芯片。首先通过大数据学习训练出算法模型,然后从应用上做推引,这是天然的两个阶段。这两个阶段如果只做各种各样的网络,其实是结果是无穷大的,因为你可以改变你的算法结构。针对其中某一个算法结构做个芯片,这个芯片其实是容易做的。我只能跑我自己一个算法,它也算AI芯片。

AI芯片这个行业跟传统的CPU处理器芯片有什么区别呢?任何一个芯片用到实际场景中去,最上层有应用,最下层有系统。首先应用是压缩,我需要给压缩开发一定的软件,这个软件要求程序员一定要在个开发的环境里面。比如说大家学C语言的话,最开始学的话会用编辑器,最终把文件通过编辑器和操作系统翻译成C语言跑起来。

大家一定听说过X86,X86是一套指令集的统称,是英特尔用的指令集。这个指令集有什么好处呢?CPU要求什么东西都能跑,我这个X86指令集一定是拆得最细,不管什么运算,算个加法、减法、除法还是什么,这个指令集天然割开了上层应用设计和下层芯片的设计,这个指令集什么应用都可以拆成它,所以我做CPU的公司完全不用关注应用是什么。CPI要做的是先把指令集定义好,我就专心的开发芯片就好了。我把芯片的性能搞得特别好,面积搞得特别小,功耗特别低,这就是它的能力。最后这个芯片能不能生产出来,那也不一定。这个芯片还要落实到主板、电路板上,这也不是CPU要做的。

假设给大家一个CPU,它比现在大家用的CPU英特尔强一倍,现在电脑上除了Windows自带的所有软件都不能用,你是选择差一倍的CPU,还是用一台任何浏览器不能装的电脑?这个时候我们有一个问题,就是过于头痛医头,脚痛医脚。大家觉得芯片有问题是性能不够,其实不是性能不够。这个里面有个问题,我是所有的算法都支持,还是只支持一部分算法,还是做取舍。比如说看谷歌的TPU,今年开发的第一代,就这是论文里面第一代的结果。谷歌TPU第一代为一个结果做了优化,就是谷歌Net第一个版本,设计的结果是谷歌Net可以全部装在芯片上。性能指标,最下面一行写得是峰值性能是92个TP,标红的左边叫LSTM0,核心性能只能跑到3.7,非常低,利用率只有4%。如果跑到CNN0,能跑到86%。

现在的芯片设计,其实大家已经跨过了把芯片和应用独立拆开来看的阶段,进入到软硬件协同的阶段。我的芯片这样跑应用怎么样?我这个芯片公司怎么样跑算法层的事情?只有这样把芯片性能发挥到更好,才能更好的让客户把芯片适用到好的应用场景。

但是,对于AI芯片公司来说这个事情就比较尴尬,因为X86指令集是三四十年成熟的指令集,它需要有无数的开发者愿意为你开发处理器和应用。对于AI来讲,不会有太多的开发者为你开发操作系统、开发处理器,开发上层的软件环境。对于AI公司,要把这些都做出来,如果做不出来,你的用户看不出使用效果。你只能跟他说,我设计的芯片很牛,用户跟你说你给展示一下哪里很牛?那你就不能像Windows电脑一样。

上一周高通把它的服务器CPU部门裁掉了,因为芯片本身是一个重投入、毛利常常不那么高的领域。任何一个芯片的研发周期至少两年,高通一款CPU的研发周期大概在五六年之间。除此之外,你卖芯片比卖系统收入少十倍。你卖系统比卖服务收入又少十倍。大家说我做芯片你真的能做一个核吗?没有可能。

比如说检测,比如说定位,比如说路迹规划、可视化等,把它直接做好,用户拿到就是完整的板子,直接插车上就能用。在检测上,如果能力比英伟达好很多,我把英伟达检测换成我的板子就可以,所以你发现它卖得不是性能,卖的是服务。

英伟达的核心竞争力,单纯从性价比的角度,它并不比别人好。为什么在服务器领域,你的客户愿意忍受着比别人贵五六倍的价格,还要用英伟达的产品呢?这是因为在GPU和垂直行业里面,它还能同事给你提供垂直行业的服务。

去年我找英伟达的CEO吃饭,我跟他打赌,我说英伟达两年内会卖一个没有GPU的芯片。让我很惊讶的是,他们今年就没有卖GPU芯片了。最右边的图是在CES2018发布的Drive Xavier SoC,这是什么概念呢?大家家里会用160、180游戏显卡,单纯从显卡的角度它连家用显卡的六分之一不到。除了做出车辆中控的显示,GPU不做任何的计算,所有计算不是通用的GPU。

我们公司拿了很多国际上的钱,我们也是国际化做得比较好的公司。像三星、赛灵思都是我们的合作方,赛灵思的软件开发环境等,全是我们公司帮它做,它在数据库的读写等很多领域,都有合作伙伴,因为基于它从板卡到芯片到软件应用层的服务。Victor Peng成为它的CEO,而不是负责原来芯片开发的VP或者是销售的VP,这是非常明显的转型信号。

最后,商业的思维。刚才王老师也提到咱们国内的应用很丰富,我经常会感觉到一种无奈。因为我们在硅谷呆得时间比较多,会认识到很多的芯片架构师。你会发现他整个核心团队都已经在这个行业引擎工作了30年,你发现国内这样的人才非常少,国内真得有独立设计CPU的团队,因为有丰富经验的人真得非常少,两只手数得过来。在这样的地方,只能默默地追赶,但是人家也在发展。我们做得还是要发挥自己的优势,找到对方更多的薄弱环节。

国外也有几家做芯片的公司,你会发现所有国外AI芯片的创业公司全只做一件事就是云计算,而且是连训练都做,就是因为咱们国内没有这样的环境。我们更多的是需要找到国外相对薄弱的环节,做我们有特色的应用,把芯片和整个产业应用场景结合起来,这才是未来发展上有希望的一条路。谢谢大家!

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15057083号-1