编者按:本期对话嘉宾为云知声创始人CEO黄伟,他如何打造云知声“金字塔”式的研发模式,创业六年,又如何看待行业的现状与未来?一起听听他怎么说!
本文系智能工作室(公众号smartman 163)出品,此篇为AI英雄人物第67期。聚焦AI,读懂下一个大时代!
作者 | 丁广胜
六年的时间发生了很多事,时间不停地洗刷着每个行业。
成立于二零一二年的云知声更像是一支向着目的地挺进的长征队伍,任务明确,投入兵力,按照既定作战方案稳步推进。
这是创始人黄伟自信的来源,资料显示,云知声的合作伙伴数量超过2万家,覆盖用户超过2亿,云平台日调用量3.3亿次,覆盖的城市超过647个。
黄伟毕业于中国科学技术大学并获得博士学位,毕业后任职摩托罗拉中国研究中心资深研究员,期间开发出了世界第一款手机声纹认证系统。后出任盛大创新院核心高管,并创建了语音分院;随后于2012年创立云知声。
他曾连续三年参与美国国家标准技术署(NIST)说话人识别评测(SRE)项目,获主任务第一名,是目前为止唯一一位在NIST评测中连续两年做Keynote Speaker的华人。
“金字塔”式的研发规划 修炼好内功才能厚积薄发
在他看来,云知声的“金字塔”式的研发规划,保证了他们在过去六年始终保持在行业一线,同时,未来六年依旧如此,因为他们的“基础建设”非常完善。
那么,何为“金字塔”式的研发?金字塔的底层是DeepFlow集群,这个异构化硬件服务器集群,可以向上提供密集的计算和存储能力,保证研发团队充足算力的支持,黄伟称,在2018年计划拓展到1000GPU以上的规模。
而中间层是Atlas超算平台,这是分布式机器学习并行计算平台,内部协同共享AI底层研发技术成果,可以迁移复用到各个领域的应用。
“我们在2012年就把深度学习做出来了,这个是我们确定的大数据方向,全面深度学习化,我可以负责任的说,那时中国95%的高校教授,都没有听说过深度学习”黄伟告诉智能。
而“金字塔”的顶层,则是应用层技术,比如有ASR、TTS、NLU等应用层技术的输出,黄伟称,可以理解为云知声建立了一个核心能力,这个核心能力是AI,然后AI通过一种云端芯的产品架构体系,把它生产出来,然后应用到不同的应用场景。
谈到应用,2018年被称为人工智能落地元年,落地将变得至关重要,黄伟的关注重点是IoT和医疗等领域,“我们要把积累的势能释放出来,毫无疑问,今年我们在智能家居、机器人方面会大规模的出货”。
“由应用场景推导AI芯片研发是AI创业公司的最佳路径”
目前,人工智能芯片大行其道,无论是传统的芯片巨头英伟达、英特尔、高通,还是手机厂商发布的AI芯片苹果AI1、海思麒麟970、高通骁龙845、三星Exynos 9810、联发科曦力P60,以及创业公司地平线的征程芯片等等。
我们逐渐嗅到红海的味道,究其原因,芯片是人工智能非常重要的计算载体,以及感知载体,它承载着人工智能非常重要的环节,必不可少。
但黄伟认为,大家都做芯片,但芯片其实包括几大类,大家有重叠但都有各自的市场和发力点,比如英伟达的GPU是用来支撑特别高的计算量,这方面毫无疑问是巨头们的战场;还有一种是云端芯片,这类芯片主要用来做一些云端的认知决策,比如Google的TPU等等;还有一种则是云知声、地平线们做的事情,这类芯片是终端芯片。
而做终端AI芯片最重要的是由应用场景来定义整个芯片的产品形态和逻辑。
黄伟指出,在芯片产品形态方面,云知声已经过很长时间的探索。从市场着手,云知声在智能家居、智能音箱、儿童教育机器人等市场方面已经基于IVM(通用芯片方案)的产品形态,验证了市场、产品、用户场景的合理性。而伴随合作客户在更多产品种类和形态上对成本、稳定性、集成度等方面的呼声愈高,进而推出自研AI芯片就成为一件水到渠成的事情。
黄伟表示,早在2015年云知声就组建了芯片团队,2016年公司开始就市场、产品、技术路线以及芯片下游合作方的评估。2017年启动芯片产品定义、IP选型、算法优化、工具准备,以及详细产品定义和技术模块评估工作。目前,云知声AI芯片UniOne已经流片,即将对外发布。
“在芯片这件事儿上面,我们至少领先三年的时间节点。可能出来的时间点正好赶上了AI芯片大热的时间点,不过这也算是对我们前期投入的一个奖励吧,”黄伟告诉智能。
面向IoT人机交互场景的AI芯片
至于云知声芯片的定位,黄伟表示,在IoT的人机交互的大背景下,AI算法对设备端芯片的并行计算能力和存储器带宽提出了更高的要求,传统的芯片架构在这两个方面却捉襟见肘;另一方面,尽管基于GPU能够在终端实现推理算法,但其功耗大、性价比低的弊端却不容忽视,而IoT设备与手机不同,形态千变万化,需求碎片化比较严重,因此很难跨设备形态的问题。因此,只有从IoT的应用场景出发,设计定制化的芯片架构,才能在大幅提升性能的同时,降低功耗和成本,同时满足AI算力以及跨设备形态的需求。
“同时,无论是大的产品还是小的产品,有屏幕还是无屏幕的,人机交互相关的共性东西,应该把它提取出来,并且固化下来,从这个意义上讲,芯片是最恰当的方式。我们这款芯片可以说是第一款面向IoT人机交互场景的AI芯片”。黄伟说到,从商业的角度看,目前市面上所有的芯片,并不是针对人工智能来设计的,它很难把算法的威力发挥出来。
此外,大家采用的模组组装的模式,好处是能够快速出货,但因为受限于成本,很多时候只能选择市面上计算能力比较差的芯片,而东拼西凑之后会出现良品率低等问题。
所以,云知声的做法是,从算法公司的角度出发做终端芯片,它并不需要有特别高的计算能力,打造出一个够用的芯片,他们认为做得再多的话,成本、功耗等各方面都是浪费。而且他们的芯片选择对计算进行加速,对算法加速意味着你对它的能力做了限制的,而对计算加速就是“练内功“。
黄伟强调,最重要的是芯片的定位,而不是跟风。想清楚未来的生态是什么?客户在哪里?因为芯片是高投入、高风险的行业。
AI的浮躁时代已经过去2018年将出现“分水岭”
黄伟在朋友圈谈到,“年纪大了,最近经常半夜醒来”,面对记者,他坦言也有创业维艰的原因,作为创业者需要面对来自投资人、客户、员工、市场等等方面的责任,时不我待,他不能止步不前。
智能硬件行业经历了过去两年的浮躁期,开始回归理性,黄伟认为,2018年将是行业的“分水岭”,大家开始关注落地,有能力的公司开始释放势能,而对于没有先发优势的公司来说,如果你没有颠覆性的东西,就很难再获得投资人和市场的关注了,因为时间窗口已经过去,而在人工智能行业的几个主流赛道里面,都诞生了独角兽,所以的资源都将向头部公司倾斜。
“通俗的讲,过去几年你还可以靠吹牛拿投资,但今年开始就没那么简单了,”黄伟说到。
对于人工智能行业以及人机交互如何发展的问题,他谈到,人类的交互主要依靠耳朵和嘴巴,视觉可以让我们看到更多的展示内容,语音可以让我们主动表达,二者缺一不可,互为补充,所以,语音和图像一定是未来的主要交互方式,键盘输入或者鼠标输入,本质上是违反人性的,未来手机不见得是我们的必需品。
根据调研机构GfK的数据,2015年中国智能音箱零售量只有1万台,2016年增至6万台,2017年1--8月共累计销售超10万台,而随着2017第三季度众多新品的推出,仅在2017年8月,智能音箱市场就达到了同比178%的增长率。
交互革命已然来临。
当然,公众对于人工智能还存在质疑的声音,最近优步自动驾驶致行人死亡事件闹的纷纷扬扬,引发大家的恐慌心理,AI威胁论再次被大家热议,对此,黄伟提醒,技术应该安全第一,在科技进步和人类生命安全之间,毫无疑问后者更为重要。(完)
注:《AI英雄》专访隶属智能工作室,每周围绕人工智能领域讲述一个人物故事,洞察技术趋势,捕捉行业机会,关注人的价值。转载请注明出处,违者必究!