杨洋博士,iPIN创始人,大数据及人工智能领域专家。曾任欢聚时代(YY语音)全球化项目负责人。iPIN(爱拼网)是一家基于人才大数据的个性化职场资讯网站。iPIN得以为用户提供真实、中立和精准的独有职场资讯及各类量身定制的信息服务。
活动:2016年4月17日,杨洋受香港城市大学EMBA(中文)课程邀请,进行“人工智能的未来,招聘智能化创新展望”主题分享,笔记侠作为战略媒体合作方,经活动方和嘉宾授权发布完整笔记。
笔记:笔记侠 深度好文:8116字|9分钟
全网首发 · 笔记导读
一、人对于信息的感知:我们要想做出一个正确的决策,必须在每一点上都要感知正确、认知正确、分析正确,然后才能作出比较理性的决策,所以人对信息使用的这个过程,其实是非常复杂的。
二、人工智能的浪潮:第一波浪潮主要引领的是计算智能;第二波浪潮是递归神经网络的诞生;第三波浪潮就是深度学习的诞生。深度学习迎来天时、地利、人和。
三、是不是所有的机器人都可以代替人类?并不是,因为:人工智能的解释性差,理解人类的能力差,逻辑能力不强,缺乏意识。
四、目前世界上人工智能技能四个阶段:第一计算智能,第二感知智能,第三认知智能,第四类人智能。
五、人工智能在2016年爆发可以说是天时地利人和。因为云计算的大规模普及,让应用成本大幅度降低,感谢计算能力的突破以及互联网计算能力的催生。
六、公司的招聘、人力资源环节可以利用人工智能得到更高效的提升;
七、人工智能的三大障碍:
1、积累海量的行业数据
2、拥有掌握人工智能核心技术的人才
3、管理层拥有数据意识
全网首发 · 完整笔记
人工智能的概念电影传得很神乎,但真正的原因是一些天时、地利、人和相结合,导致它的突然爆发。
人是怎样理解信息的?
首先,跟大家分享一下,人到底是怎么样理解信息的?比如让我几个月大的儿子在这里的话,他根本不知道我们在说话还是唱歌,但我5岁的女儿就能听懂我说的一些字词,尽管她不知道是什么意思。
所以人对于信息的理解,其实不是一个那么简单的过程。
我属于连续创业者,经历过三次创业,可以说每结束一次创业,自己看待创业的问题,那种成熟度和知识度是完全不一样的。
可能不同的人看同一份简历分析出来的结果是不一样的,但基本上我们最常用的分析的那些点其实都是差不多的,当然也有些东西分析出来是对的,有些分析出来是不对的。
我们是怎么样去理解信息的?分了几个步骤去理解这个信息?这个过程是怎么发生的?
人对于信息的感知
什么叫感知?
比如我几个月大的儿子,在座的是不是人,他其实分不清楚。那对于我5岁的女儿呢?她可能在想:这到底是一个“士”还是个“土”?是“博士”还是“博土”?这对她来讲真的是一个很难的问题,因为她正在处于认字的一个初期。
对于机器来讲,感知智能就是机器对于信息的认识,现在全世界人工智能的工作大部分都停留在这个层面。那人呢?比如看到博士之后,领导会说这是一个学历信号,会想到博士、硕士,然后再往下想,博士是一个比硕士更高的学历,可能我们能思考到,但可能对于很多人来讲,博士已经是最高的学历,有没有人觉得博士后最高的?
我们要想做出一个正确的决策,必须在每一点上都要感知正确、认知正确、分析正确,然后才能作出比较理性的决策,所以人对信息使用的这个过程,其实是非常复杂的。
现在的确是人在很多上面的认知比机器(从广义上来讲)要厉害。但机器好处是:在它的认知范围内,它犯错的可能性比人要低,机器的最大特点是不知疲惫,比如给它一个词典,它一下就全部学完了,取决于这个词典、教材编得好不好,如果编得好的话,这个机器就会有很高水准,如果编不好的话,这个机器也就学不好了。
人工智能发展的浪潮
第一波浪潮
第一波浪潮主要引领的是计算智能。这波浪潮起来之后,没过多久就消散了,因为很快就遇到瓶颈了,虽然机器能做事情,能帮忙证明一些定律,但在实用性上并没有太大的突破,比如机器无法跟人交流,无法识别图像,它最大的作用就是计算智能。
第二波浪潮
接下来是90年代前后,就是递归神经网络的诞生,它研究如何将图像识别出来,最大的特点就是能整个舒展,前后上下文连接在一起,然后用神经网络去识别,但效果并不是很好。
递归神经网络在90年代的中国掀起过一波浪潮,当时整个中国研究人工智能的那一批人都把精力铺在了上面,但受限于当时计算机的水平,而且当时递归神经网络还有一些数学问题解决得不够好,所以这个问题看似是看到一个巨大的希望,一个突破口,但没有真正在使用方面得到一个很大的应用。
这是第二波浪潮,递归神经网络兴起很快,但直到90年代后面慢慢没有人再提这个概念了。
第三波浪潮
就是深度学习的诞生。
神经网络是RNN(循环神经网络),现在是CNN,CNN是卷积神经网络。
其实物理学也有一些类似的,如果在一个空间处理不掉一些东西,就把它转换到另外一个空间。比如在信号学里面,经常要取一些信号波段,它有点类似,就是把它分层,分成很多层之后,发现可以识别出不同的信息。
CNN(卷积神经网络)
深度学习好在哪里呢?它是2006年提出来的,提出来之后做了图像方面的简单处理,直到2008年的时候都只是在学术界轰动,在业界里面没有多大轰动;但是到了2009年,这个东西一下子爆发了,开始有工业界的人用它去做各种各样的尝试;直到2013年彻底爆发。
这是深度学习迎来的天时、地利、人和的一个大环节。
这是人工智能史上的三次浪潮以及三次浪潮的原因。
牢记RNN、CNN,为什么?有一个好处,就是当你以后再跟人家去谈神经网络的时候,你只要把这两个概念甩出去,保证让他们直接都说不出话来。
大量做统计的或者做数据挖掘的,都号称现在所谓的人工智能的最大区别,在于这个公司是否掌握了深度学习技术。
深度学习为什么那么难呢?现在还是人工智能发展的早期,可能再往后两年这个东西就没有那么难,比较容易应用到很多领域里,但目前在这个阶段还很难。比如我们公司做的东西,也不可能一个场景一个场景去应用,很难将文本理解应用到很多领域去。
所有的机器人都可以代替人类?
很多人觉得人工智能好像很恐怕,是不是所有的机器人都可以代替人类?其实不是这样的。
1、人工智能的解释性差
解释性差是什么意思?
举个例子:
比如AlphaGo下一步棋下到这里了,国内很多顶级的九段高手说:“我都想跟AlphaGo学这一步棋了,这一步棋下得真的是妙。”但说实话,如果AlphaGo是个人的话,它就是一个傻子,因为它根本不知道这步棋妙在哪里,对它来说只是下了一步棋,它的思维方式跟人的思维方式完全不一样,人可以解释这步棋妙在哪,但AlphaGo根本解释不出来。
所以这是目前人工智能遇到很大的问题,为什么?它的问题在哪呢?它把很多信息转化到人类根本无法理解的一些信息层去处理了,因此,机器人目前思考的方式是人类根本不可能理解的这种方式,它不具备这些。
再举个例子:
商学院是面对社会,跟人去打交道的,做法一定要具有可解读性,所以目前但凡是要跟人联手操作,需要去交互的情况下,人工智能都很难突破,因为要如何让机器人理解人类?这个被称之为类人智能,类人智能是一种通识性的东西,它能够懂很多东西,而且能够快速自我学习。
目前对人工智能来讲,可能还有很长的路要走,我觉得至少十年内是很难的事情。
2、理解人类的能力差
我们随便说一句话,或者联系对话的上下文,它要如何理解这一块是目前做得非常差的,甚至学术界都不知道该怎么去做这个事情。
3、逻辑能力不强
什么叫逻辑?
举个例子:我为什么来这里?我为什么今天来这里跟大家分享?这是有很强的逻辑关系的。
但是,我们日常工作大部分事情逻辑并不是那么强:比如我开车,那里有红灯我就停车,这是简单逻辑;但遇到复杂问题的时候,比如那里有个绿灯让我开,然后有个警察打个手势让我停,这个时候机器怎么判断?
这还不是复杂的事情,真正复杂体现在哪里呢?比如我们公司有个项目是跟法律公司合作的,是研究法院的判决书,原告遇到什么事告了被告,被告反诉又提供了证据,法官又认罪事实一二三,驳回事实一二三,最后来了一个判决,这是一个强逻辑。
这个场景下逻辑的应用就非常重要了,到目前为止全世界范围内对于逻辑的应用都非常不成功,即便是语言逻辑,就是主谓宾这些东西判断,机器在英文里面识别准确率是百分之七十六点几,中文里面做得最好的是哈工大的计算机学院院长刘挺教授,他也只做到比英文落后两个点。当然,他也说他已经很骄傲了,因为中文实在比英文难。
我刚才说感知智能到认知智能,然后再到分析、决策,这中间每一步都是七十四点几的话,那么结果的准确就非常差了,只有百分之二十多,所以我们现在追求准确率到百分之九十几,这样才比较好。
4、缺乏意识
媒体采访会搞一些哗众取宠的东西,比如人工智能会毁灭人类吗?然后这个问题就会被炒得很火,虽然人工智能的发展总是超出预期,但我有时候在想:意识到底是个什么鬼东西?怎么才能让机器拥有意识呢?我觉得这是不可能的事情。
意识是一种物质,信息是什么?信息也是一种物质,它是有重量的,人死之后,信息到底以怎样的形式存在?意识呢?我自己很不看好人工智能发展能够让人工智能有意识。
至于许多人的担心,人工智能会不会毁灭人类。我认为,在人工智能超级发达之后,如果有人人为地为这种“超级人工智能”植入一些意识,甚至“毁掉人类一切”这样的指令,是有可能的。
人工智能主动发现电脑系统各种漏洞,这个很有可能。但要是毁灭人类,归根到底它的意识是属于人的意识,不是机器的意识,我看不到机器人产生意识的可能,除非像电影上似的一道闪电闪过。
目前世界上人工智能的产业和生态的问题
人工智能技能分四个阶段:
1、计算智能
计算智能是最开始驱动人工智能一个很重要的东西。
为什么叫计算智能而不叫别的?因为那个时候所有的电脑软件游戏,用的都是穷举法,就是把所有可能性算出来,算到结果。所以基本上属于算的都是计算智能和博弈论,博弈论出来很久了,那个时候等于属于利用计算机的计算智能再加上博弈论作出博弈。
2、感知智能
能够像人一样感受到外面的信息,这个信息一共分为三类信息:图像、声音、文字。当然还有一种信息,目前完全被人类忽略,比如脑电波、皮肤的感应等嗅觉、味觉这一块的信息。
3、认知智能
人工智能不仅要能识别这个文字是什么,这个图像是什么,这个声音是什么,还要能够去识别它背后的含义。AlphaGo之所以能够引起那么大轰动,就是因为它在围棋的认知能力上已经超过了人类,还有谷歌的无人驾驶、讯飞的机器翻译、今日头条的新闻推荐等。
4、类人智能
这个属于人工智能希望达到的最终的目,但目前只能在电影里面看到:里面的机器人产生了类人智能,甚至有点真的智能,它产生了爱情,开始理解什么是爱,什么是喜欢,那是比较理想化的,目前人工智能其实都是集中在这个阶段。
目前所有做得大的公司,脸书、谷歌等都希望能够达到类人智能,但是目前想达到这一步难度非常大,甚至我觉得一家公司不可能做到,所以后来有些公司就做了一些open AI,比如我们公司做的智能东西,通过结合的方式把它们全部串在一起。还有谷歌、脸书、微软都推出了开放接口,希望大家把技术全部传到上面,用它们的技术,让它们能够掌握更多理论智能。
这是人工智能的四个阶段。
为什么人工智能在2016年爆发?
可以说是天时地利人和。
1、云计算的大规模普及,让应用成本大幅度降低
举个例子:
做人工智能必然要有大量的数据,大数据从哪里来?从外面获取需要成本,我们的公司因为云计算普及,这块成本降低了50倍,这是很实用的一个数据,所以云计算对我们做人工智能有极大意义。
2、计算能力突破
电脑里面的芯片都是CPU,深度学习把计算机的计算速度提高到160-250倍,数据哪来?百度首席科学家吴恩达就提升到了160倍,我们公司其实已经提升到255倍,而是也是用类似的技术。这意味着什么?意味着我们以前要花200多台服务器的钱,现在只要一台服务器搞定,一台服务器12万,这个成本让我们有了跟大公司去抗衡的资本,没有这个东西根本搞不定。
3、互联网催生大数据
各种数据都有大量的人在整理。
比如做数据平台化战略,数据的积累比原来快得多,而且凶猛得多。2016年人工智能爆发都是因为这方面的技术,还有文本的基本理解,文本转化为矢量的计算,这些东西的关键技术都在2016年取得了突破,2015年比较成熟,然后爆发。
2016年人工智能的爆发确实有非常多天时地利人和的因素在里。我认为“人工智能+”是比“互联网+”要更加凶猛的一个东西,它未来会渗透到每一个行业,未来我们做的很多事情都会有人工智能来去帮我们优化。
企业如何实施人工智能
随着人工智能、人机交互和高速计算技术的发展,很多人的工作正逐渐被电脑取代,甚至很多新闻说百分之四十六或者百分之七十几的未来会被取代,现在看来真的不是危言耸听。
因为机器人的效率和分析能力,尤其在垂直行业的发展越来越强,甚至强到我们没办法跟机器人比,因为它不累,而且它的知识量、计算速度远超人类。
举个例子:
有人觉得机器人没有创意,其实我觉得机器人最不缺的恰恰就是创意,为什么?我研究谷歌如何优化机器人的创新过程,研究了两年多,创新这个模型,在数学里面就是随机模型。什么叫创新?就是你有很跨界的背景,然后再加上非常发散的思维,就很容易产生新的有用的东西。创新就是新的、有用的。
所以,未来人工智能的革命确确实实在发生。
新兴市场有一个名字叫作KWA,就是知识工作自动化机器人。原来的工业革命是蒸汽机代替人做事,但它做的是体力劳动,人工智能是让机器人代替人去做脑力劳动的事,尤其是职业规划、HR投资助理等,很多基础性的知识,一些重复、单调的。所有那些你觉得完全依靠经验,脑力劳动、重复单调觉得很没有价值,对自己没有能力提升的,基本上都属于会被KWA机器人所替代的。而且这个市场规模非常大,有报告预计在未来十年后这个市场将会达到5.2万亿到6.7万亿美金,相当于中国一年的GDP。
人工智能三大障碍
1、积累海量的行业数据
什么叫海量的行业数据?这个数据不是存储有多少的事。
电信运营商的数据量非常大,绝对是PB(PB等于1024TB)级别的,但是他们的数据结构并不是特别复杂。而iPIN的数据存储量虽然并不特别大,但是关于人的数据是极为复杂的,仅可量化维度就有几百维度,算上知识文本的维度就非常高维了。这么大的数据量积累起来是非常不容易的。
有了海量数据之后,还必须要有一个好的架构来存储数据。往往我们会发现,一些公司的数据被存储在不同的部门,而各个部门之间没有相互打通,这样的数据对于决策的参考和帮助价值其实是非常有限的。
2、拥有掌握人工智能核心技术的人才
人工智能的核心一定属于数据。
这是最近这两年我被问得最多的问题,尤其最近有一个房地产公司想成立一家合资子公司,想用我们这个技术去颠覆房地产技术匹配的问题,当时提的要求是钱没问题,但要求给他组建一个人工智能团队,我一听就直接拒绝了。
这不可能,我自己花这么长时间组建团队,以我的能力也只能组建一个,要我帮你组建一个,我觉得这是不可能的事情,如果你们是大公司,有足够的资金实力,我觉得还是可以尝试的。
以我对很多国内大公司的了解,人工智能人才主要还是聚集在美国,中国国内培养顶尖的人工智能人才,基本遇到了一个很苦逼的环境,中国整个数据环境的生产可以说落后美国很多年。
90年代,美国做了一件事情,很多大的公司都实现了数据战略化。举个例子:美国的沃尔玛,93、94年还有一家很大的超市,其实根本不比沃尔玛小,但是它却输给了沃尔玛。因为沃尔玛用了ERP系统,将所有公司资源全部数字化了,它能够知道自己的资源使用率是多少,成本是多少,通过ERP降低公司整个企业程序,这对于这种超市物流管理非常重要,所以数字化对于商家有极大的帮助。
美国从90年代到2000年初有一批大的公司商业化,他们要求BI,就是Business Intelligence(商务智能)要做到第四层级,要全部打通那个层级,才能实现全公司能够达到商业智能的水平。
但目前全中国真正达到BI第四层级的公司,我目前知道的只有两家:阿里和腾讯,腾讯可能还处在三级吧,阿里则是一个实现了百分百第四级的公司。
阿里2009年引入了一个人,这个人后来给阿里巴巴建立了ODPS(大数据计算服务)的数据通道,它能够让阿里将任何业务上实时产生的业务,能够实时送到通道,而且送到全储道和最需要的地方去。
这个事情是非常牛逼的事情,当时我知道这个结果之后非常惊讶,阿里居然做成了,它做成这个之后,就可以有和谷歌、亚马逊叫板的资格,尤其它还建了阿里云。阿里云是我见过最像亚马逊的真正的云计算的公司,阿里在建设数据人才可以说是不遗余力。
3、管理层拥有数据意识
这个不说了,如果老板想干嘛就干嘛,如果老板不想干嘛,你怎么说都没有用。
很多公司不重视数据,不是说老板认识不到数据的作用,而是可能他自己也不清楚这个数据做成之后到底会给公司带来多大收益,因为做任何事情都要考虑投入产出比,所以当时在不是很了解收入产出比的情况下做这个事情是很痛苦的。
公司决定为任何一项事情引进人才都涉及时间、金钱方面的投入,要想项目真正运转得好,还需要引进的人才能够推动落实。这就导致另一个尴尬,因为数据人才都是很贵的,市场的供需比严重不平衡,本身就是一个成本很大的事情,万一别的部门不配合,事情就难以推动,公司的投入也就打了水漂。
招聘的环节以及人工智能的展望
1、招聘
招聘是非常长的链条,要从最开始做人力资源规划到预测。
什么叫人力资源规划?
大多数是公司现在要做什么?下一步要做什么?每个团队分配怎样的人力资源?比如给你几个人,报过来审批,大概是这样一个流程。
在美国有一家公司,它专门帮公司做人力资源规划,它是帮你分析你的竞争对手的人力资源规划是怎么做的,通过那个来指导你怎么做。所以它是面向CEO层的,它真的把人力资源当成战略去做,而不是支撑业务去做。
我觉得未来人力资源方面有很大提升空间,要去规划,去提高预测的准确性。这是我们公司目前也在做的事情。
2、培训
为人工智能的老师量身定制一些课程,这块或许跟教育有关。
比如E-Learning(在线学习系统)本来就是很大的市场,但目前为止也没有看到特别好的实例,虽然各个公司都在投入在线教育,E-Learning也非常深入地在研究人工智能,但目前为止并没有看到特别好的效果。机器不能理解人,你要如何讲得人能喜欢听?比如新东方的老师真的很牛吗?其实未必,但他们很会讲课,能够激发你学习的兴趣,这是人工智能目前做不到的一点。
3、绩效
可以实现高度自动化学习化,包括美国在内的很多学校教育都在做新的尝试:不用再考试,通过平时做作业打绩效分。
对人的绩效能不能不要去定季度的Q1、Q2,而是采取平常的工作,根据平常很小的一些任务就给自动化的评估,这样更能调动人工作的积极性。
4、薪酬报告
这块不属于人工智能,更多是属于大数据。
比如我们现在掌握着全中国5000多万的薪酬数据,这些薪酬数据要怎样更好以一种个性化的方式存在?我们目前在做一种尝试,不是看什么薪酬报告,而是找到跟这个最像的人,他们在哪个公司,拿多少钱。通过这种方式去做一些动态、实时、个性化的东西,这也许是未来一个大的机会。
5、员工关系的维护
国外有一家公司可能才成立三年不到,去年他们的高管来我们公司访问,问我们:“你认为它进入中国可能性大吗?”因为他们在美国才成立三年不到,就已经发展到了3000多员工,一年盈利20亿美金左右的规模,这非常快,非常夸张。
他们将整个员工入职的这一块全部包干了,员工入职流程有很多东西,比如各种社保、医保,全部都做到系统化里,这样公司省事,员工也有选择,同时也有更多社保、医保公司给它付费。
中国社保、医保这一块是国家控制的,可能不会像美国有这么大的市场。不过国外确实有很多在做员工预测离职的分析。比如我原来听说的:如果你发现一个员工老是周三、周四请假,那这个员工是要走了。
目前全球人力资源的生态
1、人才的获取、招聘、入职
人才的获取、招聘、入职,属于公司内的人才管理,HR的核心管理,这个是国外的市场。
我当时在美国一直在研究这件事情,回国之后给我的感觉是:国内的人力资源市场跟国外的人力资源市场感觉不在一个星球上。
为什么呢?
国外公司大量使用各种软件系统,国内发工资还是人在发,美国全部是电子化了,当然他们没有人敢欠税务局的钱。每一块领域都有很多公司在做一些智能化服务。每个领域我觉得都有很大的机会。我当时的判断是,我最近对美国市场不是那么熟了,我感觉那个时候两国在人力资源系统的发展相差有七、八年之大。
2、面试评估
这一块的智能化在中国做得特别低,你要对这个做背调(背景调查),这个人的教育经历和工作经历是不是真实的,其实在美国一下子就可以搞定,在中国就很难搞清楚了,其实成本并不高。
举个例子:
腾讯最近跟哪家公司签约了,需要委托别人去做背调。其实背调在美国已经属于高度自动化了,直接把你的搜索ID给我,我就能查到你的经历是不是真的,在中国技术上是完全能够实现的。其实在征信行业已经实现了,我们在想这块能不能有个很大的优化。
3、谈薪录用,背调
有些公司在这一块会做,但中国一半属于绝对OK了再去做背调,薪资未来是可以信息化的,可以变得更强。
4、入职
这一块在国内有一家公司开始在尝试,但做得也不大。
5、考核
我是不专业的,我经常也跟别人交流考核到底应该怎样做,因为我发现随着公司规模、业务性质、公司文化的不同,考核也需要不断去改变,我感觉这块可能不是数据能够简单解决的问题。
谢谢大家!
笔记侠合作伙伴:混沌研习社|创业邦|领英中国|36氪|中欧商业在线...