编者按:本文来自“长石资本”(ID:LongCapital-),作者 袁皓。

一、人工智能,风口?疯口?

人工智能可以说是VC界2016年以来除了自行车(摩拜、OFO等)外最火的投资主题了,作为风险投资人如果不在自家的基金投资策略矩阵上放一个人工智能投资方向,你都不好意思说自己是做VC的。特别是,自3月份,Alphago战胜韩国围棋高手李世石的世纪之战开始,很多投资者及创业者的目光都聚焦于人工智能这一块,资本跑马圈地,创业BP一言不合必称AI+,不时冒出机器学习、深度学习等炫酷名词。

就像几年前的O2O、P2P、共享经济的创投浪潮一般,AI是不是一个引领未来趋势的风口,还是只是一个烧钱走火入魔的“疯口”? 

人工智能爆发的原因

熟悉人工智能发展历史的同学都知道,这已经是人工智能的第三次高潮,第一波高潮是源于1956年的达特茅斯会议,人工智能概念初出茅庐就得到各界的吹捧,然而,人工智能并不如人们所想象的那样乐观,1970年左右研究就陷入缓慢的泥沼,热情消退。

80年代,崛起的日本提出雄心勃勃的“人工智能电脑”计划,该计划随着1987年Lisp机器商业化的失败,AI再次进入低迷期,人们意识到人工智能的问题不仅仅是硬件,更多的是软件及算法层面得不到突破。

第三次的浪潮基本上源于90年代,由于摩尔定律所到来的产业变革,人工智能得到长足发展,代表性事件如1997年IBM的深蓝在国际象棋比赛中战胜世界冠军卡斯帕罗夫,Geoff Hinton在2006年发现了训练高层神经网络的有效算法,并且在2012年的ImageNet评测领域大大突破了以前的算法。

深度学习算法的应用使得语音识别、图像识别、取得长足进步,围绕语音、图像、机器人、自动驾驶等人工智能技术的创新企业大量涌现。

如果我们深层次去探究这次人工智能浪潮的原因,可以归为于以下几个变量:

云计算,云计算技术的这些年已经发展成熟为大众化的服务平台,无论是IAAS、PAAS还是SAAS,它们所提供的基础技术平台为人工智能技术的实现和应用落地提供了强大的后台保障。云计算降低了IT资源使用门槛,为数据集中化创造了基础,极大地促进了大数据产业的发展。

大数据,大数据是智能的基础和土壤,没有数据就没有智能,所有的智能都是建立在数据的基础上,移动互联网及物联网的普及使得大数据这今年的的迅猛发展,从而也助推了人工智能的长足进步,这是因为人工智能技术使用统计模型来进行数据的概率推算,只有把这些模型经过大数据海洋中的不断优化或者“训练”,深度学习算法输出的结果才能更为准确。

从市场规模来看,全球大数据总量仍出资不断扩大,2015年数据总量达到8ZB(1ZB=1万亿GB),2020年将达到44ZB,今后的5年预计仍将维持CAGR141%的高增长。

GPU及计算能力,这几年计算能力的指数级增长、成本急剧下滑是人工智能得以迅速发展的前提,而GPU的崛起则是一大重要突破点,GPU图像核心处理器是吴恩达团队于2009年发现的,GPU芯片相比于CPU拥有更多的计算单元,GPU实现了并行计算架构,可一次执行多个指令,从而可以迅速解决计算问题。

同时微软及Intel也在力推FPGA(现场可编程逻辑门阵列),相对于GPU来说,FGPA在峰值处理上较弱,但架构灵活性方面更为突出,尤其在处理小计算量大批次的运算时也更有效率些,FGPAs主要来自一家名为Altera的公司,由于错过GPU,Intel不惜以167亿美金的代价豪赌将Alter收入囊中。

Nvidia’s GPU (GTX 1080) 只需花8美分即可处理1GFLOPS(每个GFLOPS等同于每秒10亿次的浮点计算),而在10年前完成同样运算量需要100美金。

深度学习算法,2006年Hinton提出“深度学习”神经网络是人工智能的重大突破,学术上对神经网络有区分为DNN(深度神经网络),CNN(卷积神经网络)、RNN(递归神经网络), CNN最初用来处理图像,RNN最早用来处理语音,在实际应用中,CNN、RNN等并不是独立使用,需要与不同算法及策略相结合,Alphago即是结合了增强深度学习和相关搜索的综合。深度学习的发展大大加速了人工智能的发展。

(注:深度学习过于学术,希望深度了解的同学可自行搜索公开课脑补,斯坦福大学公开课:机器学习课程,由大牛AndrewNg主讲;斯坦福的公开课:卷积神经网络CNN,由大牛李飞飞教授主讲;)

人才:AI的爆发离不开顶尖的科学家,需要有能力部署人工智能技术并且使之产品化的资深工程师,让我们先看看深度学习的四剑客:

  • Geoff Hinton,多伦多大学的特聘教授,Google AI团队领军人,Hinton是将BP算法应用到神经网络与深度学习的主导者。

  • Yann LeCun,纽约大学终身教授,Facebook AI实验室负责人,LeCun最负盛名的是在CNN(卷积神经网络)领域的杰出贡献。

  • Youshua Benqio,蒙特利尔大学终身教授,CIFAR项目负责人,Bengio的主要贡献在于他对RNN领域研究的推动,现任ElonMusk主导的Open AI首席顾问。

  • Andrew Ng,斯坦福大学教授,曾就职于谷歌,现任百度首席科学家。Coursera的联合创始人,在人工智能特别是在工程领域国际上最权威的学者之一。

人工智能的市场格局及发展态势 

人工智能还能目前还是国内外科技巨头为主,国外以Google、Facebook、IBM、Microsoft、Amazon、Intel等为主,国内以BAT及语音巨头科大讯飞为主。 

我们一般把人工智能的产业链,分为“基础层-技术层-应用层”,

基础层多为数据源、计算平台、芯片及传感器等人工智能运营的基础设施;数据工厂提供海量信息并通过数据挖掘及搜索算法进行分类与关联,提供给机器学习,GPU并行计算及高性能计算机芯片构成超级运算平台。目前基础层多为IBM、Intel、Google等巨头公司的主战场;

技术层依托基础层的运算平台及数据源进行机器学习建模,开发面向不同领域的应用技术,包含感知智能和认知智能两个阶段。感知智能包括语音识别、图形识别、生物识别及自然语言处理等;认知智能主要是利用深度学习等类人脑进行预测、判定等,技术层有大量创业公司,像视觉识别领域的Megvii、Sensetime、格灵深瞳、依图科技等,自然语言处理领域有云知声、思必驰等,其中语音识别是目前最为成熟的人工智能技术,目前全球排名靠前的有Nuance、谷歌、苹果,及来自国内的科大讯飞及百度的行业佼佼者。

应用层主要是基于基础层及技术层实现人工智能的各行业的场景化应用,诸如智能硬件、工业及服务机器人、智能驾驶、智能医疗、智能客服、智能投顾、BI、个人助理等。应用层因为技术门槛较低,吸引到众多创业公司的涌入。 

人工智能发展条件的成熟同时催生了大量人工智能创业企业。截止2016年11月,Venture Scanner 将1485 家人工智能公司划分为13 个细分行业,包括深度学习/ 机器学习(通用)、深度学习/ 机器学习(应用)、自然语言处理、计算机视觉/ 图像识别(通用)、计算机视觉/ 图像识别(应用)、手势控制、虚拟私人助手、智能机器人、视频内容识别、内容感知计算、语音识别、推荐引擎、语音到语音翻译13 个细分行业。其中深度/机器学习(应用)分类以约436 家企业的数量遥遥领先,自然语言处理公司数量232家位列第二。

从人工智能的创业公司数量来看,人工智能的创业呈爆发式增长,今年1季度所统计的全球创业数量只是957家,在不到一年的时间里保持了55%的增长。

从融资情况来看,人工智能的投资的资本投入仍保持每年42%的增长,2016年VC投资也达到了创纪录的2.5billion$。

从融资阶段上看,人工智能项目的B轮、C轮的融资情况保持良性增长。

伴随着人工智的技术上的迅猛发展,智能语音、智能图像、自然语言处理等技术的越来越成熟的应用,包括VC资本助推的水涨船高,这或许预示着,一个人工智能投资及创业的黄金时代的到来。

二、人工智能的泡沫与希望

新年伊始,中国围棋界就被一名“Master”的围棋爱好者搅得天翻地覆,“Master”连胜60局后揭开了他的神秘面纱-就是2016年年初赢得韩国九段高手李世石的“Alpha Go”,人类完败!

1 月 30 日,在宾夕法尼亚州匹兹堡的Rivers 赌场,卡耐基梅隆大学 ( CMU )开发的人工智能系统Libratus ,在共计 12 万手的一对一无限注德州扑克比赛中击败了四名顶级人类玩家斩获 20 万美元奖金。在经历了二十天的较量,Libratus越战越勇,四名德扑人类顶级玩家共计输给Libratus 176 万美元筹码。完败!

我们家娃最喜欢追的节目《最强大脑第四季》中,神乎其技的“鬼才之眼”“水哥”王昱珩以0:2的比分败给百度机器人小度,这一结果不仅令现场的观众齐呼“不敢相信”,也我们家娃(水哥的忠实粉丝)颇为忿忿不平。

就这样,不知不觉间,人工智能以一种喜闻乐见的娱乐方式走进我们普罗大众的面前。

诚然,在VC界也一样,经过2016共享单车的喧嚣和迷茫,AI已经成为创投界2017年投资主题的标配。

就在最近,开复老师做完一场关于《我不是李开复,我是人工智能》的演讲,在这个演讲中,“我姓人,名叫人工智能,我不是你们常看到的伪科学家”,这一轮VC人工智能投资热潮,也与开复老师的身体力行的推广功不可没。

李彦宏早在2016年世界互联网大会上就坦言,移动互联网领域已经基本不可能再出现独角兽了,下一个风口是人工智能。很显然,这个风口也吹到创业者的耳朵里了,任何创业项目都一哄而上都要跟人工智能扯上一点边,以便提高自己的估值。

伪人工智能项目都长啥样?

我最近看到的几十个AI项目,最后能入选投资标的池的不过两三家,其他的大多AI创业大多是批了一层“人工智能”的外衣。 

一个原来做智能硬件的创业项目重新换了个AI概念,声称运用了深度学习技术,成为一个精通人机交互的Bot,这个“AI”学习机存储了一些诗歌、游戏、简单英语对话内容,究其实质,不过是个幼儿学习机披上了一个机器人外形的“马甲”。

一个智能备孕的移动医疗项目声称自己运用了人工智能技术及大地提高了受孕的几率,“AI精准备孕, 让你好孕相伴,轻松造人”,究其实质不过是一个备孕体温计加上一个备孕成功概率的显示参数。

一个互金P2P项目声称自己运用了人工智能技术极大提高了信用贷款审核的效率和精确度。自主研发的“风控机器人”利用AlphaGo 的“人工智能”技术,建造出先进的“风险评估”模型利用知识图谱技术在几秒钟内完成信用审核,将人工信用审核效率提高了数百倍。殊不知,别家审核不过的高风险客户居然可以从这家机器审核中完美通过。

在我看来,这些打着AI旗号的项目都是伪人工智能项目,伪人工智能项目或多或少有以下几个特点:

1、伪人工智能很多是一个简单的“输入-输出”,深究其背后的算法和数据支持,往往只是简单的功能预设,系统根据用户的输入在预设模块里找到相应合适的匹配,再通过机器输出用户所想要的结果,系统里模块的数据都是人类人工预设好的。

海量数据是人工智能的基础,这是因为机器学习大量的应用都与大数据高度耦合,几乎可以认为大数据是机器学习应用的最佳场景。积累的训练数据越多,对未来的判断越准确。

没有海量大数据支撑,所谓的人工智能就是吹大牛。

2、伪人工智能往往不具备机器学习或深度学习的能力。有了大数据,这些大数据还需要通过不断地机器学习形成反馈闭环,才能形成真正的机器学习能力,机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法,通过利用数据,训练出有效模型,然后使用模型进行预测。

有效的机器学习通常在主流的几个学习框架下诸如Caffe,Microsoft Cognitive Toolkit(又名CNTK 2),MXNet,Scikit-learn,Spark MLlib和TensorFlow下面进行,机器学习通过有效的算法诸如回归算法(线性回归和逻辑回归)、SVM支持向量算法、BP算法(加速神经网络训练过程的数值算法)、聚类算法(无标签无监督算法)、降维算法(从高维降低到低维层次的无监督算法)、推荐算法等等;

同时,为机器学习或深度学习处理大量数据需要大量的计算能力,通常需要在加速器(如NVIDIA GPU)的高级高性能(HPC)集群上跑这些应用程序。

伪人工智能往往是在一个CPU环境下跑的一个简单的数据库,缺乏必备的核心先进算法和机器学习(深度学习)的框架。

3、伪人工智能项目往往缺乏必备AI背景的技术人才及落地能力,国内人工智能是最近三年才开始兴起,与互联网领域诸如电商、O2O等不同,人工智能要求的技术门槛较高,一个在机器学习领域0经验的工程师想转行做AI,至少需要2年以上的学习。这也是国内AI创业公司求贤若渴,开价百万也难找到优秀AI人才。伪人工智能创业项目往往只能退而求次找到与人工智能相关的工程师,所以在甄别是否是一家靠谱的AI公司,我们往往需要考察创业公司的技术背景和学术带头人。但是,有了科学家也不意味着AI项目能成功。

优秀的AI创业公司必须在某个领域(图像识别、语音识别、自然语言处理)的商业应用能力,我们还需要判断这个项目能否将团队技术优势进行落地应用。必须承认,资本都是逐利的,毕竟VC投的不是研究院,不以促进学术发展为目的,不以发paper为目的,而是要以产品为核心的商业机构。没有看到应用场景和清晰的变现能力,这个故事就讲不下去了。 

靠谱的人工智能的创业公司在做什么?

如前段所述,扒开伪人工智能外皮后,我们需要探究人工智能创业的成功路径在哪里?靠谱的人工智能项目在哪里?

靠谱的AI项目的发展路径如下图所示:

AI成功的要素不外乎以下五点:

  • 高质量的大数据(包括公开数据和合作数据)

  • 足够算力资源

  • 优秀AI技术人才及落地应用能力

  • 清晰的垂直化应用场景(问题与领域边界)

  • 持续的外部反馈

如前篇所述,巨头们(以AI联盟五巨头)已在AI布局很深,根据CB insights的数据显示,自2011年以来已有超过140家的人工智能公司被这些巨头收购。在巨头环伺下,人工智能创业还有那些商业机会?

我们认为AI的商业化应用首先建立在一个前提,即是,AI相关技术的成熟度。以目前AI较为成熟的技术主要集中于:

  • 计算机视觉(可以普遍适用于安防、无人驾驶、机器人、医疗)

  • 语音识别(智能客服及在线教育)

  • 深度学习(金融风控、智能医疗)

  • 传感器(智能家居)

在行业应用方面,我们认为工业机器人、金融、医疗、安防、教育等领域将具有较强的刚需,因而创业公司在这些领域进行布局,会有较大的创业胜算,同时,这也是因为巨头目前还在底层基础层、技术层等鏖战,还无暇顾及这一片战场。

从长期来看,无人驾驶将是个巨大的市场,但无人驾驶涉及到的是一个非常长的产业链,技术上也涉及控制学、汽车零件、视觉、激光雷达、云端、GPS高清地图、整车制造等各个环节,这是IT巨头诸如Google、Uber、Baidu、Mobileye以及汽车巨头本田、特斯拉、BMW、奥迪等豪门的战场,没有一个公司能涵盖无人驾驶的所有领域,创业公司如果要分一杯羹也只能涉入某一个细分领。

关于人工智能的未来展望

正如《连线》杂志创始主编凯文.凯利(KK)的预测,“人工智能将是下一个20年颠覆人类社会的技术,变成像电、互联网一样的基础服务和革新力量”。AI将毋容置疑是个发展大趋势。无论我们去拥抱还是回避,人工智能都会如水电一样渗透到我们的各个领域。

根据IDC在其《全球半年度认知/人工智能系统支出指南》(Worldwide Semiannual Cognitive/Artificial Intelligence SystemsSpending Guide)中预测,人工智能的收入将从2016年的80亿美元增长到2020年的470亿美元,复合年增长率(CAGR)为55.1%。

但同时我们也必须意识到人工智能的创业在目前已经处于泡沫之中,这里面鱼龙混杂混了不少伪工智能项目,我们预期在短期内(2017年下半年到2018年)这个市场将会出现一个估值调整,人工智能会出现泡沫破灭,一批伪人工智能项目将被市场所淘汰,而那些坚持到2020年左右的AI公司将会有机会终成大器。

正如《第二次机器革命》中所述,“任何足够先进的技术都称得上是魔力之源”。我们相信人工智能所带来的新技术将超越一切以往,人类社会将实现“指数级增长、数字化进步和组合式创新”,但我们仍需保持一分清醒,十分耐心,因为未来很美好,道路很曲折。

参考阅读:

《我不是李开复,我是人工智能》

长石资本袁皓:人工智能,风口还是疯口?泡沫还是希望?

发表评论

电子邮件地址不会被公开。 必填项已用*标注