当今的智能语音系统格局还是由硅谷三巨头三分天下,分别是苹果的Siri、微软的Cortana,和谷歌的Google Now。不过国外的语音助手由于系统或是网络服务问题,使得部分中国用户不能使用,也因此造就了天朝中文语音助手的蓬勃发展。比如科大讯飞和国内众多手机厂商联合推出的智能语音助手,以及腾讯在微信5.0上内置了自家微信语音助手等。 

语音交互过程通常分为三步,首先通过语音识别技术将语音命令转为文字,然后通过语义识别技术将文字转换为意图,最后调用各应用API或者网页来完成命令。

奇点机智CTO林德康告诉36氪,这种“对话框+后台服务”接入方式对于开发者来说有三个弊端。比如将语音助手和应用API连接是个比较复杂的过程,需要软件工程师完成。另外想要接入此类语音助手需要在功能方面进行一定的调整,符合其开放的API接口,这在某种程度上限制了应用设计的自由性。除了限制应用功能,此类语音助手还和应用开发商存在一定的经济利益冲突。因为语音助手直接连接应用后台,用户流量被截取。

奇点机智针对以上问题推出了一款专为安卓生态打造的应用助理——“小不点”APP,同时小不点APP的语音开放平台面向应用开发者开放。它最大的优势在于不用任何第三方的API即可操作手机应用,进一步降低了应用开发商的开发门槛。

这项技术是基于安卓手机上的“辅助功能”,它可以将屏幕中的信息读出来,本来是为了帮助视障人士使用手机的。“小不点”在最底层也是使用了这个辅助功能,用户在激活“小不点”后,语音助手就可以帮助用户进行点击操作,就像用户进行了点击操作一样。而且“小不点”适用于任何线上应用,且应用无需更改自身的技术框架。

另外“小不点”还具备学习能力,智能助手可以看到用户的操作顺序并记下来。在之后进行相同或者相似的命令就可以直接执行。

现在“小不点”已于今年8月在oppo、vivo、小米、联想和华为应用商店上线。不过C端获客成本较高,因此奇点机智正在联合应用开发商推广产品。应用开发商按照功能调用次数来付费给奇点机智。

但智能语音助手行业也存在一些通性问题。首先是语音识别率、语义理解力不足。在复杂真实场景下,语音助手的识别率和理解力也会进一步下降。这也是为什么众多的语音助手从智能手机转向了智能家居行业,因为家庭场景相对简单,而且命令和需求也相对固定。

二是智能语音助手的应用场景比较匮乏,不能实质解决用户的需求。三是语音识别会通过云端服务器来返回结果,涉及到安全和隐私问题。

奇点机智成立于2015年初,曾获得真格基金100万美元天使轮投资,以及襄禾资本和NEA 500万美元A轮投资。现在正在寻求A+轮投资,主要用于产品开发和市场拓展。

公司现有不到四十人,主要是开发人员。邬霄云,奇点机智创始人兼CEO,纽约州立大学计算机博士,北京市第十二批“海聚工程”创业类特聘专家,拥有1年雅虎实验室、8年谷歌研究院工作经验的资深科学家,拥有深度学习、自然语言处理、互联网大数据、分布式计算的丰富经验,回国前负责美国应用搜索公司 Quixey.com 搜索部门。林德康,奇点机智联合创始人兼CTO,国际计算语言学学会会士(ACL Fellow),加拿大Alberta大学计算机教授,原Google研究院高级管理科学家,Google搜索问答系统创始人,自然语言处理及理解领域共发表90余篇论文,研究总计被引用超15000次,曾任ACL2002程序委员会联合主席、ACL2011大会主席、ACL2007北美分会执行委员。

面向开发者,「奇点机智」推出不用第三方API即可操作手机应用的智能手机助手

发表评论

电子邮件地址不会被公开。 必填项已用*标注