36氪获悉,定位人工智能交互技术服务商的声智科技(SoundAI),宣布已于2017年9月份完成近亿元人民币A轮融资,本轮融资由百度、蓝港互动、洪泰基金、峰瑞资本联合财务投资,北京银行以投贷联动方式参与。融资将用于AI核心技术研发,持续提升远场语音交互产品的体验,拓展更多语音智能的垂直场景,服务更多品牌和中小企业客户。

声智科技成立于2016年4月,核心团队来自于中国科学院,公司聚焦声学技术、人工智能交互领域,致力于解决当前关键的远场语音交互问题,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案。公司成立之初,曾获得峰瑞资本、润浙资本等1200万元天使轮融资。2016年年底,获得1600万元Pre-A轮融资,由洪泰基金领投,峰瑞资本跟投。

声智科技告诉36氪,目前技术方面,公司的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术在行业具有优势;产品方面,搭载声智核心技术的产品包括360智能摄像机、360儿童故事机和小米AI音箱等已经大规模出货,另有一些合作产品即将问世;合作方面,声智科技在基础层与ARM、NVIDIA、Xilinx、Cypress、Knowles等芯片和器件厂商建立合作,在平台层与百度、阿里、腾讯、思必驰等AI平台企业达成合作。

人工智能时代,智能语音很可能是AI最先落地的突破口,已经成为全球互联网巨头关注的焦点和角逐的战场。从智能语音交互技术起家的公司,不少公司开始转型为AI平台或者全栈公司。声智科技则将自己定位于解决声学、AI智能交互的方案提供商,做好平台和客户之间的桥梁作用。之所以选择这种商业模式,是因为当前企业客户的需求千差万别,大客户更倾向于定制化,而AI产品依赖的算法、数据、软件、硬件和平台还无法解决这类差异化。这将直接导致AI平台很难几何级扩展客户,客户也很难直接快速接入AI平台,这甚至让国外巨头放弃了对生态伙伴的支持,而将重心转移到自行开发AI产品。声智科技解决的核心问题之一就是技术和服务的标准化,一开始就按照规模化和标准化应用架构设计,而且历经了合作厂商的检验,这就对于器件、芯片和平台等合作伙伴的扩展有帮助。

垂直场景拓展是AI落地中尤为重要的环节。创立之初,声智科技的主要场景聚焦在智能音响、家用摄像头、儿童机器人、智能电视和盒子等智能家居场景。这也是2016年、2017年智能语音最热的领域之一,为声智带来了小米、360、联想等客户。与此同时,团队也一直在拓展智能安防、智能汽车、智能金融、智能教育等场景。一般来说,有声音的场景都属于声智科技的业务范畴,声智科技通常与合作伙伴紧密合作,共同开发和服务这些不同行业的客户。目前,已经与行业客户达成一些关键合作,并进行了技术及产品研发,相关产品也会在后续继续推出。

AI场景的拓展,不仅意味着重新定义新的需求,也意味着器件、芯片、数据和算法等技术的不同。以声视频融合的智能安防为例,关键问题就是如何解决恶劣环境下超远场(10米以外)的语音获取和识别以获取高质量的声音信息,核心技术就是超远场拾音、超远场降噪和去混响、超远场语音识别等,但是以往因为这些技术难点未能充分解决,实现效果一直不理想,造成专业安防领域长期没有高质量声音数据的尴尬。再以语音转录为主的智慧法院为例,关键问题就是如何解决在众多会议系统上获取高质量局部场的声音信息,以保证语音识别的准确率,核心技术就是局部场的拾音和语音识别以及技术兼容性问题,这些技术难题都需要一个标准化方案。

企业客户往往除关注技术的实现水平外,也会看重产品是否已经被验证。声智科技认为,因为团队起步较早,已经和一些知名客户合作推出了产品,历经了企业客户和广大用户的苛刻检验和口碑验证,这方面具有一定的优势。而在新的场景中,团队一般首选行业最具代表性的标杆客户,帮其解决行业中最为困难的问题,进而再标准化拓展其他客户。

除了面向企业客户,声智科技也为开发人员设计和供应AI开发板,普及智能语音的应用开发技术。目前已经推出十多款型号的麦克风阵列开发套件,方便各个不同场景的智能语音应用开发,同时与百度合作的DuerOS开发套件也将随后发布。

随着互联网巨头、大量资本入局,智能语音产品也正逐步成熟。在获得近亿元的投资后,声智科技也有自己的规划。技术方面,声智科技计划持续更新和迭代技术,解决更复杂声学场景下的远场语音唤醒和识别、远场声纹识别、声视频融合交互、多人追踪和识别等影响用户体验的关键问题,以及超远场拾音与识别、局部场识别与重放等行业关键技术。产品方面,将与麦克风器件厂商和芯片厂商合作,联手研发下一代人工智能交互的专用器件和芯片。运营方面,基于研发生产、数据处理、应用开发、工业设计和内容服务的大量需求,以及对于声学实验和语音测试的专业需求,声智科技正与地方政府合作,筹建地区性研发和运营中心。

36氪也在获知消息后,采访了声智科技的投资人。峰瑞资本创始合伙人李丰告诉36氪,“峰瑞在 2016 年投资声智科技时,看好陈孝良团队在端上所具备的技术优势。此外,声智的发展恰逢其时。 2017 年上半年,中国市场迎来智能音箱热潮,语音交互技术需求集中涌现。这加速了声智的业务进展,并为他们带来了百度、小米等重要的合作伙伴。未来,峰瑞将持续看好具备语音交互技术优势,以及能够在端上做计算和数据处理、分析的团队及公司。” 

洪泰基金Aplus执行董事赖蕴琦在谈及对声智科技的投资时,也表示,“语音交互是人工智能相关技术的重要应用场景,而语音交互的核心和关键突破点在于远场。而国内真正有实力做好远场技术的团队是非常稀少的。”

36氪首发 | 定位AI交互技术服务商,声智科技完成近亿元A轮融资,将拓展安防、汽车等新场景

发表评论

电子邮件地址不会被公开。 必填项已用*标注