AutoR智驾 | 2017-09-08 11:23 作者:吴鹏飞 0

叫板国家队科大?思必驰DUI开放平台为语音交互定制规模化助力

思必驰 DUI开放平台
用思必驰创始人兼CEO高始兴的话来说,这是一个“专注了四年的梦想”。

四年两场发布会,思必驰作为国内人工智能语音识别公司的先驱之一,可以说是非常低调了。


2013年9月7日,思必驰第一次开发布会,发布了对话工场口语交互系统。今天(2017年9月7日),思必驰发布了DUI平台。用思必驰创始人兼CEO高始兴的话来说,这是一个“专注了四年的梦想”。


高始兴应该是智驾君所参加过的发布会中嗓门最大的一位讲演者。


2007年,毕业于剑桥大学商学院的高始兴和校友在英国创立了AISpeech,2008年回国将公司落户在了苏州,这才有了今天的思必驰。


vbox5147_IMG_0341_143547_small.JPG


2012年,思必驰获得了来自联想之星、启迪等投资,公司业务从智能硬件、教育事业继续拓展到移动互联网。2014年这一年,被高始兴称为思必驰二次创业的开始。


这一年,思必驰将教育事业部完全剥离,all in物联网,开始专注智能硬件和移动互联网。被剥离的教育事业部成为了今天的驰声科技,已经被网龙股份收购,目前已成长为国内教育领域最大的语音技术提供商。


vbox5147_IMG_0352_143754_small.JPG


创业十年,高始兴分享了一些关于人工智能、物联网市场的观察和思考。


融合


在物联网各个场景一定是去中心化的,每个场景都有可能有一个,甚至是多个的设备。以前我们在互联网、移动互联网的时候,用户都是去找信息、找服务。


但是,在物联网的时候,用户在一个场景里端的推算能力会越来越强、越来越丰富。围绕着用户场景的端、场景的服务、场景的数据、场景的闭环,一定会产生众多的创新和商业模式,以及商业机会。围绕着用户的端、场景、行业的融合或者是服务的融合,这个速度一定会加快。


我们在开车,我们在家里,我可以通过我的车载设备,或者是通过音箱,或者是通过我的电视,我就可以学习英语。我通过我的穿戴设备,我在家里通过机器人可以做医疗诊断。这些都是“融合”的趋势,是端+场景+行业融合的趋势。


创新在加快、越来越多


人工智能技术赋能工具会引导创新,比如现在的智能音箱,成为了用户的助手。比如苹果以 AI 赋能耳机,现在卖的很火。我相信会有越来越多的,甚至是现在猜不出来、看不到的创新的端。


再一个是新用户,二次元成长一代是人工智能的核心受众,会逐渐成为习惯或者喜欢自然语言交互成长的一代,这一定会产生新的商业机会。


另外,是新模式。现在我们可以看到网络直播,在未来,一定会出现越来越多的机器人主播,现在是人与人社交,在未来是人与机器社交。


人工智能赋能会让数据的维度更加多元化,颗粒度更加细化,用户的画像更加准确。在传统的互联网时代,我们可以去做用户画像。但是,人工智能会让用户的画像在物联网时代更准确,包括落地各个场景的维度会更多,人工智能会激活传统数据。


着眼2013年到2017年这四年时间,思必驰走了四步。


发布对话工场这一国内首个口语交互系统、孵化软硬一体的车萝卜、提出AIOS端到端的对话定制解决方案、再到今天的国内首个全链路对话定制平台DUI。


作为AIOS的迭代产品,DUI平台使GUI(图形交互)和VUI(语音交互)结合,包括了四大系统:天机系统、玲珑系统、青囊系统和紫微系统,为用户提供一站式对话定制开发。


微信图片_20170907222620.jpg


天机:DUI的洞察力系统。通过大数据系统可以实现对用户画像,以及智能推荐的需求。DUI可以分析用户每个请求的日志,同时对他的结果进行实时的反馈;


青囊:DUI服务力和研发支撑的系统。可以帮助发现问题、反馈问题以及迭代这样的闭环链条缩短,达到快速响应、全程跟踪、专业服务和深度定制功能。形成从发现问题的分析,到迭代、上线、整个研发迭代的闭环,就有可能把整个规模化复制、规模化定制的基础打下;


玲珑:思必驰赋于DUI跨硬件平台的终端落地方案的能力。无论终端产品是手机上的APP、电视、还是在音箱,铃珑系统可以非常方便的把DUI进行一个跨平台的转接;


紫微:接口资源的平台,对话定制经常需要和外部资源进行对接,一系列的信息构成了语音交互入口之后各种各样的需求。让开发者非常方便的找到自己所需要的资源接口,就是紫微的使命。


所谓的“全链路定制”体现在:具有唤醒词个性化定制,而且支持唤醒词修改实时生效功能;语言模型与语义理解也可以按技能进行独立定制;对话方面也可以支持多种形式甚至跨技能的多轮对话,并支持上下文指代消解;通过上传录音,其还可以在极短时间内生成自己的合成声;同时,系统还提供常用的第三方 API 接口,并支持接入自己开发的 API 和编写 Web Function。


在过去的几年里,思必驰的智能语音技术已经在智能车载、智能家居、机器人领域开花结果。在智能车载方面,思必驰的解决方案已应用于Vision远界、D910你好问问、奇点汽车、车萝卜HUD、P3000智能后视镜、70迈智能后视镜、乐视超级自行车等多款产品上,覆盖智能后视镜、智能车机、便携式导航仪、HUD智能音箱等品类。思必驰在车载后装市场占有率第一,占有率高达60%。十年的发展历程里,思必驰收获了无数个合作伙伴。


微信图片_20170907230550.jpg


尽管如此,思必驰副总裁、DUI负责人赵恒艺依然觉得,打造一款好的AI产品还是很难,当前行业面对的主要矛盾在于技术提供商的定制效率无法迅

速满足B端用户定制和产品迭代的需求,定制规模化很重要。


所以DUI全链路定制平台应运而生,思必驰希望为开发者打造一个开放生态圈,这一点和“国家队”科大讯飞的讯飞开放平台的思路不谋而合。包括百度无人驾驶的阿波罗计划,最近“开放”两个字在人工智能界很热。


除技术之外,数据是最大的驱动力,也是人工智能企业乐于“放开胸怀”打造开放生态圈共同发展的最根本原因。


思必驰联合创始人、首席科学家俞凯博士认为,只提供封闭解决方案全包全揽想要一家独大的企业势必会进化缓慢,只有开放生态圈、互相给养的企业才能共同茁壮成长。赵恒艺也说:“开放是推动进步的基础,社会化大分工是行业成熟的标志。”


vbox4151_AX5A3273_162528_small.JPG


DUI平台已经和声智科技、海知智能等公司合作,未来还会有越来越多的开发者和企业加入进来。思必驰也利用自己的基金孵化、赋能投资了七家企业,包括车萝卜、慧声、爱医声等公司。


俞凯在演讲中还表示,技术正面临变革,深度学习应用进入深水区,思必驰是做对话智能,而不仅仅是语音识别,对于语音产品,单点级的技术已经不管用,系统级的技术才管用。对话不等于语音,它包括语音、图像、声音等,是多模态的完整统,DUI的平台不单单是识别能力,还是自适应能力,并经过过去很多年的长期积累才到行业应用,经过自适应学习还将继续生长。


微信图片_20170907223752.png


今天,DUI平台已经在思必驰官网正式上线并开放注册,开发者仅需要七分钟即可完成个性化语音技能定制,以往打造一款优秀定制化产品需要耗费大量的人力精力,DUI平台的发布有望对整个行业产生作用。


智驾注:本文转载来源为AutoR智驾,由AutoR智驾转载。
收藏 3 分享:
相关文章
关于智驾 关于投稿 商务合作