新闻背景
2014年8月20日,科大讯飞智能家庭语音产品发布会圆满落下帷幕,全自然交互平台——讯飞语音云3.0,也在现场揭开它神秘的面纱。
这次发布的讯飞语音云3.0针对方言专门打造了方言识别引擎,具有方言识别功能;在抗噪方面:通过“前端麦克阵列+本地降噪算法+云端降噪模型”的组合,形成了讯飞独特的“净音”方案;支持多语种多音色,同时提供特色音库、个性化音库和音色转换接口,让您随心所选;随叫随到的语音唤醒功能,低功耗、高唤醒率、低误唤醒率以及多唤醒词定制等诸多优势,让唤醒随叫随到。除了基础能力持续升级外,语音云3.0还在人脸识别、手势识别等方面加速布局,构建全自然交互平台,打造语音生态体系。同日,科大讯飞还推出了新版本语音助手灵犀3.0、讯飞智能音箱、面向智能电视的“未来遥控”等系列语音产品。
什么是云语音
云语音,顾名思义,是采用云计算的方式来执行语音操作。在传统通信计算模式下,语音的处理方式多是通过单个通信终端完成,例如我们熟悉的手机等通信终端;在云计算技术背景下,语音的格式转换、辨别等操作完全在“云”端执行。
云语音的优势
云语音的优势很明显。速度快,准确度很高。在服务方式上,现在市面上的云语音产品都能够提供简单易用的api或sdk,使得应用产品能够通过API直接调用公有云服务,计算和存储的压力都放在云端进行。降低了应用产品开发的成本。这样,具体应用开发者就能够更多的专注于业务需求的开发,而不是纠结于语音识别的方法和准确率上。使用语音识别,门槛已经不再高不可攀。科大讯飞、云知声这两家企业,都对开发者免费开放了语音云,通过简单集成语音云控件sdk,就可以使用科大讯飞和云知声的语音云服务。从易用性上来讲,商业公司的积极参与,为语音服务的普及化应用提供了良好的基础。
云语音带来的好处
云语音给用户带来的好处是更方便借助云计算手段,实现快速的语音应用。比如语音短信之类应用。对于连续语音识别,云语音支持大词汇量连续语音在线识别,客户端应用可以通过API直接调用公有云服务。在云计算平台下,科大讯飞、百度、云知声的语音识别中文连续语音识别的准确率能够达90%以上,达到世界领先水平。
智能语音识别的现存问题
1. 对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。
2. 语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的。例如,一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。
3. 语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见。
4. 单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等;
5. 环境噪声和干扰对语音识别有严重影响,致使识别率低。
虽说声控系统的存在着固有问题,但是该技术在智能化行业应用将对行业掀起一阵波澜,但由于以下特点注定其不能应用于各系统的上位控制:操作容易出错、完全性较低、识别率错误率可能性较高(对于需要高精度要求尤其如此)。但是其控制特性,如简便性、易用性、互动性、娱乐性对于智能家居领域的应用却再适合不过了。
云语音在智能家居控制上的优势
首先,作为基于云计算和语音识别技术的智能家居系统将会为现有的智能家居系统提供更多操作控制方式。目前智能家居系统的控制方式有以下三种:面板控制、原装触摸屏、第三方面板控制(iPad、智能手机等)。如采用基于云计算和语音识别技术的智能家居系统不仅是增加一种操作方式,更是智能家居领域的革命。在人机交流界面上,直接以语音进行操作也无需面板的存在,同时采用云计算,本地无需计算能力,因此控制端可以设计成便于随身携带的,如手表、挂耳式耳机等更加方便的控制端形式。
其次,通过语音直接人机语音对话代表了更好的用户的体验度。通过语音直接人机语音对话方式即对人类语音的词汇语法的分解,并将内容转换为计算机可读的输入,例如按键、二进制编码或字符序列。思维是人脑的机能,是对外部现实的反映;语言则是现实思维、巩固和传达思维成果即思想的工具。语言是思维本身的要素,思想的生命表现的要素;语言是思维的工具,是思想的直接现实。语言是人类最方便、也最能理解的命令方式,除非未来传感器可以直接作用于人脑,否则很难出现更方便快捷的方式。
再次,自然语言回答代表未来智能化的产品的终极形式。基于云计算的的自然回答功能结合智能家居系统在功能和应用上更是可以开拓无数,如简单的对其下语音命令,“开灯”、“拉窗帘”等,更可以利用云计算功能对其命令甚至是普通语言进行深度理解。如:问“天太热了。”答:“空调再开下去要低于舒适温度了,你确定真的要调低?”又如,问:“我要辆车,15分钟能过来。智能家居自动拨号,并订车。”
众厂商抢滩国内语音市场
国内智能语音市场虽尚未爆发,但众多厂商已按捺不住提前入局暖场。继腾讯微信推出语音识别开放平台、搜狗语音云平台上线、微软语音助手Cortana发布后,老牌国产厂商科大讯飞联手中国移动于近日推出了语音助手“灵犀”3.0版本,并欲借智能语音切入智慧家庭市场,抢占国内智能语音领域的制高点。
值得一提的是,不同于腾讯、百度等互联网巨头的小试牛刀,科大讯飞则祭出杀招,通过智能语音实现与家庭硬件之间的互动,包括对电视、电灯、咖啡机、空调等家电设备的语音操控,为火热的智能家庭发展提供新思路。科大讯飞灵犀3.0版除了语音助手产品标配的语音拨号、发短信、本地查询等基础功能外,还新增了锁屏状态下语音拨号、哼唱识别搜索音乐、方言外语对话等功能,通过现场对比,辨识度在很大程度上都超越了苹果的Siri语音助手。除此之外,科大讯飞还启动了人工智能计划——讯飞“超脑”,这类似于谷歌大脑、百度大脑等,简单来说,就是致力于让机器像人脑一样做到学习和思考。
智能家居或成未来突破口
目前谷歌、苹果虽然也在向智能语音领域布局,但触角尚未伸及国内,只有微软抢先在国内发布了Cortana中文版。不同于其他领域,就语音识别技术来说,受制于语言的区域差异,本土厂商更具优势。专家认为,目前语音市场的潜力处在一个被低估的尴尬地位,而随着智能家居物联网的不断发展,云语音将成为不可或缺的重要一环。随着众多厂商的发力,国内智能语音市场的用户需求培养也在逐渐形成,而智能家居很可能会成为引爆智能语音的突破口。