语音技术作为智能硬件的重要入口,可让人机的交互内容更丰富,体验更自然简洁。然而目前的语音交互在实际应用中依然不尽如意。
l 交互需要按照双方的发言顺序来缓冲识别;
l 距离、环境噪音等因素严重影响了语音识别的正确率;
l 系统不能完全理解用户的真实本意;
这些问题使得交互的后续执行和结果变得牛头不对马嘴。
在万物互联时代,要真正实现流畅的人机交互,必须具备四大条件,第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,你可以打断它,然后多轮对话,上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。
所以在这个基础上以语音为主结合图像视觉及手写识别,把整个人工智能功能集成在一起,产生了业界首个人工智能的用户交互界面——AIUI。
AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务。通过统一的交互接口,可以让讯飞各种人工智能能力,非常方便的被用户使用。在线离线能力的灵活搭配,并具备很强的服务拓展的功能,使得未来最新的人工智能成果都可以放到AIUI的统一界面下。
AIUI标准-人机智能交互标准
第一是软硬件一体化,智能硬件可以直接采购讯飞的各种类型的麦克风阵列,使它360度使它五到八米之外都可以方便的来操控这个设备,所以首先是软硬件一体化。
其次是云和端一体。有越来越多的家电设备智能家居它不联网,那么能联网我们的能力在后台,如果不能联网或者我们要节约后台运算资源可以直接有端的解决方案。就像我们在输入法中第一次这个提供了业界最好的轻量级的手机的输入法,不需要联网直接说话就可以变成文字。
第三是技术服务一体化。通过这个AIUI的界面我们可以给各个开发伙伴各种应用差异化的定制,可以定制不同声音。那么,当然我们也可以各种语音识别的场景,包括后台的语义定制可以实现技术服务一体化。
AIUI的使用?
AIUI具备非常强的普适性和非常方便的调动性,可以支持穿戴式设备、智能家居、机器人等各种智能硬件设备。其实使用也是非常方便,只需就4个简单步骤:
第一步:登录讯飞开放平台(www.xfyun.cn),一键获取方案
第二步:安装麦克风阵列模块
第三步:集成SDK
第四步:云端服务&差异化定制
作为中国最大的智能语音技术提供商,科大讯飞在智能语音技术领域有着长期的研究积累,核心技术代表了世界最高水平,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果,占有中文语音技术市场70%以上市场份额。科大讯飞整合了各技术领域多年的研究成果,构建了全球首个智能人机交互平台——“讯飞开放平台”:以语音交互为核心的人工智能技术开放给业界开发者。目前AIUI已经在讯飞开放平台开放合作。