For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
随着科学技术的进步,我们在与人交流的过程中,联系方式也在不断的变化,目前最先进的应该是我们在电视剧上见到过的视频电话了。那么,在当下的社会环境下,限制这些功能的主要有哪些原因呢?下面,我们就一起来简单了解一下,为什么语音通信和视频电话等功能还不能普及。
当然了,如果您对太原达内培训课程感兴趣的话,欢迎与我们的在线咨询老师联系,获取对课程信息的进一步了解。
要想让语音交互流行起来,必须合理解决以下几点客观的限制:
1、语音识别技术还处于起步阶段。
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audrey系统,它是第一个可以识别十个英文数字的语音识别系统。并且一些行业巨头也都是在2010年左右才开始加大对语音技术的投入。各大巨头各自为战,语音识别领域里面还没有形成统一的行业标准和应用生态。
2、使用场景有限。
语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率。有一项这样的测试,有人随机截取了几段网络课程用主流的云端引擎测试识别准确度,基本上准确率在70%左右;然后又截取了一段新闻联播的音频,用同样的云端引擎做测试,准确率达到了95%左右。由这个测试我们可以清楚的看到客观因素对语音识别准确率的影响,要知道在这个行业5%的准确率就是可以引起行业变革的。目前的技术先限制导致语音交互体验的机器感特别强,缺乏人性化的感知,没有人喜欢跟呆板的机器一直做交流的。
3、语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。
人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
4、用户习惯还未完全养成。
没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。
好了,今天就给大家讲这么多吧,喜欢我的内容可以关注或者分享(微信公众平台:tytedu),达内时代科技集团致力于培养面向电信和金融领域Java、C++、C#/.Net、3G/Android、3G/IOS、PHP、嵌入式、软件测试、UID、网络营销、网络工程、会计、UED、web、Unity3D、大数据、童程童美等17大方向中高端软件人才课程与少儿教育课程。选择太原电脑培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!想找工作的求职者可以加QQ:3373924515(太原达内就业服务部)咨询了解。