云知声对比科大讯飞人工智能语音技术,云知声

描述

 云知声对比科大讯飞人工智能语音技术

 随着科技的进步,人工智能在今天,早已不是一个现实中难以触及的概念,伴随智能家居、车联网、甚至是VR产品的涌现,人工智能的未来也有了更多可探索的方向。

 从人机交互形式出发,语音识别无疑是人工智能产品与用户之间,最便捷有效的交流形式。

 12月16日,年关将至,专注人工智能领域,拥有全球顶尖语音识别技术的业界新锐云知声,在京举办了年度品牌发布会,以“看见声音的价值”为主题解释了语音技术对人工智能非凡的含义,而声音价值的背后,毫无疑问,是不断升级的技术。

 当今的移动互联网领域,语音服务已经变得越来越重要,在移动端,语音输入由于具有相对于敲字键入的便捷与高效性,无疑已经成为趋势。而在不少创业者和投资人眼中,传统的搜索已成为过去时,基于语音、语义的搜索和应用服务才是未来。

 近日国内知名企业搜狗,对于语音服务技术支持的选择也成为业内的焦点话题,其推出的“搜狗语音助手”首先选择了一家新兴企业——“云知声”,随后又植入第二家公司——“科大讯飞”作为支持,笔者将会在下文中对二者的表现做一些简单的对比测试,让大家能够深入了解其性能。

 近日笔者在业内发现杀出一匹黑马,一家开放共赢的新兴企业,有一个诗情画意的名字——云知声。这家在2012年6月成立的公司,并没有“国企范儿”,而是秉承开放的心态,作为技术服务提供商,提供根植于移动互联网的专业语音识别服务。

 主流语音识别对比小测试

 日前,国内知名企业搜狗与科大讯飞、云知声合作,推出“搜狗语音助手”插件。据有关人士透露,搜狗也曾在两家公司之间难于选择,毕竟云知声作为一家成立只有半年多的创业公司,在业内还未得到足够的重视,相较于发展10余年的科大讯飞,云知声的成绩还是鲜为人知。但两家公司在技术实力方面旗鼓相当,在同款“搜狗语音助手”上的表现也不相上下。最终的结果是,搜狗在2012年11月首发时是选择了云知声,数月后才又加上了科大讯飞。

 接下来,笔者将两家公司对于同款产品“搜狗语音助手”的技术服务支持做一个对比小测试,看一家从2009年开始从事语音识别技术的老牌企业——科大讯飞,与一家容纳国内10年实验室技术团队的新锐企业——云知声,在反应速度、识别能力和译字准确率方面的表现如何。

 在本次的测试中,笔者的全部语音是使用相同循环录音进行输入,以保证对比的公平性和准确性。

 【测试1】首先我们来看看在“搜狗语音助手”中,二者的集成方式有何区别。具体显示结果:


 图1、云知声语音输入界面 图2、科大讯飞语音输入界面 

 测试1结果:从上图中我们可以清晰地看到,科大讯飞采用了传统语音输入的模式,弹出独立对话框进行语音输入。而云知声则是可定制的界面,在搜狗语音助手中是完全嵌入式语音输入,在同一界面中即可完成输入。当然,这样集成方式上的区别,就见仁见智了,笔者还是更倾向于嵌入式的音频显示,看起来更加清晰明了,不会覆盖前面的对话内容。

 【测试2】专业词汇。词汇类别:软件开发。测试语句为:“软件设计包括设计软件的功能和实现的算法和方法、软件的总体结构设计和模块设计(普通话)”,得到以下测试结果,

 测试2结果:通过专业词汇测试看出,二者对于中文普通话的识别率比较高,只要发音够标准,云知声的语音识别准确率几乎可达100%,另外对于整句话的逻辑性和条理性也非常清晰,专业词句也能够准确识别,并没有出现任何错别字。但科大讯飞在这轮的比拼中却略显劣势,逻辑性欠佳,并有错别字出现。

 另外在测试中,笔者可以感受到云知声的反应速度是很快的,而科大讯飞可能要稍逊一筹。

 【测试3】循环演说。测试内容为:“在微博网友中流传着一种‘黄金鸡蛋‘做法,让不少人跃跃欲试。疯狂地晃动你手中的生鸡蛋,将蛋黄和蛋清混合,带壳煮熟后,你就得到了一个’黄金鸡蛋‘!这种蛋儿童更易使用,不会把蛋黄末弄得到处都是。但是经过不少网友实践,似乎很难将蛋黄蛋清摇匀!求专家解答!你试过吗?(普通话连续说两遍)”,这样大段的内容陈述,看看结果如何

 测试3结果:从测试结果上来看,科大讯飞的输入时间是有一些限制的,对于大段文字的输入,讯飞可能还要扩充一下输入时间的限制范围。另外,在识别准确度上,云知声变现的更为突出,几乎没有错别字的出现。细心的朋友可能还会发现,用云知声输入的内容,有很好的“断句”,不会有冗长的句式出现。

 【测试4】方言测试。方言语种为武汉话,测试语句为“搜狗语音输入插件”。测试结果

 测试4结果:通过方言测试看出,两款插件对方言的识别情况欠佳,识别出来的语句基本没有任何调理和逻辑性。这也不奇怪,就算在现实沟通中,一个北方人到南方,也会经常有一些听不懂南方地区方言的情况出现。

 【测试5】中英文混淆测试。测试内容为:“ipad mini真好看,I want to buy it”,这样大段的内容陈述,看看结果如何,如图11、图12:

 测试5结果: 从中英文混淆输入的测试结果中我们可以看到,科大讯飞能够准确辨别中英文,做出正确的判断及输出。而新生的云知声在对于中英文混合的识别准确率还有待提升。相比之下,科大讯飞不愧是有着数年的积累,云知声还应该继续努力,积累完善自己的技术。

相关推荐

相关文章