智能音箱如何识别方言?_快速王者荣耀盘点最新消息 “资料是混乱的

来源:想望风采网 | 栏目:探索 | 2026-06-15 08:30:04
  导读:尽管机器进修使语音确认技术的进展突飞猛进,如今这些语音确认操控系统还是不够完美,最严重的难题就是有地域歧视性。

  自从IBM的Shoebox和Worlds of Wonder的玩具娃娃Julie doll亮相以来,语音确认技术一直在不断地进展。到2018年底,快速王者荣耀盘点Google Assistant扶持超过30种各异的语言。

  高通也开发了一款可以确认单词和短语的语音确认操控系统,其精确率高达95%。另外,微软的智能语音客服比人工呼叫办事更为精确高效。

  但是,尽管机器进修使语音确认技术的深度OPPO Find榜单进展突飞猛进,如今这些语音确认操控系统还是不够完美,最严重的难题就是有地域歧视性。

  华盛顿邮报最近开展的一项探究结局显示,谷歌和亚马逊开发的流行智能语音助手确认非美国本地口音的精确率要比美国本地口音低30%。

  像IBM和微软这样的企业都会经由Switchboard语料库来下降语音助手的出错率。但是事实证明,语料库也无法彻底解决语音助手的口音确认难题。

  “资料是混乱的,由于资料反映了人性,”埃森哲的全球责任AI监理Rumman Chowdhury说,“这就是算力最擅长之处:寻求人类行为模式。”

  算力偏差强调机器进修模型对资料或者设计形成偏见的精选影视花絮程度。很多资讯报导都对面部确认操控系统(尤其是亚马逊联网办事的图像确认Rekognition)形成了不小的偏见。



  并且,算力偏差还会出如今其他方面,比如预测被告是否会在前方犯罪的自动化操控系统以及谷歌资讯等app背后的信息推荐算力。

  微软以及含有IBM、高通和Facebook在内的AI行业领导者已然开发出自动化工具,用于测试并缩减AI算力中形成的偏差,但很少有人能够提出口音确认难题的具体解决计划。

  真正提出解决计划的只有两家企业。一个是Speechmatics,另一个便是Nuance。

  解决口音差距难题

  Speechmetrics是精选解读一家专门探究企业语音确认使用的剑桥技术企业,它于12年前就着手实施了一项雄心勃勃的打算,旨在开发比行业上任何商品更精确完整的语言确认操控系统。

  该企业最初是探究统计语言建模和循环神经联网。它开发了一种可以处理存储输出序列的机器进修模型。2014年,它运用一个十亿字节的语料库加速其统计语言建模的进展,从此迈出了第一步。

  到了2017年,它又迈向了另一个里程碑:与卡塔尔计算探究所(QCRI)兴办开发了阿拉伯语言文字转换办事。

  “我们已然察觉我们需要开发一款语音确认操控系统,只需一种模式便能适用于所有语言,不再有口音难题,并且它确认澳大利亚口音的精确度和转录苏格兰口音一样高。”Speechmatics首席执行官Benedikt vonThüngen说。

  他们在本年七月顺利开发了一款这样的语音确认操控系统Global English。它拥有40多个全国的数千小时的语音资料和数百亿单词,扶持所有英语口音的语音文本转换特性。

  另外,Global English的兴办还离不开Speechmatic的Automatic Linguist,这是一种AI框架,经由运用已知语言中确认的模式来进修新语言的语言基础。

  “假设你一边要和美国人交谈,另一边还要和澳大利亚人交流,并且这个美国人曾经住在加拿大,所以有加拿大口音,这时大多数的语音确认操控系统都会很难确认这种带有各异口音的语言,但是我们的语音确认操控系统就完全不用忧虑这个难题。”Speechmatics企业商品副总裁Ian Firth在一次访谈中说。

  在评测中,Global English在确认特定的口音方面表现的比谷歌的Cloud Speech API和IBM的Cloud还要出色。Thüngen强调,在高端领域中,它的精确率比其他商品还要高23%到55%。

  Speechmatics并不是唯一一家想要解决口音确认难题的企业。

  总部位于马萨诸塞州柏林顿的Nuance强调,它将使用各式方法,确保其语音确认操控系统能够确认将近80种语言,并且精确率都一样高。

  在其英国语言模型中,它收集了20个特定方言区域的语音和文本资料,含有每种方言独有的单词(比如使用单词“cob”特指面包卷)及其发音。所以,这款Nuance的语音确认操控系统便能确认出“Heathrow”的52种各异表达方式。

  如今,Nuance语音确认操控系统又有了新的进展。升级版次的Dragon是Nuance开发的定制语音文本转换使用组合,其机器进修模型可依据使用者的口音在几种各异的方言中自动切换。

  与没有方言自动切换特性的旧版次相比,新版次的语音确认操控系统确认带有西班牙口音的英语的精确率要高22.5%,确认美国南部方言的精确率要高16.5%,确认东南亚英语的精确率要高17.4%。

  资料越多越好

  归根结底,语音确认的口音难题是由于资料不足形成的。语料库的品质越高,语言模型越各式多样,那么至少从理论上来说语音确认操控系统的精确率越高。

  在华盛顿邮报的探究中,Google Home智能语音助手确认美国南部语言的精确率要比确认美国西部语言的精确率低3%。而亚马逊的Echo确认美国中西部语言的精确率要低2%.

  亚马逊的一位发言人告诉华盛顿邮报,随着更多的使用者用各异的口音说话,Alexa的语音确认能力会不断提升。并且,谷歌在一份告示中强调,他们将经由拓展自己的资料库,不断改进Google Assistant的语音确认技术。

  随着使用语音确认操控系统的使用者越来越多,它们的特性会进一步提升。依据行业探究企业Canalys资料显示,到2019年之前,将近1亿智能语音操控系统在全球售卖。并且,在2022年之前,大约55%的美全国人都会拥有一个智能语音操控系统。

  不要指望有彻底解决口音难题的计划。“按如今的技术进展,你不或许开发出精确率最高并且适用于全全球使用者的语音确认操控系统,”Faith说。“你能做的最好的事情便是保证这些语音确认操控系统能够精确确认那些正使用它们的使用者的口音。”

上一篇:《圣歌》游戏地图曝光 死亡机制跟吃鸡游戏类似

下一篇:沙盒探险游戏《地心护核者》将于8月27日加入XGP

相关文章