15个语种22项第一,我国多语种语音技术再获突破

来源: 互联网 作者:佚名

摘要: 11月18日,科大讯飞-中科大语音及语言信息处理国家工程实验室联合团队(USTC-NELSLIP)在近日举办的OpenASR国际低资源多语种语音识别挑战赛上,参加了所有15个语种受限赛道和7个语种非受限赛道,全部取得第一。

  11月18日,科大讯飞-中科大语音及语言信息处理国家工程实验室联合团队(USTC-NELSLIP)在近日举办的OpenASR国际低资源多语种语音识别挑战赛上,参加了所有15个语种受限赛道和7个语种非受限赛道,全部取得第一。

  这是继前不久荣获多语言理解评测XTREME冠军之后,科大讯飞在多语种领域再次取得突破,在探索人机交互更自然、人人沟通无障碍的征程中又迈出了坚实的一步,也为中国多语种语音语言技术赶超国际先进水平、助推中国智能制造的全球化奠定了坚实的基础。

  近年来,随着深度学习技术的进步,汉语、英语等大语种语音识别技术日趋成熟,并获得广泛的应用。相比之下,小语种语音识别因其语音数据资源难以获取、难以标注、难以评估、语言专家稀缺等原因,已经成为世界性的研究难题,距离实用门槛仍有较大差距。

  据悉,OpenASR挑战赛更加关注小语种语音技术,探索如何使用少量的数据达到较好的效果,同时考察低资源语音识别基础算法在多个语种上的推广性。自2020年启动以来,吸引了加拿大蒙特利尔信息科技研究中心、新加坡科技研究局、清华大学、腾讯等国内外知名研究机构和企业参与其中。

  本次比赛共包含15个语种,涵盖受限赛道、受限附加赛道和非受限赛道。据介绍,对于低资源语种而言,除了语音数据量较小外,其发音词典大小、语料丰富性、标注准确度都远不及常规水平。本次比赛中各个语种数据主要来自电话信道,口语化特征十分明显,对话风格非常自由,也使得语音识别难上加难。

  多语种语音语言技术是万物互联时代实现人机交互的关键技术,也是实现“一带一路”语言大互通的基础技术。据悉,经过多年的技术积累,除了中英以外,科大讯飞还具备了69种语言的语音识别能力(其中35个语种准确率已超过90%),并已在新加坡、俄罗斯、印度、日本等国家部署了海外站点,为各地开发者提供语音识别、语音合成、机器翻译、图文识别等语音语言服务,所有服务均在科大讯飞开放平台开放。

审核:yj115 编辑:yj115
关键词:

语音技术

免责声明:

1:凡本网注明“来源:***”的作品,均是转载自其他平台,本网赢家财富网 www.yjcf360.com 转载文章为个人学习、研究或者欣赏传播信息之目的,并不意味着赞同其观点或其内容的真实性已得到证实。全部作品仅代表作者本人的观点,不代表本网站赢家财富网的观点、看法及立场,文责作者自负。如因作品内容、版权和其他问题请与本站管理员联系,请在30日内进行,我们收到通知后会在3个工作日内及时进行处理。

2:本网站刊载的各类文章、广告、访问者在本网站发表的观点,以链接形式推荐的其他网站内容,仅为提供更多信息供用户参考使用或为学习交流的方便(本网有权删除)。所提供的数据仅供参考,使用者务请核实,风险自负。

版权属于赢家财富网,转载请注明出处
查看更多