技术解读思必驰DUI标注训练一体化平台，语音识别全场景覆盖

时间： 2021-05-20 13:41:04 来源：互联网作者：佚名

扫描到手机

摘要：过往严格意义上的端到端识别技术，如基于LAS的端到端系统，虽然可以较明显地提升通用语音识别的准确率，但受限于计算复杂、自定制语言模型技术不成熟等原因，不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术，在实现通用识别准确率相对提升10%-15% 的同时，也提升了模型计算速度，更可以满足快速有效的语言模型自定制。

　　小驰捕捉到一位思必驰程序员小哥哥

　　今天去看看

　　他日常的那些“封神级”操作！

　　Q：一句话形容你正在做的事情？

　　A：人类之光…在宇宙中心呼唤AI…反正很Cool就对了

　　Q：最近有什么新成果吗？

　　A：你光顾着关注我们发际线，不关注我们的精神成果，扣鸡腿… 最近发布了DUI标注训练一体化平台

　　Q：如果我中英文掺着说，语音识别TA能听懂吗？

　　A：不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率，自然就能准确许多。

　　Q：让场景识别率能持续提升，你们有什么“神技”傍身？

　　A：我们融进了最新的「端到端识别技术」来提升识别准确率，通过大规模预训练模型技术提升语音识别后处理效果。结合「增量学习」、「主动学习」、「联邦学习」和「小样本迁移」等技术手段，提升用户体验。同时开放「端点检测模型自训练」、「标点断句自训练」等功能，让用户自己拥有自主权，来解决实际问题。

　　Q：呃…

　　A：好，说点你能听懂的

　　高能，划重点！

　　第一，关于端到端识别技术。

　　过往严格意义上的端到端识别技术，如基于LAS的端到端系统，虽然可以较明显地提升通用语音识别的准确率，但受限于计算复杂、自定制语言模型技术不成熟等原因，不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术，在实现通用识别准确率相对提升10%-15% 的同时，也提升了模型计算速度，更可以满足快速有效的语言模型自定制。

　　第二，关于大规模预训练模型技术。

　　要知道，语音识别系统中除了核心的语音识别（ASR）模型部分，语音识别的后处理模型也是十分重要的，它直接影响到识别结果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处理技术，能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型，结合多任务学习（Multi-Task Learning）和知识蒸馏（Knowledge Distillation）方法。在降低70%以上模型规模的条件下，提升了模型效果，运算效率大幅提升同时降低了内存开销。

　　例如在智能会议场景中，通常转写结果是篇章段落，且多含有口语化的表达，通过我们的识别后处理功能，可以将会议转写结果整理成格式化，易读易懂的会议记录。

　　第三，增量学习。

　　受限于深度神经网络技术中的灾难性遗忘问题，采用深度学习方法的ASR建模在权衡“既要保障模型原有识别效果，又要提升新的目标场景识别效果”时，通常采用基于新旧数据混合训练的方法。弊端是，该方法增长了模型优化的周期，又会带来数据安全隐患。基于思必驰自研的KDF-IL增量学习方法，在语音识别优化时，可以仅用新增数据进行模型训练，缩短开发周期同时，也有效保障数据安全。

　　第四，小样本学习。

　　自研的小样本迁移学习技术，使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据，即可对标点断句模型进行优化，相对传统模式调优，节省了83%的数据量。例如，在真实的航空质检场景中，通用的标点断句模型面对特殊的专业术语和断句方式，一定会水土不服。得益于小样本迁移学习技术，在使用少量的标注文本情况下，即可实现F值40%左右的绝对值提升，完成体验效果从不可用到可用的转变。

　　最后，咳咳….（这个氛围是不是该升华了）在功能层面，我们深知不同用户的使用场景复杂多样，单靠赋能用户自主训练ASR模型不能满足需求。

　　我们！（升华来了）秉承以解决用户实际问题为核心的产品理念，开放端点检测模型自训练、标点断句自训练等功能，使得用户可以通过我们的产品，完成识别系统中几乎所有模块功能的自训练，最大程度优化用户体验。

　　Q：啊，真不愧是“人类之光”。求问，没经验可以用吗？

　　A：平台建立的出发点就是降低 AI 使用门槛，只要企业有数智化转型的需求，我们就能匹配提供高可用定制的模型。平台的私有化部署能力，也能将自主权交给企业自己，非AI专家都能使用，”零“学习成本。

　　Q：怎么合作呢？

　　A：平台同时满足「模块化输出」+「支持 UI可视化界面 /API输出」这两点，可以根据业务需求灵活配置，选择使用一体化平台的全部功能，或者只使用其中几个模块的功能。

　　Q：可以拓展使用吗？

　　A：当然可以，「全场景覆盖」是平台的一大优点。适用于各类行业场景，如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等，可以快速从当前项目复用到新项目中，形成规模化生产定制，满足多样化的业务需求。

　　Q：怎么联系你们呢？

　　Q：好，不愧是气质不凡的你们！今天收获颇丰！

　　A：总结下，就是我们在一个科技开放和包容的时代，和一群特别Cool的人，做了些特别Cool的产品和事情。如果你想更了解我们，欢迎随时交流。

审核：yj138 编辑:yj138

关键词：

模型,学习

分享到：

免责声明:

1：凡本网注明“来源：***”的作品，均是转载自其他平台，本网赢家财富网 www.yjcf360.com 转载文章为个人学习、研究或者欣赏传播信息之目的，并不意味着赞同其观点或其内容的真实性已得到证实。全部作品仅代表作者本人的观点，不代表本网站赢家财富网的观点、看法及立场，文责作者自负。如因作品内容、版权和其他问题请与本站管理员联系，请在30日内进行，我们收到通知后会在3个工作日内及时进行处理。

2：本网站刊载的各类文章、广告、访问者在本网站发表的观点，以链接形式推荐的其他网站内容，仅为提供更多信息供用户参考使用或为学习交流的方便（本网有权删除）。所提供的数据仅供参考，使用者务请核实，风险自负。

版权属于赢家财富网，转载请注明出处查看更多

本文相关推荐

赢家增值服务

概念推荐

更多>>

创业板重组松绑【聊吧互动】

创业板重组松绑概念1月9日涨幅0.42%，近一个月跌幅2.91%

维业股份 +20.04% 丝路视觉 +20.01%
IT设备【聊吧互动】

今日IT设备行业早盘大幅高开收盘大幅上涨4.34%，2月8日主力资金净流入17.98亿元

N诺瓦 +202.62% 华铭智能 +20.07%
科创板对标【聊吧互动】

目前辉煌科技跌停，所属板块科创板对标今日大跌5.01%

智云股份 +13.91% 岱勒新材 +13.33%
数据要素【聊吧互动】

数据要素概念表现强势大涨8.87%，华宇软件、丝路视觉等多股涨停

华宇软件 +20.04% 丝路视觉 +20.01%
Chiplet【聊吧互动】

Chiplet概念目前微涨0.18%，近一个月跌幅9.28%

富满微 +20.01% 艾森股份 +20.01%

开盘必读

[大盘]9成个股收红辞旧兔 3连阳大涨迎新龙赢家祝您新 2024-02-08
[大盘]指数黄白分时线再度分化大盘延续反弹顺势而为- 2024-02-07
[策略]2024年02月07日赢家早盘解读 2024-02-07
[早盘]早知道:2024年2月8号热点题材 2024-02-08
[早盘]早知道:2024年2月7号热点题材 2024-02-07
[预测]2024年2月8日利好消息汇总 2024-02-08
[预测]2024年2月7日利好消息汇总 2024-02-07
[午评]赛道股活跃指数低开震荡 2022年6月17号A股午盘 2022-06-17
[揭秘]2024年2月7日涨停揭秘——矿物制品、船舶、化纤 2024-02-07
[揭秘]2024年2月6日涨停揭秘——证券板块拉升 2024-02-06

登录

技术解读思必驰DUI标注训练一体化平台，语音识别全场景覆盖

免责声明:

本文相关推荐

赢家增值服务

概念推荐

创业板重组松绑【聊吧互动】

IT设备【聊吧互动】

科创板对标【聊吧互动】

数据要素【聊吧互动】

Chiplet【聊吧互动】

开盘必读

您可能喜欢的概念