科大讯飞副总裁谈AI未来:更有情感、更小数据源、更环保

    来源: 时代财经 作者:卢洁萍

    摘要: 减少对数据的依赖、让数据驱动更有效、提升智能交互系统拟人度成目前人工智能技术的创新方向之一。“新的人工智能浪潮主要得益于深度学习算法的驱动,需要庞大数据做支撑。

      减少对数据的依赖、让数据驱动更有效、提升智能交互系统拟人度成目前人工智能技术的创新方向之一。

      “新的人工智能浪潮主要得益于深度学习算法的驱动,需要庞大数据做支撑。但在过去一年里,我看到了技术创新的新趋势,比如如何用更少的数据去实现更好的效果,减少对数据的依赖。”3月26日,科大讯飞(002230)副总裁、智慧金融事业部总经理解飞在“影响力 中国”时代峰会2021上如此表示。

    科大讯飞

      解飞介绍,2015年科大讯飞在做个性化语音定制时,需要录下20-30小时语音,再后期处理近一个月,才能形成个性化音库,“但目前科大讯飞最新的产品,只要5分钟,就能训练出一个用户的发音系统”。

      除了减少对数据的依赖,人工智能技术的创新方向还包括如何让数据驱动更有效、建立动态自学习模型、跨语言迁移学习、提升智能交互系统的拟人度等。

      “我们内部讨论认为,人工智能已经进入系统性创新时代。它的三大核心要素在于单点核心技术的鸿沟跨越、创新链条上关键技术的深度融合以及对重大系统性命题的洞察解析能力。”

      峰会现场,解飞就各地区金融AI创新特点及近两年变化,科大讯飞与科技金融公司、互联网巨头之间的关系,未来的赛道重点和技术突破方向等问题接受了时代财经的专访。

      谈大湾区金融AI创新:更加市场导向,关注场景价值

      时代财经:粤港澳大湾区在金融领域的AI创新与长三角等其他地区相比有什么特点?国内外又有什么区别?

      解飞:海外的金融体系发展得相对较早,他们对于IT的应用,还是基于以前的超级计算机模式,国内现在新的系统都在往分布式存储云的架构方向发展。

      大湾区特别关注场景价值,更加市场导向。我们能明显感觉到粤港澳大湾区的金融企业,包括银行、保险、证券、基金是以业务上的强需求在拉动技术的发展,对应用任何技术的第一考量因素都是能否体现在业务价值上。相对而言,北方区域的机构会先考虑风险,绝对安全了,再考虑业务收益。

      而以上海为代表的华东地区,整个金融科技的应用更偏向于系统规划。华东地区对场景也很关注,但是更多是在一个大的体系下做规划,考虑这个系统如何在这个体系下进行发展。这三个特点都是相对而言。

      时代财经:从2019年到现在,AI语音技术在金融领域的创新上,科大讯飞经历了什么样的变化?

      解飞:第一个明显变化是,技术应用正从单点场景向全面应用扩展。金融行业对技术有很强的风险厌恶性,所以会先通过单点应用进行试水,再批量地进行使用,现在正是一个由点及面的过程;

      第二,从业者对于技术应用、场景的理解比以前要深刻。以前一般是两种状态:一种人认为AI技术一下子能解决所有问题,另一种人认为是骗子,是概念性的、无法使用的技术。现在大家不会再“打标签”,问你“可以”还是“不可以”,而是说,在我的场景下能够解决多少问题,我要怎么用,最好的切入路径和方式是什么样子的。

      第三是随着大家对技术、业务和产品理解越来越深入,业务模式也发生了变化。比如广发银行的信用卡中心在年前刚刚成立了数据标注运营工作组,就是在用业务去匹配技术的发展。

      在技术趋势方面也有两点变化。第一是平台从“烟囱式”的建设变成了平台式的服务,使接口能够在各个流程和场景下达到统一的应用标准,这也是接下来从业者在产品方案和技术研发上需要率先考虑的。

      第二是对机器的认知要求变得更高。2019年之前,智能感知已经非常成熟了,包括语音识别都是超过90%的识别率,但在真正场景下,除了听懂了、看懂了,还需要把决策流程添加进来,这才是最终的诉求,这需要在认知层面上有很大的突破。

      时代财经:关于添加“系统决策流程”有什么具体的例子吗?

      解飞:比如某银行跟客户签贷款合同,会经过AI系统进行一次OCR(光学字符识别),这一步只是感知,但当这些合同录到系统后,还需要帮助银行判断哪些条款是不对的、这个法人和其他法人的合同有没有关联或冲突等。这些以往都是靠人来做,现在通过机器就能替代人60%左右的工作。

      相比感知技术,认知技术这两年在成熟场景下,提升非常巨大。之前客服中心只有20%左右的工作是智能化的,现在有70%左右。另外,银行中的风控、审批等,都是认知决策的过程。

      谈竞争:AI公司和科技金融公司“我中有你”

      时代财经:平安银行这样的科技金融公司也有数字化风控和数字化客服等业务,他们和科大讯飞这样的AI公司有什么区别?

      解飞:在2015年之前,平安银行的95511智能客服系统都是科大讯飞承建的,从2018年开始自研系统平台后才逐渐地切换到自研平台。但直到现在,平安人寿新契约回访服务的机器人质检系统仍然在使用科大讯飞的服务。

      我认为,银行科技公司和做AI算法的公司,在产业链上是区隔大于竞争的――70%是区隔,30%是竞争。区隔指的是科技公司更多会往通用算法方向发展,银行科技公司则对场景和业务的理解更加深刻。未来算法和引擎服务AI公司会做得更多,引擎服务之上的应用系统、业务系统则是银行科技公司做得更多。

      但平安银行的科技实力更强,所以它会往下延展一些。有的银行科技实力更弱,我们除提供中台到底层算法的方案外,也会往上延展,去做端到端业务系统的方案,这是一个我中有你的过程。

      时代财经:谷歌、阿里等国内外互联网公司也都在关注AI语音技术,科大讯飞和他们之间的技术壁垒是什么?

      解飞:相较于BAT,我们对中文数据的积累、用户习惯的了解,以及对方言口音的支持,远超任何一个国际巨头和国内互联网公司。

      2010年10月份,科大讯飞全球第一个发布了人工智能服务平台,到现在每天服务量超过50亿次,覆盖的国内方言口音和海内外的语种都是最大的。比我们小一点的服务平台,数据量可能只是我们的1/10,而小的创业公司根本收集不到类似的数据。数据驱动让我们有非常强的壁垒,也让后来者很难追赶。

      第二个是我们多年来在语音识别技术上积累的微创新。解决特定场景、实际工程的问题上,我们走得更靠前一些。比如在会议室场景,大家识别率都还挺高的,但如果要将我们两个人说的话进行分离,这就不是通用的语音识别了。

      第三,我们也比较强调定制和服务支撑能力。虽然苹果服务的用户比科大讯飞多,但如果细化到语音服务这个领域,我们更有团队优势。科大讯飞支撑的各个行业的应用和专职的团队人数,比Google、阿里、百度都要多,这也代表着我们更高的服务效能和更大的支持力度。

      谈定制:关键领域全覆盖,重点赛道做平台

      时代财经:B端业务有大量定制化和差异化需求,交付周期长、成本高。科大讯飞如何有效降低B端行业业务的成本,实现经营效益的提升?

      解飞:我们是通过组织架构来解决这个问题的。科大讯飞把产品进行分级管理,分别是V、R、M三个级别。

      V版本是平台级产品,这部分主要解决公用能力,比如说做一个语音识别的平台,这个平台可以面向采访场景、电话场景、会议场景。R版本就是行业版本产品,比如说我们要在医院里面使用,这个版本会把医疗的名词、医生的常用说法、药名收到这个版本里来。M版本就是定制化的版本,给每个客户都不一样。比如我们把医院的系统放到广州中医院来用,我们就把广州中医院的地理位置、门诊科室、专家姓名等放到这个版本里。

      通过三个大的层级进行产品管理,就能够有效地进行资源复用,让定制的部分做到最少,以提升整体的运转效果和效率。

      时代财经:公用的、产业的、定制化的比例分别有多少?

      解飞:具体要看行业。这跟我们的生态战略有关,科大讯飞主要的业务板块是医疗、教育、智慧城市,三个行业端到端应用全部可以由科大讯飞交付。大概判断,60%是标准的V版本,20%是R版本,还有20%-30%给客户做定制,这是理想的状态。

      在重点的行业生态之外,我们会主要构建V版本。我们把它封装成标准的接口,给到我们的合作伙伴,再由我们的合作伙伴去封装R版本或者是M版本的产品。

      举例来讲,在家电行业我们跟海尔这些公司合作,我们就支持一些生态公司,它们可以拿着科大讯飞的V产品,在海尔这边进行定制,相当于40%-50%定制工作给合作伙伴来做,因为它们长期深耕这个行业,本身也有其他相关项目。

      谈未来:更有情感的声音、更小的数据源、更少的电力

      时代财经:除政法、教育外,智能语音技术更有潜力的应用场景是什么?

      解飞:从集团来看,我们把医疗视为最重要的行业之一,因为它关系到社会民生、中国医疗资源不均衡发展、老百姓的健康生活及安心养老等社会刚需问题的解决,对我们来讲会有更强烈的使命感。

      现在比较清晰的战略是在教育和医疗两个领域,希望能够真正地做到改善资源不平衡发展的状况。过去两年,我们在安徽已经很好地展现了“智医助理”这样的医疗应用的价值。很快地,我们就能帮助基层医院提升他们的问诊水平。另外,在整体医疗大数据应用上面,也能够通过AI手段,对传染性疾病的地区聚集问题进行提前警示、防护和治理。

      时代财经:未来几年AI语音技术研究的方向和重点是什么?

      解飞:在语音合成上,还是想使它在特定场景中更加有感情。现在标准的语音播报,机器已经可以惟妙惟肖,甚至可以以假乱真了。但是在人的情感表达上,语音合成做得还不够。

      语音识别上,我们现在做的主要是混语和复杂场景下的识别。比如两个人面对面聊天,机器对不同发言人的识别可以达到95%以上的正确率,但如果场景更复杂一些,比如在餐厅里吃饭,有10来个人在一起讲话,它对角色分离的识别率就会下降到57%,属于不可用的状态。

      第三是我们会持续通过小的数据源,在新的语言识别能力构建上做研究。也就是使用更小的数据,能够更快地驱动一个新的语种识别,以及使用更少的数据优化一个语言的识别效果。

      最后一个是对算力的节约方案。AI技术不光要效果好,还得占用更少的服务器资源数量,更加的环保。我们每天50亿的交互规模,需要后台十几万颗CPU、几万颗GPU做支撑,很耗电,也很耗成本。

    关键词:

    科大讯飞,AI

    审核:yj127 编辑:yj127

    免责声明:

    1:凡本网注明“来源:***”的作品,均是转载自其他平台,本网赢家财富网 www.yjcf360.com 转载文章为个人学习、研究或者欣赏传播信息之目的,并不意味着赞同其观点或其内容的真实性已得到证实。全部作品仅代表作者本人的观点,不代表本网站赢家财富网的观点、看法及立场,文责作者自负。如因作品内容、版权和其他问题请与本站管理员联系,请在30日内进行,我们收到通知后会在3个工作日内及时进行处理。

    2:本网站刊载的各类文章、广告、访问者在本网站发表的观点,以链接形式推荐的其他网站内容,仅为提供更多信息供用户参考使用或为学习交流的方便(本网有权删除)。所提供的数据仅供参考,使用者务请核实,风险自负。

    版权属于赢家财富网,转载请注明出处
    查看更多
    • 内参
    • 股票
    • 赢家观点
    • 娱乐
    • 原创

    甘肃能化低开收上影十字星,近19日下跌5.57%

    甘肃能化目前低开,相比昨日微跌0.33%,目前自前期高点3.22,到现在3.05,已经下跌0.17元,下跌幅度5.57%,经历了19日。具体走势需要结合大盘、所属概念、个股消息,及赢...

    12月29日磷酸产业链情报

    1.12月29日磷酸产业链指数为124.3812月29日磷酸产业链指数为124.38,较昨日上升了0.08点,较周期内最高点249.96点(2021-10-07)下降了50.24%,

    元旦假期,旅游市场爆了!

    (原标题:元旦假期,旅游市场爆了!)2024年元旦假期,旅游市场迎来开门红,多家OTA平台订单迎来大幅增长,部分业务创出历史新高,这也折射旅游消费市场的蓬勃活力。

    徐翔妻子应莹:市场将在上证指数2882点底部确立下继续展开中级反弹行情

    徐翔妻子应莹发文称,11月全国规模以上工业企业利润连续4个月正增长,利润率好转,叠加产品去库存,提振市场对末来经济的信心。本周证监会表示将对违反限售股不得融劵等...

    早知道:2023年12月29号热点概念与题材前瞻

      上证指数目前处于短线反弹趋势中,依据赢家江恩价格工具得出:当前支撑位:2882.02点、2885.09点,当前阻力位:2986.18点、3018.56点,由赢家江恩时间周期工具展示得...

    早知道:2023年12月28号热点概念与题材前瞻荣耀新机型搭载卫星通信技术

      上证指数目前处于短线反弹趋势中,依据赢家江恩价格工具得出:当前支撑位:2882.02点、2885.09点,当前阻力位:2934.1点、3018.56点,由赢家江恩时间周期工具展示得...

    黄金投资开户要怎么做?具体开户流程是怎么样的?

    无论是炒股、炒债券、炒基金还是炒外汇,目前任何线上金融投资产品都需要通过投资账户在市场上进行交易,黄金自然也不例外。投资者接触黄金投资市场的关键一步是开户,涉...

    犀牛吃什么食物为主,犀牛有几只犄角,犀牛有天敌吗

    犀牛是地球上大型动物之一,犀牛是什么食物,主要吃什么食物?大物种的犀牛是否有天敌,当前,犀牛的处境(数量)怎么样?