发展趋势

    1、下游人工智能行业整体发展情况及未来发展趋势(1)训练数据是当前 AI 算法发展和演进的“燃料”在 AI 产业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据已成为算法模型发展和演进的“燃料”。算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据,2012-2016 年期间,人工智能行业不断优化算法增加深度神经网络层级,利用大量的数据集训练提高算法精准性,ImageNet 数据集的超过 1,400 万张训练图片和 1,000 余种分类便在其中起到重要作用。然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、加工,形成相应的工程化训练数据集后才能供深度学习算法等训练使用。目前,应用有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支撑价值。(2)AI 产业对训练数据服务的需求持续产生AI 产业对训练数据的需求主要来源于成熟算法模型的拓展性需求和新生算法模型的前瞻性需求。在成熟的拓展性需求方面,Mckinsey Global Institute 的研究报告表明:深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求。为充分发挥技术潜能,深度学习模型需要海量且涵盖图像、视频及语音在内等多种类型的训练数据进行模型训练。此外,人工智能技术要求算法模型根据潜在的应用场景变化而持续更新,因此,算法模型所使用的训练数据亦需要定期更新。具体而言,约 1/3 的算法模型每月至少更新一次,约 1/4 的算法模型每日至少更新一次,算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。而在新生的前瞻性需求方面,随着人工智能商业化进程的演进,新兴应用场景如智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。(3)全球和中国的 AI 产业市场规模①全球 AI 产业市场规模经过多年的发展,人工智能技术已在金融、医疗、安防等多个领域实现技术落地,且应用场景愈来愈丰富,AI 产业已进入全方位商业化的发展阶段。截至 2019 年年末,全球共有 5,386 家活跃 AI 企业,27,400 名高级研究人员,20 座重点发展城市。2019 年,全球人工智能行业共产生约 374 亿美元融资,其中,自动驾驶、药物医疗、人脸识别、视频内容和金融反欺诈是获得融资最多的领域。根据国际数据公司(IDC)的数据,2020 年,全球人工智能产业规模达到501 亿美元,预计 2024 年将达到 1,100 亿美元,年复合增长率为 21.73%。景如智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。(3)全球和中国的 AI 产业市场规模①全球 AI 产业市场规模经过多年的发展,人工智能技术已在金融、医疗、安防等多个领域实现技术落地,且应用场景愈来愈丰富,AI 产业已进入全方位商业化的发展阶段。截至 2019 年年末,全球共有 5,386 家活跃 AI 企业,27,400 名高级研究人员,20 座重点发展城市。2019 年,全球人工智能行业共产生约 374 亿美元融资,其中,自动驾驶、药物医疗、人脸识别、视频内容和金融反欺诈是获得融资最多的领域。根据国际数据公司(IDC)的数据,2020 年,全球人工智能产业规模达到501 亿美元,预计 2024 年将达到 1,100 亿美元,年复合增长率为 21.73%。景如智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。(3)全球和中国的 AI 产业市场规模①全球 AI 产业市场规模经过多年的发展,人工智能技术已在金融、医疗、安防等多个领域实现技术落地,且应用场景愈来愈丰富,AI 产业已进入全方位商业化的发展阶段。截至 2019 年年末,全球共有 5,386 家活跃 AI 企业,27,400 名高级研究人员,20 座重点发展城市。2019 年,全球人工智能行业共产生约 374 亿美元融资,其中,自动驾驶、药物医疗、人脸识别、视频内容和金融反欺诈是获得融资最多的领域。根据国际数据公司(IDC)的数据,2020 年,全球人工智能产业规模达到501 亿美元,预计 2024 年将达到 1,100 亿美元,年复合增长率为 21.73%。根据高德纳咨询(Gartner)2018 年的预测数据,2019 年,全球人工智能产业的商业价值将达到 19,010 亿美元,预计 2022 年将达到 39,230 亿美元,年复合增长率为 27.31%。②中国 AI 产业市场规模当前我国人工智能产业加速发展,从基础支撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推动中国AI 产业的结构调整,进一步扩大市场规模。截至 2019 年年末,中国(不含港澳台)活跃 AI 企业达到 1,189 家,占全球总数的 22.08%,位居全球第二;中国高级研究人员共有 533 名,AI 人才储备方面综合排名全球第七,仍有较大的发展空间。2019 年期间,中国人工智能领域论文的发布数量占该领域全球论文发布总量的 28%,位列全球第一;2008-2019年人工智能领域的专利申请共发生 448,684 项,中国拥有 66,508 项,位列全球第二,中国的 AI 技术水平处于全球前列。2019 年,中国人工智能行业的融资总额约为 166 亿美元,占全球的 44.39%,位居全球首位。根据国际数据公司(IDC)的数据,2020 年,中国人工智能产业规模将达到 62.70 亿美元,预计 2024 年将达 172.16 亿美元,年复合增长率达到 30.40%。2、人工智能基础数据服务行业发展情况及未来发展趋势(1)全球 AI 基础数据服务行业的发展情况全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长,这种趋势导致训练数据难以获取和数据科学家、数据工程师等人力资源稀缺成为制约AI 产业发展的两大挑战。根据 Dimensional Research 的全球调研报告,72%的受访者认为至少使用超过 10 万条训练数据进行模型训练,才能保证模型有效性和可靠性,96%的受访者在训练模型的过程中遇到训练数据质量不佳、数量不足、数据标注人员不足等难题。为应对训练数据所带来的多方面挑战,AI 企业开始从第三方购买原料数据收集、训练数据生产和数据专家咨询等服务,调研结果指出,外包服务能够有效加快算法模型落地应用的速度。因此,得益于训练数据需求增长和对外采购意识的形成,全球基础数据服务行业进入快速成长期,市场规模具有较大的增长潜力。(2)中国 AI 基础数据服务行业市场规模与需求类型①中国基础数据服务行业的市场规模从 AI 产业链的发展情况和未来发展趋势来看,中国基础数据服务行业的市场规模将不断扩大。一方面,随着算法模型、技术理论和应用场景的优化和创新,AI 产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。根据艾瑞咨询《2020 年中国 AI 基础数据服务行业研究报告》,2019 年中国基础数据服务行业的市场规模达到 30.9 亿元,预计 2025 年将突破 100 亿元,复合年增长率达到 21.8%。②中国 AI 基础数据服务行业需求类型按数据类型划分,中国基础数据服务行业的市场需求可以分为图像类数据需求、语音类数据需求和自然语言处理类数据需求。2019 年,图像类、语音类和自然语言处理类数据需求规模占比分别为 49.7%、39.1%和 11.2%。

    核心竞争力

    ①技术优势——多年积累的多项核心技术及数据处理使用的工具、平台发行人在基础数据服务行业深耕多年,始终秉承基础研究与实际应用紧密结合的原则,持续开展基础研发等研究创新工作。在算法、技术方面,发行人的专业研发团队结合多年训练数据生产经验需求,积累下 12 项核心技术(详见招股说明书“第六节 业务和技术/六、发行人的研发和技术/(四)各项核心技术具体情况”),尤其在多语种的语音语言学基础研究和高效数据处理技术方面积累下 5 项具备较强专业性、较高技术壁垒、较难为同行业公司或上下游行业突破的核心技术——语音语言学基础研究、多语种多模态训练数据设计技术、数据同步技术、大数据驱动的高效数据处理技术及分布式高性能自动校验技术。在主营业务领域,发行人已取得 24 项发明专利授权、1 项实用新型专利授权及 1 项外观设计专利授权,另有 2 项专利已提交申请,较同行业公司处于领先水平。在工具、平台方面,为使训练数据生产相关的技术落地,发行人自主开发了一体化数据处理平台,嵌入训练数据生产各环节所需的工具、软件模块,持续将训练数据生产相关算法、技术的基础研究成果运用至具体工具/平台之中,并结合市场及内部数据开发需求的变动持续调整技术应用、打磨技术细节、优化工具/平台,提升开发效率、服务质量及数据安全性,从而为客户提供高质量的训练数据产品和高效率的训练数据定制服务。在语音语言学基础研究方面,公司建立了成熟的发音词典构建流程、积累了深厚的语音语言学基础研究成果,产品/服务覆盖 160 余个语种/方言,已积累下超 100 个语种/方言的发音词典,覆盖希伯来语、乌尔都语、缅甸语等小语种,累计词条数超 1000 万条,可构建高质量的智能语音训练数据,是发行人在智能语音训练数据生产领域的主要壁垒及核心技术之一。②资源优势——数百个自有知识产权的产品,多场景、多语言覆盖能力,丰富的多语种语言学家团队资源积累及稳定合作的供应商、客户等上下游资源受益于前述专业技术积累以及多年专业客户服务经验,截至 2020 年 12 月31 日,发行人已积累下 760 余个自有知识产权的训练数据产品,覆盖智能语音、计算机视觉及自然语言三大领域;产品/服务可覆盖 160 余个语种/方言,涉及生活交流、客服、家居、办公、行车、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,可应用于智能助理、智慧交通、智能搜索、智能家居、自动驾驶等 16 类终端应用场景。同时,发行人拥有丰富的多语种语言学家团队资源,成员遍布世界各地的学校和研究机构,在语音语言学领域具备丰富经验和技术储备。且多年来深耕基础数据服务行业,发行人与供应商、客户等上下游合作稳定,获得众多下游客户的认可。上述资源优势根植于发行人超过 15 年的训练数据生产经验和资源积累,需要长时间的行业深耕和持续投入才能形成,存在明显优势。③人才优势——公司高管及核心技术人员有着深厚的技术背景和丰富的行业经验。公司高管及核心人员大多毕业于清华、北大、中科大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、中科院等业内领先成熟企业与研究机构担任人工智能领域技术研发与管理的领导职务。这些核心人员将其在业内优秀企业积累的技术经验和管理经验应用于公司实践,并通过传帮带培养了一批专业而精干的中层技术团队,有效提升了企业的技术水平和规范化运作水平,实现了对客户的快速响应、高品质交付。高管、核心技术人员及其培养出的专业而精干的技术团队所塑造的人才优势帮助公司创立了现在的优势市场地位,并为未来公司的长远发展提供了重要保证。

    经营计划

    在未来的几年中,公司计划大规模研发多语种、多场景下的语音识别、语音合成、计算机视觉以及自然语言训练数据,尽可能使客户通过采购公司的训练数据产品/服务即可获得开发大规模、可商用的人工智能系统所需要的全部训练数据。为了提高完成这一大规模研发项目的工作效率,公司计划升级一体化数据处理平台,扩建研发中心,合作/聘请更多的国内外语言学家、人工智能技术专家、分布式系统技术专家、软件研发专家和数据安全技术专家,提升公司在训练数据开发工具、平台研发以及数据处理技术能力方面的双重提升。同时,公司也计划与更多的境内外大型科技公司、人工智能公司、科研院所合作,开发设计更多训练数据驱动的应用场景,进一步拓展公司的业务范围。

    市场风险

    (一)市场竞争加剧的风险发行人所在的细分领域为人工智能基础数据服务领域。近年来,参与该行业的公司不断增多,导致市场竞争加剧。公司如果不能持续有效地制定并实施业务发展规划,则将受到竞争者的挑战,从而面临市场竞争加剧而导致的经营状况下滑、市场地位下降和可能失去主要客户的风险,进而影响公司的盈利能力和发展潜力。(二)收入主要来自老客户,新客户收入占比较低的风险报告期内,发行人收入主要来自老客户,新客户收入占比较低。2018 年、2019 年及 2020 年,发行人来自老客户的收入占比分别达到 88.58%、89.09%及93.47%。发行人正致力于维护老客户、拓展新客户,若老客户降低对公司产品、服务的采购量或公司未能维持与老客户的合作关系,则公司的经营情况将受到不利影响;若新客户拓展情况不达预期,则公司的经营情况也将受到不利影响。(三)专利被申请宣告无效的风险截至本招股说明书签署日,根据发行人收到的由专利代理机构转送的国家知识产权局专利局出具的《无效宣告请求受理通知书》,发行人及其子公司已取得授权的 9 项发明专利和 1 项实用新型专利被提出无效宣告请求,涉及无效宣告请求的相关专利情况参见本招股说明书“第六节 业务和技术/五、发行人的主要固定资产和无形资产/(二)主要无形资产/1、专利”。截至本招股说明书签署日,发行人已经收到上述专利中7项发明专利和1项实用新型专利的无效宣告请求审查决定书,其中 7 项发明专利维持专利权有效,1 项实用新型专利专利权维持部分有效,其余 2 项专利的无效宣告请求审查事项尚处于正常审理阶段,国家知识产权局专利局尚未作出裁定。尽管剩余 2 项涉及无效宣告请求的相关专利权被宣告无效的可能性较小,但不排除发行人的相关专利权被部分或者全部宣告无效的可能,若公司知识产权被宣告无效,公司被宣告无效的专利或其权利要求中公开的技术点可能存在被竞争对手或第三方模仿的风险,若相关方模仿上述技术从事与发行人同类型业务,参与市场竞争,可能会对发行人的业务经营和财务状况产生不利影响。(四)核心技术快速迭代的风险由于人工智能行业整体发展较为迅速,应用领域和应用场景不断拓展,下游需求随着行业发展不断发生变化,发行人进行数据开发所需的各项技术也面临着快速迭代更新的风险。如果发行人无法保持对行业发展趋势的洞察能力以及对研发人才的有效组织和研发经费的经济投入,则可能导致发行人在行业技术快速迭代过程中无法持续保持技术先进性和技术优势,进而对发行人的客户拓展、产品创新和经营业绩造成不利影响。

    时价预警

    详情>
    • 江恩支撑:64.72
    • 江恩阻力:75.0
    • 时间窗口:2024-05-27

    数据来自赢家江恩软件

    热论
    清酒桃花:

    海天瑞声 本周复盘总结

    海天瑞声本周股价出现上涨,本周上涨13.82%,近5日股价呈上涨走向,本周最高价为65.88元,出现在4月26日,最低价为53.77元,出现在4月22日

    滚个稻草:

    【海天瑞声公司可提供低空经济中自动驾驶等数据解决方案】4月23日电,海天瑞声在互动平台表示,公司主要专注于人工智能数据资源服务领域,致力于提供AI训练数据产品和服务,服务于人机交互、智能家居、

    赢家AI快讯:

    海天瑞声:公司可提供低空经济中自动驾驶等数据解决方案

    【海天瑞声:公司可提供低空经济中自动驾驶等数据解决方案】4月23日电,海天瑞声在互动平台表示,公司主要专注于人工智能数据资源服务领域,致力于提供AI训练数据产品

    套路深撩万人心:

    今日海天瑞声小幅下跌6.58%,近30日涨幅7.04%

    今日海天瑞声收盘报收62.03元,小幅下跌6.58%,以上下影中阴线收盘,此K线说明盘中多头能量尝试拉升,但最终败给空方能量,后市继续以规避风险为主。近30日涨幅7.04%,近15个交易日股价呈下跌走

    敢爱又何必退缩:

    目前688787海天瑞声小幅上涨5.92%,近一周跌幅11.18%

    目前688787海天瑞声收盘报收67.5元,小幅上涨5.92%,今日最高价为69.61元,最低价为63.01元,今日以光脚上影大阳线收盘,从K线形态上来看,目前多方能量占据上风,经过一波下跌之后出现大

    像不像韭菜:

    688787海天瑞声周三小幅下跌5.92%,近5日涨幅0.55%

    周三688787海天瑞声收盘报收71.5元,小幅下跌5.92%,近5日涨幅0.55%,近一周股价呈震荡趋势。

    谭无乡:

    海天瑞声这个股今天-5割的,竞价和开盘完全没量,卖不出去,太无奈

    时时开心:

    国盛计算机AI2024/4/2(周二)模型层苹果

    国盛计算机AI2024/4/2(周二)模型层苹果研究人员称其设备端模型ReALM性能优于GPT-4在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升Siri智能的模型,而且他们认为这个

    绚烂天空:

    海天瑞声 公司回购事项将严格按照董事会批准的要求执行,具体回购进展还请关注后续公司发布的相关公告

    证券之星消息,海天瑞声(688787)04月01日在投资者关系平台上答复投资者关心的问题。投资者公司发布回购之后,迟迟不回购,,股价低不回购,股价高超过回购价格,总之就是不回购!请问是否有忽悠式回购

    机关术:

    海天瑞声6887873月26日小幅下跌6.86%,近30个交易日涨幅88.53%

    3月26日海天瑞声688787收盘报收75.62元,小幅下跌6.86%,近30个交易日涨幅88.53%,近一周股价呈上涨走势。