海天瑞声:海天瑞声2022年半年度报告.PDF

上传人:w****8 文档编号:34855847 上传时间:2022-08-19 格式:PDF 页数:217 大小:3.57MB
返回 下载 相关 举报
海天瑞声:海天瑞声2022年半年度报告.PDF_第1页
第1页 / 共217页
海天瑞声:海天瑞声2022年半年度报告.PDF_第2页
第2页 / 共217页
点击查看更多>>
资源描述

《海天瑞声:海天瑞声2022年半年度报告.PDF》由会员分享,可在线阅读,更多相关《海天瑞声:海天瑞声2022年半年度报告.PDF(217页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2022 年半年度报告 1 / 217 公司代码:688787 公司简称:海天瑞声 北京海天瑞声科技股份有限公司北京海天瑞声科技股份有限公司 20222022 年半年度报告年半年度报告 2022 年半年度报告 2 / 217 重要提示重要提示 一、一、本公司董事会、 监事会及董事、 监事、 高级管理人员保证本公司董事会、 监事会及董事、 监事、 高级管理人员保证半半年度报告内容的真实年度报告内容的真实性性、 准确、 准确性性、完整完整性性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。 二、二、重大风险提示

2、重大风险提示 公司已在本报告中详细描述可能存在的风险,敬请查阅第三节“管理层讨论与分析”之五“风险因素”部分,请投资者注意投资风险。 三、三、公司公司全体董事出席全体董事出席董事会会议。董事会会议。 四、四、本半年度报告本半年度报告未经审计未经审计。 五、五、公司负责人公司负责人贺琳贺琳、 主管会计工作负责人、 主管会计工作负责人吕思遥吕思遥及会计机构负责人 (会计主管人员)及会计机构负责人 (会计主管人员) 杨韩杨韩声明:声明:保证半年度报告中财务报告的真实、准确、完整。保证半年度报告中财务报告的真实、准确、完整。 六、六、董事会决议通过的本报告期利润分配预案或公积金转增股本预案董事会决议通

3、过的本报告期利润分配预案或公积金转增股本预案 无 七、七、是否是否存在存在公司治理特殊安排等重要事项公司治理特殊安排等重要事项 适用 不适用 八、八、前瞻性陈述的风险声明前瞻性陈述的风险声明 适用 不适用 本报告中所涉及的未来计划、发展战略等前瞻性陈述,不构成本公司对投资者的承诺,敬请投资者注意投资风险。 九、九、是否存在被控是否存在被控股股东及其关联方非经营性占用资金情况股股东及其关联方非经营性占用资金情况 否 十、十、是否存在违反规定决策程序对外提供担保的情况?是否存在违反规定决策程序对外提供担保的情况? 否 十一、十一、是否存在半数是否存在半数以上以上董事无法保证公司所披露董事无法保证公

4、司所披露半半年度报告的真实性、准确性和完整性年度报告的真实性、准确性和完整性 否 2022 年半年度报告 3 / 217 十二、十二、其他其他 适用 不适用 2022 年半年度报告 4 / 217 目录目录 第一节第一节 释义释义. 5 第二节第二节 公司简介和主要财务指标公司简介和主要财务指标 . 7 第三节第三节 管理层讨论与分析管理层讨论与分析 . 12 第四节第四节 公司治理公司治理 . 53 第五节第五节 环境与社会责任环境与社会责任 . 55 第六节第六节 重要事项重要事项 . 57 第七节第七节 股份变动及股东情况股份变动及股东情况 . 81 第八节第八节 优先股相关情况优先股相

5、关情况 . 89 第九节第九节 债券相关情况债券相关情况 . 89 第十节第十节 财务报告财务报告 . 90 备查文件目录 载有公司法定代表人、主管会计工作负责人、会计机构负责人签名并盖章的财务报表 报告期内在中国证监会指定网站上公开披露的所有公司文件的正文以及公告的原稿 2022 年半年度报告 5 / 217 第一节第一节 释义释义 在本报告书中,除非文义另有所指,下列词语具有如下含义: 常用词语释义 本公司、公司、海天瑞声 指 北京海天瑞声科技股份有限公司 控股股东、实际控制人 指 贺琳 中瑞安 指 北京中瑞安投资中心(有限合伙),为公司股东 中瑞立 指 北京中瑞立投资中心有(有限合伙),

6、为公司股东 创慧科瑞 指 北京创慧科瑞投资管理有限公司, 为北京中瑞立投资中心 (有限合伙)普通合伙人、执行事务合伙人 创世联合 指 北京创世联合投资管理有限公司, 为北京中瑞安投资中心 (有限合伙)普通合伙人、执行事务合伙人 中移投资 指 中移投资控股有限责任公司,为公司的股东 清德投资 指 北京清德投资中心(有限合伙),为公司的股东 上海丰琬 指 上海丰琬投资合伙企业(有限合伙),为公司的股东 上海兴富 指 上海兴富创业投资管理中心(有限合伙),为公司的股东 中网投 指 中国互联网投资基金(有限合伙),为公司的股东 天津金星 指 天津金星创业投资有限公司,为公司的股东 杭州银杏数 指 杭州

7、银杏数股权投资合伙企业(有限合伙),为公司的股东 杭州士兰 指 杭州士兰创业投资有限公司,为公司的股东 芜湖青和 指 芜湖朗姿青和一号股权投资合伙企业(有限合伙),为公司的股东 芜湖博信 指 芜湖博信五号股权投资合伙企业(有限合伙),为公司的股东 Appen 指 Appen Limited,是一家成立于澳大利亚的训练数据产品和服务提供商 慧听科技 指 北京慧听科技有限公司,是一家国内同行业的训练数据产品和服务提供商 标贝科技 指 标贝(北京)科技有限公司,是一家国内同行业的训练数据产品和服务提供商 证监会 指 中国证券监督管理委员会 上交所 指 上海证券交易所 工信部 指 中华人民共和国工业和

8、信息化部 公司法 指 中华人民共和国公司法 证券法 指 中华人民共和国证券法 上市规则 指 上海证券交易所科创板股票上市规则 公司章程 指 北京海天瑞声科技股份有限公司章程 2022 年半年度报告 6 / 217 报告期 指 2022 年 1 月 1 日至 2022 年 6 月 31 日 华泰联合证券 指 华泰联合证券有限责任公司,公司保荐机构、持续督导机构 信永中和 指 信永中和会计师事务所(特殊普通合伙),公司审计机构 元、万元、亿元 指 如无特别说明,均以人民币为度量币种 训练数据 指 通过采集与处理等步骤形成的、结构化的、可供人工智能算法模型训练使用的数据 算法 指 解题方案的准确而完

9、整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制 算力 指 计算能力 人工智能(AI) 指 Artificial Intelligence,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学 机器学习 指 Machine Learning,是一门专门研究计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科 深度学习 指 Deep Learning,机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本 模型

10、指 为解决人工智能领域的相应问题,而专门设计的某种算法框架,并通过大量数据训练拟合来调整相应参数,最终得到能解决实际问题的一套算法和参数 引擎 指 是计算机平台上开发相应应用程序或软件系统的核心组件 鲁棒性 指 鲁棒性亦称稳健性、强健性,是指计算机软件/系统在异常和危险情况下生存的能力。例如,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性 智能语音 指 实现人机语言的通信, 包括语音识别技术 (ASR) 和语音合成技术(TTS) 语音识别(ASR) 指 Automatic Speech Recognition, 是一种将语音信号自动转换为文本的

11、技术,是实现智能人机交互的关键技术之一 语音合成(TTS) 指 Text to Speech,即“从文本到语音”,是一种将文字智能地转化为自然语音的技术 自然语言/自然语言处理(NLP) 指 Natural Language Processing, 是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法 计算机视觉(CV) 指 Computer Vision,是一门研究如何使机器“看”的科学,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等 光学字符识别(OCR) 指 是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测

12、暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程 IoT 指 物联网(IoT ,Internet of things )即“万物相连的互联网”,是互联网基础上的延伸和扩展的网络,将各种信息传感设备2022 年半年度报告 7 / 217 与网络结合起来而形成的一个巨大网络,实现任何时间、任何地点,人、机、物的互联互通 智能驾驶 指 指的是机器帮助人进行驾驶,以及在特殊情况下完全取代人驾驶的技术,包括座舱交互、道路识别、道路规划等细分领域 DMS 指 驾驶员监控系统,即 DMS(Driver Monitor System) OMS 指 乘客监控系统,即 OMS(Occupan

13、cy Monitor System) 虚拟人 指 虚拟人(VirtualHuman)是通过建模、动作捕捉或 AI 等科技手段,制作出具有外貌特征和行为模式的虚拟形象,并通过显示设备呈现出来。虚拟人创造的价值主要是打破物理的空间限制,提供了更多沉浸感、参与感和互动感 原料数据 指 Raw Data,即未经加工处理的原始数据 采集 指 使用软件工具、录音设备、图像拍摄设备等收集、录制和获取原料数据的过程 标注 指 训练数据的生产步骤之一,指对原料数据进行加工,进而生成符合算法模型训练要求的训练数据的过程 转写 指 通过软件加工、人工听写等手段将语音片段转换为对应的文本的加工步骤 词性 指 以词的特

14、点划分的词类,如名词、代词、动词、形容词、数词、量词等 韵律 指 韵律通常指语音语句中各词之间的停顿时长情况 声纹 指 用电声学仪器显示的携带言语信息的声波频谱 音色 指 声音的特征,指的声音在波形方面具有的与众不同的特性 ITN 指 ITN(Inverse Text Normalization,逆文本正则化),将正则化的文本形式(例如:二零二二年二月十日)转换成书写体形式(例如:2022-02-10) 第二节第二节 公司简介和主要财务指标公司简介和主要财务指标 一、一、 公司基本情况公司基本情况 公司的中文名称 北京海天瑞声科技股份有限公司 公司的中文简称 海天瑞声 公司的外文名称 Beij

15、ing Haitian Ruisheng Science Technology Ltd. 公司的外文名称缩写 Speechocean 公司的法定代表人 贺琳 公司注册地址 北京市海淀区成府路28号4-801 公司注册地址的历史变更情况 2012年9月14日,公司地址由北京市海淀区知春路甲48号3号楼4单元6B变更为北京市海淀区成府路28号4-801 2022 年半年度报告 8 / 217 公司办公地址 北京市海淀区成府路28号4-801 公司办公地址的邮政编码 100083 公司网址 电子信箱 报告期内变更情况查询索引 / 二、二、 联系人和联系方式联系人和联系方式 董事会秘书(信息披露境内代

16、表) 证券事务代表 姓名 吕思遥 张哲 联系地址 北京市海淀区成府路28号4-801 北京市海淀区成府路28号4-801 电话 010-62660772 010-62660772 传真 010-62660892 010-62660892 电子信箱 三、三、 信息披露及备置地点变更情况简介信息披露及备置地点变更情况简介 公司选定的信息披露报纸名称 中国证券报()、上海证券报()、证券日报()、证券时报() 登载半年度报告的网站地址 公司半年度报告备置地点 公司董事会办公室 报告期内变更情况查询索引 / 四、四、 公司股票公司股票/存托凭证简况存托凭证简况 ( (一一) ) 公司股票简况公司股票简

17、况 适用 不适用 公司股票简况 股票种类 股票上市交易所及板块 股票简称 股票代码 变更前股票简称 人民币普通股 (A股) 上海证券交易所科创板 海天瑞声 688787 不适用 ( (二二) ) 公司公司存托凭证存托凭证简简况况 适用 不适用 五、五、 其他有关资料其他有关资料 适用 不适用 2022 年半年度报告 9 / 217 六、六、 公司主要会计数据和财务指标公司主要会计数据和财务指标 ( (一一) ) 主要会计数据主要会计数据 单位:元 币种:人民币 主要会计数据 本报告期 (16月) 上年同期 本报告期比上年同期增减(%) 营业收入 114,784,441.98 106,001,5

18、99.53 8.29 归属于上市公司股东的净利润 19,425,375.66 37,815,121.62 -48.63 归属于上市公司股东的扣除非经常性损益的净利润 8,239,795.49 33,690,078.99 -75.54 经营活动产生的现金流量净额 -3,435,381.42 9,948,474.57 -134.53 本报告期末 上年度末 本报告期末比上年度末增减(%) 归属于上市公司股东的净资产 815,931,241.93 805,908,403.05 1.24 总资产 842,436,074.15 840,663,396.09 0.21 ( (二二) ) 主要财务指标主要财务

19、指标 主要财务指标 本报告期 (16月) 上年同期 本报告期比上年同期增减(%) 基本每股收益(元股) 0.45 1.18 -61.86 稀释每股收益(元股) 0.45 1.18 -61.86 扣除非经常性损益后的基本每股收益(元股) 0.19 1.05 -81.90 加权平均净资产收益率(%) 2.39 8.28 减少5.89个百分点 扣除非经常性损益后的加权平均净资产收益率(%) 1.01 7.37 减少6.36个百分点 研发投入占营业收入的比例(%) 37.18 22.65 增加14.53个百分点 公司主要会计数据和财务指标的说明 适用 不适用 (1) 报告期内,公司实现营业收入 11,

20、478.44 万元,实现归属于上市公司股东的净利润1,942.54 万元,实现归属于上市公司股东的扣除非经常性损益的净利润 823.98 万元,分别较上2022 年半年度报告 10 / 217 年同期增加 8.29%,减少 48.63%、75.54%。主要系报告期内,为配合公司研发、管理、营销体系升级的战略发展及业务拓展目标,在收入稳中有升的同时,公司在研发体系迭代、管理架构及激励体系升级、营销体系全球化建设方面继续加大投入,员工人数同比大幅增长,由此导致公司整体业绩承压。 (2) 报告期内, 经营活动产生的现金流量净额为-343.54 万元, 较上年同期减少 134.53%。主要系受报告期内

21、国内新冠肺炎疫情影响,二季度内部分时间公司全员及部分客户居家办公,导致发票开具及回款速度显著减缓,使部分信用期内应收款项增加。另外,年初支付上年已计提奖金,以及为配合公司战略发展及业务拓展目标,公司在研发体系、管理架构、营销体系建设方面加大投入,员工人数同比大幅增长,相关支出大幅增长所致。 (3) 报告期内, 基本每股收益及稀释每股收益较上年同期减少 61.86%, 扣除非经常性损益后的基本每股收益较上年同期减少 81.90%。主要系报告期内公司净利润及扣除非经常性损益的净利润降幅明显、同时 2021 年下半年在科创板首次公开发行股票使得股本和平均净资产增幅明显所致。 七、七、 境内外会计准则

22、下会计数据差异境内外会计准则下会计数据差异 适用 不适用 八、八、 非经常性损益项目和金额非经常性损益项目和金额 适用 不适用 单位:元 币种:人民币 非经常性损益项目 金额 附注(如适用) 非流动资产处置损益 315,581.69 越权审批,或无正式批准文件,或偶发性的税收返还、减免 计入当期损益的政府补助,但与公司正常经营业务密切相关,符合国家政策规定、按照一定标准定额或定量持续享受的政府补助除外 5,376,284.16 主要系专精特新小巨人资金支持补贴、企业上市挂牌补贴 计入当期损益的对非金融企业收取的资金占用费 企业取得子公司、联营企业及合营企业的投资成本小于取得投资时应享有被投资单

23、位可辨认净资产公允价值产生的收益 非货币性资产交换损益 委托他人投资或管理资产的损益 2022 年半年度报告 11 / 217 因不可抗力因素,如遭受自然灾害而计提的各项资产减值准备 债务重组损益 企业重组费用,如安置职工的支出、整合费用等 交易价格显失公允的交易产生的超过公允价值部分的损益 同一控制下企业合并产生的子公司期初至合并日的当期净损益 与公司正常经营业务无关的或有事项产生的损益 除同公司正常经营业务相关的有效套期保值业务外, 持有交易性金融资产、 衍生金融资产、 交易性金融负债、 衍生金融负债产生的公允价值变动损益, 以及处置交易性金融资产、 衍生金融资产、 交易性金融负债、 衍生

24、金融负债和其他债权投资取得的投资收益 7,467,136.55 公司为提高资金使用效益,购买银行保本浮动收益型理财产品取得的投资收益 单独进行减值测试的应收款项、 合同资产减值准备转回 对外委托贷款取得的损益 采用公允价值模式进行后续计量的投资性房地产公允价值变动产生的损益 根据税收、会计等法律、法规的要求对当期损益进行一次性调整对当期损益的影响 受托经营取得的托管费收入 除上述各项之外的其他营业外收入和支出 -32.45 其他符合非经常性损益定义的损益项目 减:所得税影响额 1,973,389.78 少数股东权益影响额(税后) 合计 11,185,580.17 将公开发行证券的公司信息披露解

25、释性公告第 1 号非经常性损益中列举的非经常性损益项目界定为经常性损益项目的情况说明 适用 不适用 2022 年半年度报告 12 / 217 九、九、 非企业会计准则业绩指标说明非企业会计准则业绩指标说明 适用 不适用 第三节第三节 管理层讨论与分析管理层讨论与分析 一、一、 报告期内公司所属行业及主营业务情况说明报告期内公司所属行业及主营业务情况说明 ( (一一) ) 所属行业情况所属行业情况 1. 行业的发展阶段、基本特点、主要技术门槛行业的发展阶段、基本特点、主要技术门槛 根据国家统计局 战略性新兴产业分类(2018) , 公司所从事的训练数据生产业务属于 “新一代信息技术产业新兴软件和

26、新型信息技术服务新型信息技术服务信息处理和存储支持服务数据加工处理服务”行业,是国家重点支持的“新一代信息技术领域”的战略性新兴产业。公司通过设计训练数据集结构、执行数据采集、加工处理过程,生产用于算法模型开发训练用途的专业数据集,并以软件形式向客户交付,所属行业为软件和信息技术服务业。 根据中国证监会颁布的上市公司行业分类指引(2012 年修订),公司所属行业为“软件和信息技术服务业”,行业代码为“I65”。 1.1 行业的发展阶段、基本特点行业的发展阶段、基本特点 (1) 训练数据作为训练数据作为 AI 算法发展和演进“燃料”的作用继续凸显算法发展和演进“燃料”的作用继续凸显 在 AI 产

27、业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据早已成为算法模型发展和演进的“燃料”。2021 年,全球人工智能和机器学习领域最权威的学者之一吴恩达教授提出二八定律:AI 研究 80%的工作应该放在数据准备上,确保数据质量是最重要的工作;业界如果更多地强调以数据为中心而不是以模型为中心,那么机器学习的发展会更快。 然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、 加工, 形

28、成相应的工程化训练数据集后才能供深度学习算法等训练使用。目前,应用有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支撑价值。 (2) AI 产业对训练数据服务的需求持续产生、规模继续扩大产业对训练数据服务的需求持续产生、规模继续扩大 AI 产业对训练数据的需求主要来源于成熟算法模型的拓展性需求和新生算法模型的前瞻性需求。在成熟的拓展性需求方面,Mckinsey Global Institute 的研究报告表明: 2022 年半年度报告 13 / 217 深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求。为充分发挥技术潜

29、能, 深度学习模型需要海量且涵盖图像、 视频及语音在内等多种类型的训练数据进行模型训练。此外,人工智能技术要求算法模型根据潜在的应用场景变化而持续更新,因此,算法模型所使用的训练数据亦需要定期更新。具体而言,约 1/3 的算法模型每月至少更新一次,约 1/4 的算法模型每日至少更新一次,算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。 而在新生的前瞻性需求方面,随着人工智能商业化进程的演进,新兴应用场景如智能驾驶、智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训

30、练数据产品和高定制化的训练数据服务需求将逐步成为主流。 (3) 全球和中国全球和中国 AI 基础数据服务行业规模持续扩张基础数据服务行业规模持续扩张 全球和中国 AI 产业市场规模 经过多年的发展,人工智能技术已在人机交互、智能家居、智能驾驶、智慧金融、智能安防等多个领域实现技术落地,且应用场景愈来愈丰富,AI 产业已进入全方位商业化的发展阶段。 根据国际数据公司(IDC)的数据,2021 年,全球人工智能市场规模将达到 885.7 亿美元,预计 2025 年将达到 2,218.7 亿美元,年复合增长率达到 26.2%。 数据来源:国际数据公司(IDC) 当前我国人工智能产业加速发展,从基础支

31、撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推动中国 AI 产业的结构调整,进一步扩大市场规模。根据国际数据公司(IDC)的数据,中国人工智能市场规模预计 2025 年有望达 184.3 亿美元,年复合增长率达到 24.4%。 2022 年半年度报告 14 / 217 数据来源:国际数据公司(IDC) 全球和中国 AI 基础数据服务行业发展情况及规模 全球基础数据服务行业处于快速成长期, 市场规模具有较大的增长空间。从 AI 产业链的发展情况和未来发展趋势来看,中国基础数据服务行

32、业的市场规模也将不断扩大。一方面,随着算法模型、技术理论和应用场景的优化和创新,AI 产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。 根据国际数据公司 (IDC) 2022 年 3 月发布的 IDC Worldwide Artificial Intelligence Spending Guide预测,2025 年中国人工智能市场规模有望达到 184.3 亿美元(约 1,200 亿人民币),其中,关于基础数据部分,根据 IDC 发布的2021 年

33、中国人工智能基础数据服务市场研究报告,预计中国 AI 基础数据服务市场规模近 5 年来的复合年增长率达到 47%, 预期 2025 年将突破 120亿元, 达到中国人工智能市场支出总额的约 10%。 同时, 根据 IDC Worldwide Artificial Intelligence Spending Guide的预测,2025 年全球人工智能市场规模将达到 2,218.7 亿美元,基础数据服务板块也将是其重要的组成部分之一。 2022 年半年度报告 15 / 217 数据来源:国际数据公司(IDC) (4) 以智能驾驶为代表的垂直领域对训练数据需求正在兴起,市场规模可观以智能驾驶为代表的

34、垂直领域对训练数据需求正在兴起,市场规模可观 当前 AI 技术开始广泛应用于不同产业,展现出可观的商业价值和巨大的发展潜力, 为数据服务行业提供巨大的发展红利。产业化应用新产品、新应用、新场景层出不穷,产生了大量新兴垂直领域的基础数据需求,这其中尤以智能驾驶为代表的产业级应用呈现快速增长态势,为数据服务的发展提供了长期向好的基本面。 随着智能化、自动化技术不断成熟,汽车产品正在向智能移动终端快速演进。同时,在智能联网技术的推动下,智能汽车将逐渐接力成为乘用车市场中主要的增长动力。在汽车智能网联化的变革中,汽车电子、软件、算法等价值将因智能驾驶技术而显著提升。先进的通讯、计算机、人工智能等技术不

35、断应用在智能驾驶汽车中,成为愈加重要的生产要素。而在智能驾驶功能实现的过程中,数据扮演着至关重要的角色。 以实现智能驾驶所不可逾越的第一环节-环境感知为例,智能驾驶车辆通过各类传感器如摄像头、毫米波雷达、超声波雷达、激光雷达等获取车辆周边信息,产生图片数据、视频数据、点云图像、 电磁波等信息, 去除噪点信息后利用不同类型数据形成冗余同时提升感知精度和鲁棒性。对于不同级别智能驾驶汽车和驾驶任务而言,需要的传感器类型、数量和性能也有所区别。这就意味着获取高质量、大规模、多种类、强特征的训练数据是实现高精准度环境感知、进而实现高质量智能驾驶的关键。 根据中金公司研究部预测,仅在高级别智能驾驶领域,随

36、着落地场景的广泛化以及商业化进程的提速,市场规模可达万亿元级别。具体应用场景可分为 2C(乘用车)、2B(商用车)和 2G(政府国企)等。根据中金公司研究部测算,预计我国高速城际物流市场达 3.3 万亿元,智能驾驶出行服务市场近 1.7 万亿元,矿区无人驾驶市场近 6,700 亿元,无人末端配送市场达 1,700 亿元。目前,智能驾驶数据服务需求处于加速起步阶段,市场规模尚无法准确估量,但随着数据之于 AI 应用技术研发的作用的提升,依托于智能驾驶巨大的市场空间,智能驾驶数据服务领域的市场规模同样具有广阔前景。 除智能驾驶领域外,其他垂直行业(例如智慧金融、工业互联网等)和政企领域也将成为训练

37、数据实现规模化应用的重要方向,是尚未估量的新增市场,且每一个垂直行业内部均有诸多细分,因此市场容量非常可观。 (5) 国家政策顶层引领、行业重点支持与规范安全监管协同并进国家政策顶层引领、行业重点支持与规范安全监管协同并进 当前,我国已经开始进入由工业经济迈向数字经济发展的“新阶段”,国家高度重视数字经济,而数据要素是数字经济深化发展的核心引擎。习近平总书记在中共中央政治局就实施国家大数据战略进行第二次集体学习时曾指出:数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力,要构建以数据为关键要素的数字经济。2022 年 1 月 12 日,国务院印发“十四2022 年半年度报告 16 /

38、 217 五”数字经济发展规划明确提出:数据要素是数字经济深化发展的核心引擎,坚持以数字化发展为导向,充分释放要素价值,激活数据要素潜能。随着数据要素作为国家级战略资源地位不断凸显,一系列国家引领与行业鼓励政策不断推进,数据作为当前最具时代特征的生产要素,成为重点支持领域,为数据资源产业带来了巨大的发展机遇。 与此同时,随着数字经济规模的快速扩张,数字技术广泛应用和法律规范启动落地的相互交融也成为数据产业健康发展的必然趋势,建设规范、安全、合规、高质量的数字经济已成为迫切要求,国家陆续出台包括数据安全法、个人信息保护法、汽车数据安全管理若干规定(试行)、数据出境安全评估办法等主流法律法规,为解

39、决数据安全问题、净化行业快速发展中的不良乱象提供了切实可行的法律依据。 主要行业政策及法律法规如下: 序号序号 发布时间发布时间 发文机关发文机关 主要行业政策及主要行业政策及 法律法规法律法规 相关内容相关内容 1 2022 年 7 月 国家互联网信息办公室 数据出境安全评估办法 该办法明确了数据出境安全评估的适用范围,事前评估和持续监督相结合、风险自评估与安全评估相结合等原则,规定了应当申报数据出境安全评估的情形,以及数据出境安全评估的具体要求、评估程序、监督管理制度、法律责任以及合规整改要求等。 2 2022 年 3月 国务院 国 务 院 关 于 落 实政府工作报告重点工作分工的意见 提

40、出要促进数字经济发展,加强数字中国建设整体布局,建设数字信息基础设施,逐步构建全国一体化大数据中心体系,促进产业数字化转型。培育壮大人工智能等数字产业,完善数字经济治理,培育数据要素市场、释放数据要素潜力,提高应用能力。 3 2022 年 1 月 国务院 “十四五” 数字经济发展规划 明确指出数据要素是数字经济深化发展的核心引擎,坚持以数字化发展为导向,充分释放要素价值,激活数据要素潜能。 4 2021 年 8 月 国 家 互 联网 信 息 办公室等 汽车数据安全管理 若 干 规 定 ( 试行) 作为汽车数据安全领域出台的第一份有针对性的管理规定,明确了汽车数据处理者的责任和义务,规范汽车数据

41、处理活动,对防范化解汽车数据安全风险、保障汽车数据依法合理有效利用具有重要意义。 5 2021 年 8 月 第 十 三 届全 国 人 大常委会 个 人 信 息 保 护法 进一步细化、完善个人信息保护应遵循的原则和个人信息处理规则,明确个人信息处理活动中的权利义务边界,健全个人信息保护工作体质机制。 2022 年半年度报告 17 / 217 1.2 行业的主要技术门槛行业的主要技术门槛 随着 AI 技术不断演进、产业应用不断丰富,训练数据的市场需求呈现体量、难度、复杂性、合规性持续上升的趋势,数据服务商须具备对人工智能核心算法的理解能力、前瞻性的专业数据集设计能力、丰富的语言覆盖能力及场景采集能

42、力、以及算法辅助数据生产能力,这使得行业的技术门槛持续提升,具体体现为: (1) 在训练数据研发、生产全流程中的算法全面介入在训练数据研发、生产全流程中的算法全面介入 随着 AI 技术应用落地的规模化效应凸显, 客户对于数据规模和处理效率的要求不断提升, 数据服务商须在研发、生产流程中全面引入算法以实现高效、合理的人机协作模式,进而实现降本增效的目标。一般而言,在训练数据研发、生产全流程中融入算法技术,可用于检查训练数据集对算法模型的训练效果, 进而反哺指导训练数据集的设计; 也可应用于训练数据生产的各个环节,例如调度不同类型的标注人员应对不同领域的任务、形成算法自动处理能力以帮助标注人员提升

43、效率、降低对人员的依赖(既有人员数量的降低、也有对人员标注能力要求的降低),并构建训练数据设计、加工相关的核心技术。 (2) 平台工具功能及适配性要求持续提升平台工具功能及适配性要求持续提升 当前,客户侧的数据采集、标注需求范围在逐渐拓宽,数据采集与标注需满足的 AI 应用场景比以往明显更加广泛、复杂,这就对数据服务商的平台工具能力提出了更高要求,平台上处理过多大规模的数据、这些处理过的数据的多样性和复杂程度如何、算法引擎投票机制如何建立、置信区间如何设置、算法在平台中如何应用、数据流转的工程化程度如何等等这些因素都决定了平台的适配性和能力如何,并最终决定了数据处理的质量、效率、成本。 6 2

44、021 年 6 月 第 十 三 届全 国 人 大常委会 中华人民共和国数据安全法 我国数据的使用和保护进入有法可依的新阶段,国家统筹发展和安全你,坚持以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。 7 2021 年 3 月 十 三 届 全国 人 大 四次会议 中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要 十四五规划指出要加快数字化发展,建设数字中国,同时打造数字经济新优势,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,壮大经济发展新引擎。同时指出要加强关键数字技术创

45、新应用:聚焦高端芯片、操作系统、人工智能关键算法、传感器等关键领域;建设重点行业人工智能数据集,发展算法推理训练场景。 8 2020 年 3 月 中共中央、国务院 中共中央 国务院关于构建更加完善的要素市场化配置 体 制 机 制 的 意见 首次将“数据”作为市场化要素写入国家顶层设计级别文件,提出要加快培育数据要素市场,发挥数据在市场化配置中的作用。 2022 年半年度报告 18 / 217 (3) 语音语言学基础研究方面须有深厚积累语音语言学基础研究方面须有深厚积累 伴随语音技术进一步发展落地、并向各行各业和更多垂直场景不断渗透,同时受到中国企业出海需求、国外企业区域拓展需求两方面的支撑,客

46、户在多语种、多音色、音素集、发音规则、发音词典等方面的要求在不断抬升,这意味着只有那些在语音语言学基础研究方面投入更多、拥有深厚积累的数据服务商才能满足客户在这方面的多元化需求。 因此,市场上仅有极少数企业通过长期自主研发的方式能够达到上述核心技术门槛,成为有能力向不同客户群体提供综合、高效、合规数据产品及服务的优质供应商。 2. 公司所处的行业地位分析及其变化情况公司所处的行业地位分析及其变化情况 (1) 深耕行业多年,拥有丰富的技术积累和行业经验,具备较强竞争优势深耕行业多年,拥有丰富的技术积累和行业经验,具备较强竞争优势 海天瑞声是我国最早专业从事训练数据产品与服务研发与及销售的主要企业

47、之一,公司凭借多年的研发积累和创新,不仅完成 1,050 余个自有知识产权的训练数据标准化产品集的建设,在大规模、高质量、可授权使用数据集存量全球企业排名中稳居前列,形成了大量核心技术与知识产权储备成果,并将基础研究、平台工具、训练数据生产等三大领域积累的核心技术持续应用于训练数据生产的各个环节,在数据集架构设计、开发标准、语言学特征、质检评测等多项技术指标方面凸显竞争优势。 多年积累的核心技术成果和综合专业服务能力,使得公司能够更大规模、更有效率、更加精准地生产 AI 训练数据,在提升自身产出效率的同时也有效提高了训练数据对于客户 AI 算法模型的改善、优化效果。公司与 AI 产业链上的各类

48、企业、研究机构持续保持长期的合作伙伴关系,截止报告期末,企业服务客户数量已达到 740 家,产品及服务能力不断得到优质客户的认可,未来公司将继续完善产品服务体系、升级服务质量,不断增强综合数据服务能力竞争优势。 (2) 处于中国处于中国 AI 基础数据服务行业第一梯队,拥有稳固的行业地位基础数据服务行业第一梯队,拥有稳固的行业地位 作为行业的头部阵营企业,海天瑞声在经营情况、市场地位、技术实力、核心竞争力等方面都展示出明显优势,并具有较强国际竞争力。近年来公司紧跟 AI 技术发展趋势,尤其关注在客户资源、技术实力、产品/服务等方面的竞争优势,树立国内领先基础数据服务商的品牌形象,以巩固公司的行

49、业领先地位。与同行业国内外竞争对手的对比情况及优势体现如下: 项目项目 海天瑞声海天瑞声 Appen 慧听科技慧听科技 标贝科技标贝科技 经营情况经营情况 成立 年份 2005 年 1996 年 2011 年 2016 年 市场地位概述 我国领先的训练数据产品服务专业提供商,是我国最早从事较早从事数据资源开发的数据资源产品服务提供商,经- - 2022 年半年度报告 19 / 217 项目项目 海天瑞声海天瑞声 Appen 慧听科技慧听科技 标贝科技标贝科技 训练数据产品服务研发销售的企业之一 营历史较长,规模、体量较大 员工 数量 272 超过 1,125 少于 50 人 100 余人 市场

50、 占有率 中国 AI 基础数据服务行业第二名,海天瑞声的市场占有率为12.9%1。 未公开披露 未公开披露 未公开披露 客户结构及客户数量客户结构及客户数量 主要客户/合作伙伴情况 大型科技公司, 如字节跳动、 阿里巴巴、 腾讯、百度、微软、三星等;人工智能企业, 如科大讯飞、 商汤科技、 云知声、 海康威视等; 科研机构,如中国科学院、清华大学、 中国科学技术大学等 微软、 亚马逊、 谷歌等大型科技公司、汽车厂商及政府 未公开披露 微软、 百度、 阿里、 腾讯、 京东、 滴滴、 字节跳动、网易、360、三星、 小鹏、 美的、 中科大、中电科、中国银行等 客户 数量 740 家 (截至 202

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 其他报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁