《2019中国AI+教育行业发展研究报告.pdf》由会员分享,可在线阅读,更多相关《2019中国AI+教育行业发展研究报告.pdf(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中国AI+教育行业发展研究报告 2019年 2 2020.2 iResearch Inc. 摘要 无论是学界还是业界,其对AI+教育的发展理念基本达成共识,即以学习者为中心, 从外置型技术辅助走向内融型技术渗透。学界将继续挖掘教学目标与机器规则的可 适配性,开发特定教育场景下的关键技术,对不同发展阶段的业界玩家而言,具备 差异化竞争优势的高质量数据资源将成为其竞争的突破口,可在当前关注度不高的 特殊教育领域或者其他细分赛道当中探索更多应用场景。 校外教育在线化蓬勃发展,校内教育信息化稳中求进,资本与市场驱动消费体验升 级,政策与技术促进服务质量提升,校内外教育市场供需缺口凸显,亟待智能化解 决
2、方案加速教育现代化的进程,以促进教育公平,提升教育质量,实现教育个性化。 整体市场规模超400亿,泛AI产品的渗透率不高,B端对AI解决方案直接付费的意 愿更强,受教育用户较长的技术接受周期影响,C端商业化难度较大。主要应用当 中,口语测评与拍照搜题的用户渗透率较高,但人工智能自适应仍在探索。走班排 课与校园安全是学校的刚需,校内外AI课堂正同步推进,其中海量数据的获取与利 用成最大障碍,智能化程度较低,教学效果有待验证。 参与者众,五类玩家打法各有千秋,覆盖面广,四类场景渗透程度不一。ToC方面, 外围教学环节AI程度高,内核教学环节仍在探索,ToB方面,管考场景商业化落地 进程较快,但底层
3、数据尚未打通,真正实现千人千面教学为时尚早。 SMS 来源:艾瑞咨询研究院自主研究绘制。 3 中国AI+教育行业发展背景:星星之火1 中国AI+教育行业发展现状:探索前进2 中国AI+教育行业企业案例:渐入佳境3 中国AI+教育行业发展趋势:步步为营4 4 2020.2 iResearch Inc. AI+教育的定位 为教育现代化建设打造智能引擎 基础设施 价 值 空 间 农业 制造 零售 交通 教育 客服 医疗 营销 安防 金融 人工智能产业成熟度评估模型教育产业现代化发展逻辑 在人工智能产业当中,金融、营销、安防、客服领域在IT基础设施、数据质量、对新技术的接受周期等AI发展基础条件方 面
4、表现较优,其商业化渗透率和对传统产业的提升程度较高。而教育行业整体AI化程度较低,数据质量参差不齐,解决方 案的落地效果表现一般,但得益于政策的大力支持与市场对AI的强烈需求,AI+教育的商业模式逐渐清晰,价值空间较高。 在教育产业当中,校外教育向在线化发展,校内教育向信息化发展。校外教育方面,在线化教学的的用户体验粗糙且教学 效果模糊,用户对新技术的接受周期较长,更加智能化的产品值得探索。此外,校内师生的信息素养不高,且信息化设备 使用频率较低,均导致核心教学数据缺失,最终加大了教育数据挖掘分析的难度,因此亟待智能化解决方案的落地实施。 智能化 校外在线化 市场资本 用户体验粗糙 教学效果模
5、糊 校内信息化 政策技术 信息素养不足 数据质量不高 61 2 34 5 全民化 平等与普及 终身化 贯穿一生 个性化 因材施教 社会化 产研学结合 国际化 交流与合作 信息化 效率提升 教育 现代化 来源:艾瑞2019年中国人工智能产业研究报告;艾瑞咨询研究院自主研究绘制。 5 2020.2 iResearch Inc. AI+教育的定义 人工智能技术在教育场景下的应用 对“AI+教育”的定义既要回归技术的本质,始终围绕基础数据、核心算法与服务目的,也要回归教育教学活动的出发点, 始终关注教育目标及其评价方式。因此,本文认为,“AI+教育”是指在人工智能与教育深度融合与发展的条件下,以基 于
6、教育场景的人工智能应用为路径,促进教育公平,提升教育质量,实现教育个性化。具体来看,“AI+教育”是人工智 能在教育领域中创新应用的技术、模式与实践的集合,可划分为“计算智能+教育”、“感知智能+教育”和“认知智能+ 教育”,即AI+教育正从“能存会算”向“能听会说与能看会认”发展,最终实现“能理解与会思考”。 信息 智能 + 教育 感知 智能 + 教育 认知 智能 + 教育 利用穷举和匹配搜索等 方法实现海量学习资源 的存储与传递,构建智 能化学生信息管理系统。 能存会算 通过数学建模和基于大数据的 深度学习等方法对人类感知能 力进行模拟,以实现语言教学、 口语测评和图像搜题等功能。 能听会
7、说 能看会认 模拟人类的推理、联想、知识组 织能力,使得机器和人一样能够 理解、会主动思考并采取合理行 动,具备一定的概念、意识和观 念,能够实现真正的自适应学习 能理解 会思考 AI+教育的定义 数据算法服务 教育目标评价方式 来源:艾瑞咨询研究院自主研究绘制。 知识与技能 过程与方法 情感与态度 问卷量表 标准化测试 档案记录评价 6 2020.2 iResearch Inc. AI+教育行业的应用场景 教、学、管、考场景下均有已落地的人工智能教育应用 从教育教学活动的角度来看,当前的教育场景可划分为教、学、管、考。其中,“教”和“管”的主体是教育者,前者负 责执行教学任务,主要工作包括教
8、研、备课、授课、答疑、出题、阅卷等,工作内容繁琐,核心需求是减轻负担,实现精 准化教学。后者负责统筹教务环节,主要工作包括教职工招募、师生督导、招生、分班排课、校园建设等,决策环节考虑 因素较多,核心需求是提高效率,实现科学化管理。“学”与“考”的主体是受教育者,“学”的场景下,学生的主要任 务包括预习、听课、看书、做作业、复习、考试、实习等,由于学生个体差异大,核心需求是自适应,实现个性化学习。 “考”的场景下,主要面向大规模标准化测试,组卷阅卷的工作庞大,部分测评环节劳动力密集且效率底下,核心需求是 保证准确性的前提下,实现自动化评阅。 创新 教学 评估 决策 面向教育者 来源:艾瑞咨询研
9、究院自主研究绘制。 教学管理 学习考试 科学化管理精准化教学 AI+教育的应用场景 面向受教育者自动化评阅个性化学习 学情分析VRAR教学 智能助教智能批改 游戏学习机教育机器人 拍照搜题自适应学习 决策支持校园监控 智慧校园智能排课 口语考评试卷分析 机器组卷机器阅卷 7 2020.2 iResearch Inc. AI+教育行业的技术架构 数据是基础,算法是核心,服务是目的 从AI+教育的技术架构来看,可初步分为三个部分,即基础层、算法层、应用层,每一层分别表现出不同的特点。基础层 主要包括算力、数据与算法框架,其中数据量级庞大冗杂,质量参差不齐,基于教学过程的非结构化和半结构化数据的处
10、理难度大,线下教学环节的数据普遍缺失。算法层是实现技术的核心,2006年提出的深度学习算法视为人工智能在算法层 的突破,该算法通过具备更多隐层节点的人工神经网络,实现逐层特征变换与学习,解决了很多复杂的模式识别难题。感 知层技术目前发展得较为成熟,在深度学习算法的助力下,感知技术应用场景广泛。认知层技术是未来发展的重要方向, 预期在特定领域内可实现机器一定程度上的认知推理能力,有显著的技术门槛。AI+教育的应用发展阶段各异,越外围的 教育环节,技术渗透率越高,技术的有用性与易用性也越好。 基 础 层 教学管理类数据教学资源类数据教学评价类数据 教学行为类数据 算 法 层 机器 学习 与 深度
11、学习 回归算法 聚类算法 贝叶斯算法 其他算法 生成对抗网络 卷积神经网络 循环神经网络 其他算法 感知层 语音识别 语音合成 指纹识别 人脸识别 文字识别 图像识别 应 用 层 拍照搜题个性化学习 教育机器人智能导学 自动化测评 分班排课 学情监测 智能批改 认知层 知识图谱自然语言理解 情感计算规划问题 AI+教育的技术架构 基于用户端的拍照搜题与自动化测评发展成熟,基于学 校端的学情检测与分班排课已成教育信息化系统的标配。 自适应学习、个性化学习、智能专家系统、基于情感的 学习态度分析等应用将在认知层技术的发展下逐一实现。 视觉技术商业化落地情况较好,而因语音技术本身涉及 感知层的自然语
12、言处理,落地难度相对较大。 按照算法设定的系统性的训练方法,对数据层的各类教 育数据进行计算和分析,不断训练模型以提高模型的预 测准确度。 基于教育场景以及各参与教育过程的角色(学生、教师、 教育管理者),对异构数据的进行集成处理,包括采集、 清洗、整理和存储,构建本地数据库和远程共享数据库。 来源:艾瑞咨询研究院自主研究绘制。 基础算力支撑基础算法框架 8 2020.2 iResearch Inc. AI+教育行业的发展历程:技术视角 从教学辅助向智能导学发展,逐渐渗透学习者认知过程 AlphaGo战胜人 类顶尖围棋选手 195619651982 推理期知识期机器学习期 达特茅斯会议 诞生了
13、人工智能学科 将逻辑推理能力 赋予计算机系统 总结人类知识 教授给计算机系统 计算机从数据中学习算法 深度学习在语音、图像领域大获成功 2006 Hinton发表 深度学习的 Nature 文章DENDRAL - 世界上第 一例成功 的专家系 统的诞生 196020162014 诞生期摸索期产业期 195419701992 全球AI+教育的发展历程 来源:艾瑞咨询研究院自主研究绘制。 新行为主义学习 理论创始人斯金 纳发表了题为 学习的科学和 教学艺术,推 动了程序教学运 动的发展 世界上第 一个计算 机辅助教 学系统 PLATO 系统诞生 提出智 能型计 算机辅 助教学 系统的 构想 提出
14、智能 教学 系统 框架 提出 智能 导师 系统 概念提出 智能 授导 系统 第一 个自 适应 教学 系统 问世 麻省理工学院研 发社交技能训练 系统MACH 2019 首届国际人工智能与 教育大会在北京召开 19731996 CNN 超第二名十个 百分点夺冠 ImageNet 2012 9 2020.2 iResearch Inc. AI+教育行业的发展历程:产业视角 依托于在线教育与教育信息化而发展,行业仍处初级阶段 中国AI+教育的发展历程 来源:艾瑞咨询研究院自主研究绘制。 在 线 教 育 教 育 信 息 化 AI + 教 育 197819912008201320162018 萌芽阶段
15、为多媒体教学积累理论经验; 推动教育信息化网络搭建及基础硬件普及,学校开 始利用计算机进行基础教务管理,少部分学校开始 多媒体教学; 建设驱动发展阶段 基础网络设施获得较大 提升,初步形成了基础 教育资源库; 考试成绩、大学课程选 择等多方面教育信息化 步入人们视野; 多媒体教学已较为普遍; 应用驱动发展阶段 作业系统、考试系统、选课系统 等服务教学活动的系统出现并为 学校和培训机构提供服务; 直播、翻转课堂、双师等新的教 学方式逐步出现并普及; 融合创新阶段 全国教育数据互通; 评估学生学习能力 和素质,个性化规 划学习路径、推荐 学习内容; 教学管理效率提升; 萌芽阶段 101远程教育网、
16、北京四中网校为 代表的名校网校兴起; 网络基础条件差,产品多为图文 形式,教育效果差; 启动阶段 带宽扩容,产 品升级为录播 视频; 线上产品粗糙、 销售困难; 初步发展阶段 云服务发展、 带宽扩容、4G 网络和智能终 端普及; 在线教育迎来 资本热潮; 快速发展阶段 教育大数据和教育科技进步, 新一代消费者逐渐崛起; 企业开始变现,大额融资频 繁 萌芽阶段启动阶段 拍照搜题与口语测评 类软件最先上线,分 级阅读与自适应学习 系统紧随其后。 各大教育公司开始建立AI实 验室与教学中心,不断加大 教育科技投入。 2019 10 2020.2 iResearch Inc. 2020.2 iRese
17、arch Inc. 10 25 52 44 35 50 58 1.3 2.6 12.4 5.5 12.4 26.5 16.8 2013201420152016201720182019 2013年-2019年中国AI+教育融资情况 融资数量(笔)融资总额(亿元) AI+教育行业的发展历程:资本视角 融资规模呈上升趋势,K12与教育信息化领域最受资本追捧 随着近年来人工智能的快速发展,AI+教育赛道备受资本关注。2013年-2019年,AI+教育领域共发生274笔投融资事件, 总融资额达145亿。从融资增速上来看,融资事件数复合增速达34%,融资总额增速达57%,资本一度狂热,其中K12与 教育信
18、息化领域的融资规模领跑其他细分赛道,期间各自总共融资78亿与20亿,分别占整体融资额的53.5%和13.6%。 来源:IT桔子,以教育公司为基准进行筛选; 艾瑞咨询研究院自主研究绘制。 CAGR=57% CAGR=34% 来源:IT桔子,以教育公司为基准进行筛选; 艾瑞咨询研究院自主研究绘制。 0.3 2.1 6.6 7.6 9.1 10.5 11.7 19.8 78.0 高等教育 教育综合服务 出国留学 语言学习 素质教育 职业培训 儿童早教 教育信息化 K12 中国AI+教育的细分领域累计融资情况 融资规模(亿元) 11 2020.2 iResearch Inc. AI+教育行业的发展驱动
19、力 产业、技术、政策、资本四力合一,全面驱动AI+教育发展 产业方面,在线教育渗透率不断提升,教育数据量增长迅速,为人工智能技术的实施提供了数据基础。由于目前在线教育 的体验及效果不佳,倒逼行业进行技术升级,人工智能解决方案将成为在线教育体验提升的主要途径。技术方面,互联网 基础设施全面普及,在大数据、云计算和5G等支持性技术不断成熟的背景下,数据量和算力将获得进一步提升,人工智能 技术有望实现突破。政策方面,近几年来,我国针对人工智能及人工智能+教育领域的政策层出不穷,人工智能已上升至 国家战略级别,教育更是关乎国计民生的大事,行业尚处红利期。资本方面,教育行业巨头纷纷布局,知名投资机构频频
20、 出手,融资规模超百亿,融资阶段覆盖天使轮至IPO,成为教育领域近年来最大投资热点。 来源:艾瑞咨询研究院自主研究绘制。 产业升级 在线教育发展迅速, 每年保持20%左右的 增长,整体数据量激 增。在线教育的渗透 率在10%左右,体验 粗糙和结果模糊将倒 逼整个产业进行分领 域、分环节的在线化 与智能化。 教育信息化领域则进 入2.0阶段,以AI智 慧课堂为代表的智能 化产品开始辅助校内 教学。 01 技术落地 在金融和安防等多个 领域已实现商业化落 地,5G时代下,人 工智能应用将延伸至 边缘,丰富基于智能 教育硬件的教学场景。 随着数据量和算力的 提升,在特定的教育 领域和人工智能领域 有
21、望实现突破。 02 政策护航 近五年,人工智能的 相关政策经历了三个 阶段,从“智能制造” 到“互联网+”再到 “国家战略规划”, 重要性逐步提升。 近三年,新一代人 工智能发展规划与 教育信息化2.0行 动计划的出台大力 推进人工智能+教育 领域的发展。 03 资本助力 从2013年至2019年, 经媒体披露的2500 余个教育融资事件中, 与AI相关的事件近 300个,累计融资规 模逾140亿人民币。 新东方与好未来以自 建或投资的方式入局 AI领域,搭建AI研究 院与实验室。天喻信 息等教育信息化厂商 也升级产品,进入智 能化阶段。 04 AI+教育的发展驱动力 12 2020.2 iR
22、esearch Inc. AI+教育行业的竞争力分析 五类玩家各有所长,行业定位逐渐清晰 从技术与业务的角度来看,AI+教育的主要行业玩家可分为具有教育与业务背景的线上与线下教育机构和具有技术与产品 背景的AI技术供应商与互联网巨头,以及综合教育与技术背景的教育信息化厂商,这五类玩家各有所长,对AI+教育的渗 透程度不一,发展阶段各异,其中在线教育机构与AI技术供应商因业务与数据资源积累和技术开发优势,渗透程度较高。 随着各类行业玩家对AI+教育领域的不断探索,未来行业分工将进一步明确,在竞争中走向融合创新。 AI+教育行业四类玩家的竞争力分析 竞争优势竞争劣势 线下教育机构:获客成本低,用户
23、信任成本较低,有利 于注重服务、体验与情感连接的ToC类AI产品落地 在线教育机构:具备大量结构化的教学数据,为AI产品 提供了丰富的训练资源;移动端自带语音与视觉传感器, 数据采集便捷,AI应用场景丰富 AI技术供应商:技术壁垒较高,AI解决方案的通用模块 相对成熟,单一技术的可扩展性较好,算法模型训练经 验丰富 互联网巨头: 用户流量入口,可为AI产品提供云计算能 力与连接器等基础设施服务 线下教育机构:技术力量薄弱,技术投入相对谨慎,数 据储备较少,多依靠外采AI产品与技术来服务存量客户 在线教育机构:获客成本高企,自身造血能力不足,缺 乏持续性技术投入的资金储备。 AI技术供应商:离用
24、户真实的教育场景较远,产品化过 程中缺乏前端交互和教育内容设计等其他重要环节,客 户的实际问题可能难以解决 互联网巨头:缺乏对教育行业的长期理解,互联网短平 快的流量思维较重,对教育行业缺乏足够的耐心 技术 流量 算力 场景 数据 用户 融合 创新 来源:艾瑞咨询研究院自主研究绘制。 教育信息化厂商:进校渠道优势强,业务体系完整覆盖 教学教务各个应用场景,是AI在校内落地的最佳载体 教育信息化厂商:核心技术以外采为主,与场景的适配 打磨都对第三方有较强依赖 13 2020.2 iResearch Inc. AI+教育产业图谱 智 能 云 IT 设 施 通 信 服 务 数 据 服 务 基础服务
25、人工智能技术服务 机器 学习 知识 图谱 机器 视觉 语音 语义 内 容 提 供 师 资 提 供 智能教学解决方案 智能教务管理解决方案 2019年AI+教育产业图谱 AI课堂智慧黑板口语机考智能阅卷 智能教学终端 AI编程套件 智适应教育拍照搜题口语测评虚拟教师教育机器人智能批改 区 域 云 电子 班牌 校园安全 走班 排课 学员服务 渠 道 代 理 客户、用户 营销客服 来源:艾瑞咨询研究院自主研究绘制 14 中国AI+教育行业发展背景:星星之火1 中国AI+教育行业发展现状:探索前进2 中国AI+教育行业企业案例:渐入佳境3 中国AI+教育行业发展趋势:步步为营4 15 2020.2 i
26、Research Inc. AI+教育行业的市场规模 2018-2022年中国AI+教育行业的市场规模 市场规模超400亿,泛AI产品渗透率普遍较低 服务提升需求驱动校外在线产品AI化,效率提升需求驱动校内信息系统AI化,校外AI技术的市场渗透率小于校内。从目前 AI+教育的实际应用来看,AI产品的工具化与功能化属性较重,校外产品商业化价值的驱动因素仍为优质教育资源(师资、 内容),AI在教学上的价值尚未被家长普遍认可,直接付费意愿不强。校内信息系统在政府政策主导下,财政预算驱动着 教育信息化的普及与升级,泛AI产品应用场景丰富,整体渗透率较高。 2517.6 3145.2 3906.2 47
27、78.6 5825.0 21.7 52.2 84.3 139.2 211.1 0.9% 1.7% 2.2% 2.9% 3.6% 20182019e2020e2021e2022e 在线教育市场规模(亿元)泛AI产品的市场规模(亿元) 泛AI产品渗透率(%) 注释:在线教育方面与AI相关的市场规模主要参考课程付费收入;教育信息化方面与AI相关的市场规模在核算中纳入了网络、电力、存储、施工等基础设施产生的收入 来源:艾瑞咨询研究院自主研究绘制。 4072.4 4368.4 4690.8 5024.6 5381.3 287.5 389.8 465.1 565.7 649.6 7.1% 8.9% 9.9
28、% 11.3% 12.1% 20182019e2020e2021e2022e 教育信息化市场规模(亿元)泛AI产品市场规模(亿元) 泛AI产品渗透率(%) 16 2020.2 iResearch Inc. AI+教育的应用:口语测评 朗读与复述能力测评技术成熟,自由表达测评技术仍在发展 从“测” 的角度来看,口语应用场景包括朗读与复述、陈述与表达、演讲与问答,不同场景对应考察学生不同的口语能力, 并且学生表达的主观灵活性逐渐提升。从“评”的角度来看,核心功能是实现自动评分与纠正,即告知学生其在不同口语 能力上的掌握程度,并指明正确的练习和表达方式。其中,朗读题因高度测试有用性(即朗读题有较高的
29、测试效度)及材 料既定性等特点,在学界被广泛研究,目前已有成熟的语音评分与口语训练系统。复述题的标准相对灵活,即学生可以摆 脱范文以进行转述,但这就要求机器能够“听懂”学生的复述的整体内容,而非仅仅是逐词校对,目前复述题模型需要基 于朗读题数据做自适应处理,以提升识别性能。 朗读与复述 语音、语调、节奏准确清晰 表达连贯、内容完整、语言规范、情感恰当 人称转换、时态转换、归纳概括、要点记录 陈述与讨论 观点明确、内容充实、语言 连贯、结构完整。 能够参与讨论,并能针对他 人观点发表意见 演讲与问答 紧扣主题,论证合理、引用 规范、语言丰富 能够针对题目回答相关提问, 且应答切题、语言简洁。 现
30、场朗读 声学特征 提取和补偿 正确发音 音素序列 合理停顿 位置信息 考察重点 考察单词 朗读文本 音素及停 顿位置的 自动切分 标准发 音模型 多维评分 特征提取 标准英 语朗读 数据库 标准音 长模型 现场朗读 数据及专 家评分 机器评分 映射模型 机器评分 复述语音 通用语 言模型 语言模 型裁剪 初次解码,挑 选自适应数据 通用声 学模型 复述范文 说话人自适应 及再次解码 词图生成 多维度评分特 征提取 人工关键 词标注 专家评分 映射模型 机器评分 复述类测评的原理框架 说话人朗 读题数据 朗读类测评的原理框架 来源:艾瑞咨询研究院自主研究绘制。 17 2020.2 iResear
31、ch Inc. 数据 准备 AI+教育的应用:口语测评 以自适应口语学习和配音产品ToC ,以口语考评系统ToB C端方面,口语测评功能主要嵌入自适应口语学习产品和配音产品当中,其中后者的打分系统相对模糊,且“测”的场景 主要为原文朗读,技术实现难度较低。对于自适应口语学习产品,交互场景较为丰富,其中情景对话/看图说话场景已涉 及对具备一定主观灵活性的复述与表达能力的测评。B端方面,在英语教学改革的大背景下,口语纳入中高考考试范围, 由地方教育部门统一采购的英语口语考试评测系统成为各个学校考前突击的重要学习工具,根据行业主流考评系统供应商 的反馈,目前口语考评系统已在大部分地区全面推行,并已经
32、替代了教师的部分评阅工作,但仍需专家参与评阅过程。 口语测评的主要应用场景 数据汇总及校验 评分标准制定和 参考答案加工 数据预处理 人工定标和验证 集列表筛选 评卷系统搭建 定标 运算 效果 论证 试卷 评阅 01020304 最终 论证 样卷和标准卷筛选 人工定标、验证集评 阅和参考答案增补 增补参考答案加工 基础运算及计算机定 标、校标运算和验证 集分数运算 验证集数据 分析报告 专家论证 全集成绩运算 机评成绩导入 人工评卷 成绩校验 全集数据 分析报告 专家论证 05 自适应 口语测评 智能规划 学习路径 智能推送 练习内容 智能推送 学习内容 智能挖掘 学习问题 情景语料 朗读材料
33、 单词储备 真人对话 看图说话 答题竞赛 自适应口语学习流程 口语考试系统测评流程 双人评卷人机互评机评人校全部机评 已经实现 词汇 语法 发音 准确度 完整度 流利度 智能评估 教学效果 来源:艾瑞咨询研究院自主研究绘制。 18 2020.2 iResearch Inc. 2020.2 iResearch Inc. AI+教育的应用:口语测评 语言学习与考试的标配,商业模式成熟,技术渗透率高 口语测评主要涉及语音识别、语音合成与语音评测技术,由于目前测评的能力维度相对单一,基础测评功能的实现不需要 太高的技术门槛,在语言学习产品当中应用广泛,技术渗透率较高,用户覆盖面广。从商业模式上来看,对
34、于C端产品而 言,口语测评内嵌于口语教学与练习产品,并以课程费和会员权益费的形式向用户收取费用,而对于B端产品,除了口语 考评系统外,智慧课堂场景下的口语作业批改环节也会用到口语测评功能,服务商收取API接口调用费或解决方案服务费。 注释:月独立设备数部分反映月活跃用户数,整体口语测评APP渗透率和月活数均较高 来源:Usertracker 多平台网民行为监测数据库。 注释:市场规模仅为AI引擎规模,不含计算机采购、场地改造等 来源:艾瑞咨询研究院自主研究绘制。 610 467 440428 435 435 486470 450435 398 377 938 1011 859 850 820
35、817 892906885 879 881 877 0 200 400 600 800 1000 1200 2019.01 2019.02 2019.03 2019.04 2019.05 2019.06 2019.07 2019.08 2019.09 2019.1 2019.11 2019.12 2019年主要口语测评产品的月独立设备数 英语流利说(万台)英语趣配音(万台) 口语学习APP 收取课程内容费。此类产品将基于用户的测评结果,为用户制定针对性 的学习计划,推送相应的学习内容,并通过微信群和小程序促活,提高 学习的连贯性。可进一步分为应试口语和非应试口语,前者更注重语言 考试的标准和流
36、程,用户关注分数提升与模考评分,后者更注重对话场 景的设计,用户关注应用能力的提升。 口语配音APP 收取会员权益费。配音场景游戏化与社区化属性较重,目前主要通过贴 近英语教学的内容和服务以及多样化的产品功能来实现会员增值服务, 进而加强了教学属性,提升了用户体验。 口语测评产品的核心商业模式 智慧课堂场景: 根据客户对口语测评环境的需求,不同类型的客户适用于不同的技术解决 方案,对应不同的收费方式。整体上,以技术支持为主的服务倾向于收取 接口调用费,调用价格平均为几十元每万次,而以整体口语教学场景落地 的服务倾向于收取方案服务费。 口语考评场景: 口语考评系统主要面向公立学校,其采购费用来自
37、当地财政预算,多以整 体解决方案的服务方式输出口语测评技术,故以收取方案服务费为主。 4.0 6.2 7.8 9.7 12.0 14.1 33.7 51.6 65.0 80.8 99.7 117.7 2017201820192020e2021e2022e 口语考评系统市场规模及当年建设考位数量 市场规模(亿元)当年建设考位数量(万个) 19 2020.2 iResearch Inc. AI+教育的应用:拍照搜题 核心技术为图像识别与内容检索,竞争壁垒在于题库 拍照是信息的输入方式,搜题是用户的具体行为,本质上,搜题行为在PC时代就已经非常普遍,基于各类垂直题库或者更 大的流量入口的搜索(例如G
38、oogle和百度),用户能够检索到相应的结果,内容检索技术的发展已经相当成熟(主要分为 基于关键词匹配和基于分类目录的两种检索方式,搜索引擎的算法多为前者)。随着移动端智能机的爆发,借助智能机的 前置摄像头,用户可随时随地以图片的形式存储题目信息,并利用OCR技术将试题图片识别成可编辑的文本信息,继而用 文本信息进行搜索从而得到试题及答案与解析。目前OCR技术已趋于成熟,手写体识别准确率可达90%以上,印刷体的识 别准确率更高。因此,在技术层面上,各类拍照搜题产品都大同小异,能够构建起竞争壁垒的部分是需要依靠强大的人力 和组织力生产的题库,这是决定产品用户体验的关键因素。 图像 预处理 版面
39、分析 字符 切分 字符特征 提取与匹配 版面 理解 格式化 数据输出 灰度化二值化 降噪处理倾斜校正 直线检验特征匹配 文字区域分段分行 阈值分割 形态学分割 通用检测及变换网络 图文检测网络 图文识别网络文本输出 OCR检测及识别流程 题库搜索流程 自动 分词 索引 匹配 基于字符串匹配 基于理解 基于统计 基于语义 以Lucene为底层架构, 以Elastic Search或 Apache Solr做封装, 本质上是一个具备分 布式多用户能力的全 文搜索引擎。 结果 输出 按照匹配度顺序输出 检索结果,并根据用 户的历史检索信息进 行自适应处理。 索引 分析处理 索引 数据库 文本 分析处
40、理 数据收集 手动输入数据 数据库数据 网页数据 文件系统 用户 进行检索 搭 建 索 引 数 据 库 来源:艾瑞咨询研究院自主研究绘制。 拍照搜题产品的技术流程 20 2020.2 iResearch Inc. AI+教育的应用:拍照搜题 从作业工具引流到教学内容增值再到课程服务变现 拍照搜题的战争已经结束,CR2超过80%。最初,产品依靠拍搜功能引流,并基于作业场景下的其他需求,提供背单词、 作文库与同步练习的功能,实现工具时代的流量原始积累。随后,各类玩家基于用户需求衍生出了不少增值服务,从1对1 答疑到VIP视频知识点讲解再到直播课程,一边夯实题库,一边自建教研教学体系,逐渐从工具产品
41、向内容产品转型。最 后,产品加大对教学环节的渗透,通过“主讲教师+辅导教师”的双师授课模式,全面提升教学服务质量。 工具 OCR与题库检索 内容 深度学习与数据挖掘 服务 表情识别与学情分析 拍 照 搜 题 引 流 单词查询 作文范文 同步题库 古文词典 语音答疑 视频讲解 知识点讲解 真题套卷 流量思维-广告增值思维-会员 名师直播课 1对1辅导 学习规划 学习评测 变现思维-课程 拍 照 搜 题 衍 生 拍 照 搜 题 导 流 拍照搜题产品的商业模式迭代 产品定位迭代 产品定位迭代 盈利模式迭代盈利模式迭代 来源:艾瑞咨询研究院自主研究绘制。 21 2020.2 iResearch Inc
42、. AI+教育的应用:拍照搜题 大面积覆盖K12,正在向家长批改场景和考试类领域拓展 拍照搜题产品主要渗透高学龄段(四五六年级)的小学生、大部分初中生和大部分高中生,其中小学渗透率超过40%,初 高中渗透率超过90%,未来K12学段渗透率的提升主要在低学龄段(一二三年级),该学龄段的核心用户群是家长,比较 常见的应用场景是家长对学生口算作业的批改,拍照搜题产品可以实现实时计算功能,提高家长批改的效率,未来还将针 对家长批改的场景,逐步开发基于主观题与应用题的批改功能,其技术原理与拍照搜题一致。另一方面,从题库生产的逻 辑上来看,考试类教育领域的题库资源丰富,用户对搜题也需求不少,但目前仍以手动
43、输入的方式进行检索。 01 02 家长作业批改场景下,拍照 搜题技术辅助家长解决口算、 应用题、主观问答题的批改, 针对性解决家长不会教的难 题,同时也增强了亲子之间 的互动。 考试领域主要包括考研、 公考、职业资格考试,用 户刷题场景相对高频,拍 照搜题产品尚未渗透。 低龄段渗透 高龄段渗透 拍照搜题产品的用户渗透方向 来源:艾瑞咨询研究院自主研究绘制。 40% 90% 90% 小学初中高中 2019年拍照搜题应用在K12各学段的渗透率 小学初中高中 22 2020.2 iResearch Inc. AI+教育的应用:人工智能自适应学习 以AI技术实现可规模化的、基于教育大数据的个性化学习
44、自适应学习并非一个新概念,在教育语境下,任何考虑并满足学习者个人需求的教学形式都可以被称作是“自适应的”, AI+教育的语境下,“智适应”学习则是借助人工智能自适应技术的学习系统,该系统为学习者创设一种符合其多样化学 习需求的学习环境,推荐给学习者个性化的学习内容、独特的学习路径、有效的学习策略,满足学习者的个性化需求。本 质上,人工智能自适应是一种基于教育大数据的可规模化的个性化学习,其基本原理可以表述为“基于大数据挖掘与分析 得到待训练样本用数据去训练基于人工智能算法构建的模型基于模型对各类自适应学习环节进行预测/推荐”,输出 的核心要素包括学习材料,用来测评学生是否掌握学习材料的标准和学
45、习材料的推送顺序。 人工智能自适应学习 知识水平 错误模型 元认知能力 认知特征 情感特征 计算机科学数据科学机器学习认知科学教育测量学学习心理学 训练模型 学生 大数据 获取训练样本 学科 模型 教学方法 模型 学生 模型 知识空间理论信息论技术逻辑斯蒂回归遗传算法贝叶斯网络 分类树教育数据挖掘模糊逻辑学习分析图论 用于构建理想情况下 学生要掌握的内容 用于深度模拟优秀教 师的教学过程及策略 模型的核心组成部分, 用于了解学生在认知、 情感方面的个性特征 转化并输出要素 输出学习材 料,推送给 学生 自适应内容 Content 对学习材料 掌握情况的 测评与反馈 自适应测评 Assesment 学习材料背 后知识点的 组织顺序 自适应序列 Sequence 分析学生正答率、用时、对学习 目标的熟悉程度、学习相似内容 的表现、自信度等多维数据 人工智能自适应学习系统的基本原理 贝叶斯知识跟踪理论 项目反应理论概率图模型深度学习神经网络 自适应学 习所采用 的AI技术 来源:艾瑞咨询研究院自主研究绘制。 23 2020.2 iResearch Inc