2022年5G行业之新通话技术与业务创新研究报告.docx

上传人:X** 文档编号:53550254 上传时间:2022-10-26 格式:DOCX 页数:31 大小:828.28KB
返回 下载 相关 举报
2022年5G行业之新通话技术与业务创新研究报告.docx_第1页
第1页 / 共31页
2022年5G行业之新通话技术与业务创新研究报告.docx_第2页
第2页 / 共31页
点击查看更多>>
资源描述

《2022年5G行业之新通话技术与业务创新研究报告.docx》由会员分享,可在线阅读,更多相关《2022年5G行业之新通话技术与业务创新研究报告.docx(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2022年5G行业之新通话技术与业务创新研究报告一、5G创造话音新价值,从 VoLTE 到 5G 新通话(一)用户需求不断升级,通话业务亟需革新回顾实时通信业务发展的历程,移动通信以用户体验为中心持续 升级和演进,促使通信业务向着商业价值高、市场空间广的方向革新, 并不断激发公众用户市场和行业用户市场活力。语音通话业务作为运 营商最具生命力的基础性业务,满足着全球 70 亿人与人之间的沟通 需求,极大的降低了社会总成本。围绕语音业务前中后的能力提升, 一直是运营商不断创新的土壤,音视频彩铃、通话助手、短信提示等 丰富的增值服务,持续为基础业务提供创新发展空间,丰富了用户通 话体验。随着“互联网

2、+”产业转型升级热潮席卷而来,互联网行业发展速 度迅速超过通信行业发展速度,借助互联网思维方式开展通信能力创 新成为行业共识。在传统电信发展模式向互联网思维方式学习的过程 之中,短消息业务与互联网思维催生出了 5G 消息这种新型电信业务,为多年以公众所习惯的消息服务注入了新的发展动力,为运营企业与 相关产业链企业提供了巨大的想象空间。相对应的,原生的通话形态和业务能力二十余年一直未能有显著 变化,通话创新一直围绕业务质量与应用模式创新展开,通话基础功 能创新有所欠缺,公众和企业用户对语音通话业务能力的需求不能在 通信网内得以实现,促使用户使用互联网与电信网融合的通信工具。 但是,融合通信工具降

3、低了电信业务的高安全、广触达能力,公众和 企业用户对通话能力有着更高的需求。伴随着 5G 时代的到来,打造 通道更安全、能力更全面的通话工具,为广大手机用户带来全新的业 务体验,为相关产业开拓宝贵发展空间的创新发展机遇已经成熟。(二)5G 引领创新,为新实时通信业务打造升级空间据工信部数据统计,截至目前,我国已建成了全球规模最大、技 术最先进的 5G SA 网络,全国所有地市一级、所有县城城区以及 92% 的乡镇镇区已实现 5G 网络覆盖。良好的网络覆盖、高速可靠的服务 质量,为 5G 时代业务创新提供了稳固的基础设施。随着 5G 用户终 端的不断普及和公众使用通信互联网融合业务习惯的形成,更

4、高效、 更快捷、更具互动性的通信创新发展障碍,已基本清除,开展业务能 力创新正逢其时。为了满足用户对安全和覆盖的迫切需求,新通话业务仍需充分发 挥运营商优势,在安全能力、沟通范围上继承传统实时音视频通信的 内涵,在用户体验、能力提升上借鉴互联网应用的经验,在应用场景、 服务品质上开拓实时音视频通信的外延,为行业客户打造可靠、开放、普惠的新通话业务。首先,语音通话业务作为运营商的基础通信业务具备电信级 99.999%的业务可靠性和安全保障机制。借助运营商网络的全覆盖和 用户全覆盖,新通话业务将使能企业服务到达“最后一公里”,100% 触达用户,致力于成为消除二元结构社会数字鸿沟的普适性通信基础

5、设施。其次,新通话业务将摒弃互联网企业私域流量限制和歧视,构 建真正开放、公正的流量平台,任何体系的企业和商家都能够以通话 平台为流量入口提供服务。在用户体验层面,新通话业务将突破听觉和视觉一维、二维的限 制,致力于通过通话入口融合 AR/VR、全息等 5G 应用,远期将增加 触觉等交互式和三维沉浸式的新体验。在沟通范围层面,面向数字化 转型和万物智联时代,新通话业务将打破人与人之间的连接限制,延 伸到更为广阔的人与物、物与物之间的沟通。在业务层面,5G 新通 话业务将以 ToB 端作为突破口,瞄准的市场从个人市场发展为个人 与企业市场并重,依托价值创造促进商业模式的创新,为垂直行业挖 掘更大

6、的市场和商业潜能。(三)探索话音新价值,赋能数字新经济新通话是运营商对基础通信能力的重新赋能,通过在当前通话通 道的基础上叠加数据通道来增强现有通话的业务体验,挖掘通话业务 新的服务模式和应用价值,建立一个更加全面、智能的通话提供方案。 与传统的音视频通话相比,5G 新通话在产品设计、用户体验、服务 模式方面进行了全面升级。在产品设计上,5G 新通话基于手机码号,(三)探索话音新价值,赋能数字新经济 新通话是运营商对基础通信能力的重新赋能,通过在当前通话通 道的基础上叠加数据通道来增强现有通话的业务体验,挖掘通话业务 新的服务模式和应用价值,建立一个更加全面、智能的通话提供方案。 与传统的音视

7、频通话相比,5G 新通话在产品设计、用户体验、服务 模式方面进行了全面升级。在产品设计上,5G 新通话基于手机码号,5G 新通话作为面向公众用户和行业用户的 5G 特色应用,将围 绕“科技向善”的目标,为全球数十亿用户带来平等享受 5G 技术和 数字服务的红利。让用户充分享受智能化服务带来的便利的同时,也 为行业数字化转型带来新模式,为数字经济发展注入新动能,赋能“安 全、普惠”数字新经济。对于普通消费者而言,5G 新通话业务支持原生应用的音视频、 定位、文件等多媒体信息交互,开启全新的沟通乐趣,不断拉近人与 人之间的距离,使用户能够切实感受到 5G 的独特价值。同时,消费 者无需下载 APP

8、 也可享受企业服务、获得富媒体体验,满足当下人 们对应用轻量化的需求。对于垂直行业而言,当前社交网络、电子商店和娱乐等领域的主 流 APP应用已经占据了用户的手机和入口,形成了一定程度的垄断, 大幅提高了行业门槛及获客成本。然而 5G 新通话将为垂直行业开拓 全新机遇,提供一个开放、安全的新渠道以更加便捷地开展自身业务,成为用户认可的高流量服务入口。无需用户关注、订阅或下载,企业 便可根据手机号码对用户主动触达、提供在线服务场景、提高产业效 率及快速的商业闭环,完成业务的数字化升级。业务能力和用户体验的升级对实时音视频网络的能力提出了全 新的要求。端到端 QoS 策略控制需要针对不同数据业务定

9、制差异化 方案;同时,由于增加了新的接入方式和数据交互,则需要针对整个 通信流程提供包括接入安全、传输安全、信令安全在内的端到端安全 机制。值得一提的是,对于带宽、时延、可靠性、服务质量等能力的 升级只有基于能够提供确定性体验保障的载体才能实现,因而相对于 尽力而为的互联网应用服务(Over The Top, OTT),运营商可充分发 挥基础通信业务安全可达和互联互通优势,重塑自身生态价值链,为 行业客户和相关产业创造新的战略价值和业务增长点,构筑产业互惠、 多方共赢的 5G 时代通话新生态。二、5G 新通话技术方案(一)5G 新通话网络架构5G 新通话的网络架构,基于现有 IMS 架构进行升

10、级,旨在支撑 交互式多媒体业务的规模发展、支持行业/企业高效快捷安全地接入 IMS 网络、并实现 IMS 网络架构向服务化演进。应遵循如下原则: (1)兼容现有的 IMS 架构,基于 IMS 架构进行升级演进; (2)具备可扩展性,面向新技术的演进,可以方便地引入 AR、 AI 等新技术和功能。5G 新通话网络架构在 3GPP TS26.114 定义的 IMS 网络架构的基础上进行增强,引入了如下新网元功能,并通过服务化 接口(Service Based Interface,SBI)对外提供服务。 (1)新通话平台(New Calling Platform,简称 NCP),提供数据 通道、实时

11、音视频、实时 AI、第三方认证等控制能力,并面向北向 应用提供开放接口; (2)数据通道应用仓库(Data Channel Application Repository, 简称 DCAR),存储数据通道应用; (3)企业数据服务器(Enterprise Data Server,简称 EDS),用 于支持企业及其企业所属员工的实名认证及数据缓存; (4)统一媒体功能(Unified Media Function,简称 UMF),将媒体面功能归一并统一采用服务化接口,既支持传统的音视频媒体处理 功能,也具有灵活的可扩展性,能够支持未来新的媒体处理功能,例 如沉浸式场景下的 AR 模型处理和媒体渲染

12、功能。除了新引入的网元功能,IMS 网络现有的网元也需要升级,以支 持数据通道、第三方 ID 接入等新功能,实现 5G 新通话的各种新业 务。(二)5G 新通话的网元和接口5G 新通话对 IMS 网络现有网元和新引入网元的要求如下:1. 对传统网元的要求(1)MMTel AS: 提供媒体事件订阅/通知服务和 IMS 媒体控制服务; 提供数据通道资源的生命周期管理服务,包括 Bootstrap 数据 通道和 Application 数据通道的创建和释放; 支持 3GPP TS 26.114 规定的携带终端 IMS 数据信道能力的第 三方注册,并记录终端数据通道能力; 支持根据 NCP 的请求进行

13、音视频及数据通道的媒体协商; 支持第三方 ID 的第三方注册、用户签约数据获取。(2)其他 AS: 支持转发 SDP 中的数据通道媒体描述; 主动发起媒体变更时,支持对数据通道媒体描述的处理(遵 守 RFC 3264 的规范要求)。(3)I/S-CSCF:支持 3GPP TS 26.114 规定的终端 IMS 数据通道能力注册,并 在响应中返回网络侧的数据通道能力; 支持转发 SDP 中的数据通道媒体描述; 支持第三方 ID 的注册和鉴权认证。(4)P-CSCF/IM-AGW:支持 IMS Core 和 PS Core 之间的数据通道 QoS 处理;信令面:支持转发 SDP 中的数据通道媒体描

14、述;媒体面:支持转发数据通道中传输的数据;支持企业应用/企业 PBX 以第三方 ID 接入时的证书认证。(5)IBCF/TrGW:信令面:支持转发 SDP 中的数据通道媒体描述。支持企业应 用/企业 PBX 以第三方 ID 或以中继接入时的证书认证;媒体面:支持转发数据通道中传输的数据。 (6)PCRF/PCF:支持 IMS Core 和 PS Core 之间的数据通道 QoS 处理。2. 对新增网元的要求(1)NCP: 支持 Bootstrap 数据通道的数据处理(H5 应用发现/下载); 支持 Application 数据通道的数据处理,提供 A2P 业务功能; 支持控制 MMTel AS

15、 完成呼叫流程处理,包括但不限于交互 式相关的 DC 业务流程、音视频业务流程、AR 业务流程;支持提供北向业务能力接口,提供业务能力给第三方/OTT 行 业应用。(2)DCAR: 支持 H5 应用程序资源存储/下载。(3)EDS: 支持第三方ID的token验证、用户信息获取和企业证书管理; 支持与企业服务器对接、运营商与企业的安全联盟建立。(4)UMF: 数据通道中的数据传输、处理; 传统音视频媒体处理; 视频合成、AR 渲染等增强媒体功能处理。(三)5G 新通话关键技术1. VoNR 技术语音业务作为满足用户沟通需求的电信基本业务,是 5G 不可或 缺的一部分。正如 VoLTE(Voic

16、e over LTE)是 4G 网络的主流话音解 决方案,VoNR(Voice over NR)是 5G 网络的主流话音解决方案。VoNR 是指直接由 5G 网络端到端承载语音业务。5G 网络提供了 更高的带宽、更多的连接数及更低的时延,使得 VoNR 通话不仅可以 提供高清音频、高清视频通话,还可以让通话双方进行实时交互,在 大幅提升用户体验的同时,在 ToB 场景下还可以实现更多的功能。5GC 基于云原生设计,控制面采用了服务化架构(Service Based Architecture, SBA)。SBA=NF(网络功能)服务+SBI(服务化接口), NF 通过 SBI 由模块化的微服务组

17、成,可灵活扩展、重用,从而可弹 性高效、灵活敏捷的通过网络切片等技术使能千行百业的多样化应用, 完整支持 eMBB、uRLLC 和 mMTC 三大场景,赋能各行各业数字化 转型。也正因如此,打通 VoNR 的关键在于 5GC 能力,以及 5GC 与 IMS 网络的融合能力。随着 5G 网络的逐步普及,5G 新通话解决方案将逐步从 VoLTE 向着 VoNR 路线演进。基于目前成熟的 IMS 技术和 IMS 网络,运营 商能为用户提供丰富的多媒体通信业务。然而,5G 网络带来的高带 宽、低时延新业务对 IMS 网络的性能和容量都提出了更高要求,传 统架构的 IMS 已无法满足,需要进行简化和重构

18、。目前 3GPP 对 IMS 向SBA架构演进的研究已经在展开,在R17完成了IMS网络Diameter 接口服务化的标准制定,并在 R18 进行 IMS 媒体面接口服务化的研 究。面向未来业务发展,IMS 网络将持续向着架构革新、灵活部署、 多场景适配等方向演进,并通过能力开放,深度介入到第三方业务, 开拓新的行业市场应用,为用户带来更加丰富的业务体验。2. 交互式数据通道为了实现 5G 时代通话场景的业务创新,5G 新通话在 IMS 网络 原有的音频、视频通道外新引入了数据通道(Data Channel,DC), 实现通话前、通话中及通话后的文本、图片、视频等多媒体信息的传 递,打造可视化

19、、可交互、沉浸式的全新通话体验。实时交互式通话 应用对网络带宽、时延、可靠性及服务质量具有很高的要求,需要确 定性保障承载的支持。3GPP 制定的 IMS Data Channel 标准,借鉴 WebRTC Data Channel 技术,可灵活支持可靠传输模式、部分可靠传输模式及不可靠传输模 式等多种数据通道,兼顾各种应用对底层通道的多样化诉求。同时, IMS 数据通道不关注通道中传递的内容及其格式,仅需要通信双方对 通信格式达成一致,通过 Web 页面+JavaScript 脚本的互联网成熟技 术在数据通道中传递多样化的应用内容,支撑 5G 新通话业务的快速 创新、快速部署、快速上线。IM

20、S 数据通道的建立基于 IMS 信令模型,在会话初始协议 (Session Initiation Protocol,SIP)信令中增加了对数据通道能力的指 示,并在会话描述协议(Session Description Protocol,SDP)中引入 了数据通道相关的媒体描述。如图 5 所示,信令流的第一部分即在5G 网络建立 IMS 基本语音会话,其中 SIP 信令中额外包含“数据通 道”媒体特征标签,以通知网络和终结设备:始发设备支持建立 IMS 数据通道。信令流的第二部分显示了当一方希望建立 IMS 数据通道 时,通过在 SDP 中添加数据通道媒体描述重新生成会话 INVITE 请 求,

21、网络和终结设备的响应方式与初始 INVITE 请求相同。数据通道的工作流程:首先,运营商授权的第三方应用提供商会创建数据通道应用(Data Channel Application),并上传至 网络,存储在数据通道应用仓库(Data Channel Application Repository, DCAR)中。当 DCMTSI(支持 Data Channel 的 IMS 多媒体电话服务) 终端在通话过程中触发该应用时,网络从 DCAR 中取出该应用,并 通过 Bootstrap 数据通道发送给通信双方 UE A 和 UE B。与该应用相 关的业务数据均通过UE A和UE B之间的Applicat

22、ion数据信道传输。为了支持数据通道应用,终端需要升级改造。首先,终端应支持 3GPP TS 26.114 规范定义的 DCMTSI 客户端能力,通过升级音视频 通信协议栈来支持 IMS 数据通道的建立和协商,通过内置的原生系 统服务实现对数据通道的连接和管理,并支持通过 Web 引擎实时处 理数据通道的业务数据并实时呈现在用户 UI,减少了对终端的定制 诉求。同时,终端应支持将 IMS 数据通道向应用层开放调用接口, 使能 IMS 数据通道作为新的行业应用入口,壮大基于运营商音视频 的行业应用生态。此外,终端应支持根据交互式业务的可靠性要求, 协商业务带宽、时延及丢包率等 QoS 指标。3.

23、 统一媒体面IMS 网络媒体面的传统功能主要包括音频转发、音频转码、视频 转发、视频播放、音频播放、音频录制、音频会议、媒体加解密等媒 体处理能力。这些媒体处理能力部署在多个不同媒体功能网元时存在 高耦合,而且采用的协议 H.248 在多媒体会话提供能力和业务扩展能 力方面比较弱,阻碍了未来新的多媒体业务的推广甚至规模发展。随着交互式通信需求的增多,IMS 媒体面的功能也要具有灵活性 和可扩展性,以应对未来多媒体业务发展提出的多样化媒体能力要求。 首先,IMS 媒体面需要支持音视频媒体处理能力及对外接口的灵 活扩展。例如,为聋哑人等特殊群体提供的辅助通话应用,初期可以 通过提供语音识别(Aut

24、omatic Speech Recognition,ASR)/语音合成 (Text To Speech,TTS)能力进行语音和文字的互转,辅助特殊人群完成语音通话;后期更进一步借助 AI 能力进行语音和手语动作的互 转,直接通过视频呈现,使特殊人群可以进行沟通交流。 其次,媒体面需要支持沉浸式场景下的模型处理和媒体渲染,以 便在实时通话过程中引入 AR 体验。为了支持上述应用,通过引入统一媒体功能(Unified Media Function,UMF),尽可能地融合传统的媒体网元功能,形成统一的 媒体面架构,充分利用媒体资源,减少路径迂回;同时支持数据通道、 AR 模型处理和媒体渲染、ASR/

25、TTS 等新的媒体处理能力,并对外通 过服务化接口提供可扩展的多媒体处理接口,支撑多媒体业务的快速 构建。作为统一的媒体功能网元,UMF 提供服务化接口 Numf,继承了传统的 IMS-AGW、TrGW 的接入和互通功能,以及媒 体资源功能(Multimedia Resource Function, MRF)的放音、收号等媒 体处理功能,并实现了数据通道、ASR/TTS、AR 媒体处理等新的媒 体处理功能。该技术有如下特点:(1)媒体处理从集中式演进为分布式、服务化; (2)媒体处理就近完成,减少不必要的媒体迂回与 E2E 媒体 O/A 重协商; (3)媒体处理能力可由运营商定义及扩展,现网的

26、媒体处理网 元可以逐步演进为软件定义的实时分布式媒体网络; (4)通过网络存储功能(Network Repository Function,NRF) 负责所有媒体处理服务的自动化管理,包括注册、发现、状态检测等。 媒体控制网元,如 AS、P-CSCF 等,使用某个媒体能力时,需要到 NRF 查询获取特定的 NF 实例。4. 音视频编解码增强技术(1)实时语音编解码技术从 2G、3G、4G 到现在的 5G 时代,为了增强实时语音通信的清 晰度,语音编码技术从自适应多速率(Adaptive Multi-Rate,AMR)、 自适应多速率宽带(Adaptive Multi-Rate - Wideba

27、nd,AMR-WB)演 进到增强语音服务编码(Enhanced Voice Service,EVS)。EVS 增强语音服务是继 AMR-WB 高清语音编码技术后对语音编 码技术的又一次改进,提高了编码的灵活性和效率。它面向 LTE 开 发和优化,主要应用于 VoLTE 高清语音。EVS 频率范围已经扩展到 1417KHz,逼近人耳可感知的 20KHz 极限,声音清晰度已接近自然 声。但由于当前的语音服务通常仅限于单声道音频的传输与回放,导 致声音空间方向维度数据丢失,这使得在通话中很难区分多个说话者, 并在与视频结合时导致说话者定位出现差异,导致经常产生听众疲劳。为此 3GPP 启动了新的项目

28、 IVAS_Codec,研究对 EVS 编码的扩展, 用于沉浸式语音及音频服务(Immersive Voice and Audio Service, IVAS),旨在提供实现身临其境的逼真空间声学体验。IVAS 是基于 EVS 的下一代通信编解码器,支持真正沉浸格式的 立体编码和渲染,例如音频对象、Ambisonics 和多声道音频。它可以 处理不同对话场景下各种麦克风配置捕获的信号,更轻松地在视频通 话和其他虚拟会议期间跟踪多个参与者的对话,并区分人声与背景声, 具有更好的用户体验和更好的抗丢包能力。随着沉浸式体验变得越来 越普遍,通信行业同样面临着用户对于逼真体验的需求。IVAS 除了 能

29、够满足用户日益增长的对实时多媒体业务的需求外,也将为实时语 音会话、电话会议、AR 通话等应用场景打造栩栩如生的沟通体验。(2)实时视频编解码技术4G 时代,基于 IMS 网络的 ViLTE(Video over LTE)将视频通话 变为现实;而随着 5G 网络的规模部署,视频通话真正成为运营商的 基本业务。用户对通话体验的要求不断提高,也推动着视频编解码技 术朝着高清、低时延、低码率方向不断演进发展。ITU-T/ISO-IEC 联合推出的 H.264/AVC(Advanced Video Coding), 是当前通信网络广泛使用的视频编解码国际标准。这是一种面向块、 基于运动补偿的视频编码标

30、准,它相比以前的编码标准,引入了多参 考帧的运动补偿、可变分块运动补偿、帧内预测编码等新特性。利用 这些新特性,H.264/AVC 实现了比其他编码标准更高的视频质量和更 低的码率。在同等图像质量的条件下,H.264/AVC的压缩比是MPEG-2的 2 倍以上,是 MPEG-4 的 1.52 倍。H.264/AVC 还提供了解决不 稳定网络环境下丢包问题的必要工具;并具有很强的网络适应性,能 够在互联网、各种制式的无线网络(如 CDMA、GPRS、WCDMA、 CDMA2000 等)上传输。随着视频业务的发展,视频分辨率和帧率的不断提升给网络带宽 和存储带来巨大挑战,H.264/AVC 编解码

31、技术已不能满足超高清视频 时代的需求。于是在 2013 年,ITU-T/ISO-IEC 基于 H.264/AVC,联 合推出了新的视频编解码国际标准 H.265/HEVC(High Efficiency Video Coding)。H.265/HEVC 的目标是在有限带宽下传输更高质量的 网络视频,仅需 H.264 的一半带宽即可播放相同质量的视频。相比 H.264/AVC,H.265/HEVC 在提高压缩效率、提高鲁棒性和错误恢复 能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复 杂度等方面进入深入研究,提供了更多不同的工具来降低码率,极大 推动了 4K 超高清视频的普及。202

32、0 年 ITU-T/ISO-IEC 又联合推出了 H.266/VVC(Versatile Video Coding)视频编解码国际标准。它的视频压缩方式与 H.265/HEVC 相 似,但是在分区、预测和熵编码等方面都有所改进。与 H.265/HEVC 相比,H.266/VVC 进一步优化了压缩性能,在保证视频清晰度不变的 情况下,H.266/VCC 存储体积减小一半、宽带流量节省一半,画质更 细腻;它对 8K 超高清、屏幕、高动态和 360 度全景视频等新的视频 类型,以及自适应带宽和分辨率的流媒体和实时通信等应用有了更好 的支持。(3)媒体自适应调整大屏智能终端的普及、网络资源的广覆盖以及

33、 AR 技术的融入, 不断驱动视频通话业务量的持续增长,同时衍生出视频客服等 5G 新 通话业务创新场景。普通视频通话,根据分辨率的不同,流量消耗存 在差异,一分钟大约产生 750KB12MB 流量。然而融入 AR 技术的 视频电话(AR 通话),流量需求将会变得更大,并且与单眼分辨率、 视场角和帧率有强关联。面对当前的无线资源部署特点,针对网络资 源的动态变化,3GPP TS 26.114 中定义了多种自适应机制:比特率、 数据包速率以及容错自适应机制,以减少上行资源紧张对视频通话和 AR 通话的影响,优化视频质量。为了对抗无线网络的各种弱网环境, 各种视频超码率、超分辨率和超帧率技术也在终

34、端和网络侧得到了应 用。5. 第三方 ID 接入技术在行业数字化转型的浪潮下,企业迫切希望能够以简单、便捷、 安全的方式接入运营商网络,使得企业员工可以在生产环境使用自己 的员工账号,即第三方 ID,接入 IMS 网络发起呼叫并开展业务。 第三方 ID 接入技术使得 5G 新通话面向 ToB 行业拓展成为可能。 它包括如下关键技术:(1)企业与 IMS 网络双向认证:企业与 IMS 网络利用各自的 CA 证书和服务器证书,借助一系列安全协议如 TLS、OAuth 2.0 等实 现双向认证; (2)企业对企业员工认证:企业员工使用其员工账号接入 IMS网络前,首先与企业认证服务器交互完成身份认证

35、并获取用户 token, 该 token 将进一步用作企业员工被 IMS 网络认证的依据;(3)企业员工接入 IMS 网络:包括两种接入方式,一种是 SIP 终端接入,员工使用员工账号登录 SIP 终端发起注册/呼叫;另一种 是 SIP 中继接入,员工使用员工账号登录企业网关,企业网关代理企 业员工发起 SIP 注册/呼叫流程。两种接入方式均需携带从企业认证 服务器获取的用户token并传递给IMS网络用于认证企业员工并获取 其身份信息;(4)企业员工信息获取:企业员工信息的所有权归属企业,IMS 网络不发放企业员工数据,而是按需动态获取并缓存企业员工信息, 以保护企业数据隐私; (5)企业员

36、工信息的跨网传递:企业外呼场景中作为主叫的企 业员工的身份信息可能跨不同运营商网络传递并最终在被叫终端上 呈现,为避免主叫身份信息被篡改,需要在主叫网络对主叫身份信息 进行签名和在被叫网络对主叫的签名进行验证。6. AR 实时通信技术AR 广泛运用了多媒体、三维建模、实时跟踪及注册、智能交互、 传感等多种技术手段,将计算机生成的文字、图像、三维模型、音视 频等虚拟信息模拟仿真后,应用到真实世界中,使用户获得超越现实 的感官体验。 为了支持传统音视频通话到 AR 实时通话的全新升级,CCSA TC3 WG1下一代实时通信网络技术研究中提出,IMS 网络需要引入如下逻辑功能。(1)AR 设备端侧(

37、AR Client)支持数据采集、视觉引擎分析、 低时延编码、轻量级图像渲染、以及从云端获取虚拟对象等; (2)AR 媒体功能(AR-M)支持对真实环境进行三维构建、对 象识别跟踪定位、对虚景的渲染以及虚拟对象与真实对象的融合; (3)AR 控制功能(AR-C)支持参与 AR 会话的端侧设备,以 及端与 AR 应用提供者建立会话关联和控制; (4)AR 应用提供者(Application Provider)提供一系列的虚拟 对象或现实背景用于AR用户在端侧操作或作为媒体处理的一部分输 入;在 IMS 架构引入 AR 会话管理和媒体处理的能力,实现 AR 实时 通话业务。其中,UMF 集成 AR

38、-M,与终端一起负责 AR 的媒体处理;AS (Application Server,应用服务器)集成 AR-C,用于 AR 会话管理; UCP 存储 AR 通话应用,用于端侧根据需求建立数据通道并下载 AR 通话应用;UE 按需请求并下载 AR 通话应用。 终端采集的数据即 AR-specific data,基于终端的实际处理能力, 可以借助终端与网络之间建立的数据通道传递到网络侧,由网络侧的 媒体网元 UMF 进行预渲染处理,然后再转发该媒体流给相应的接收 端,接收端根据本地最新传感器采集数据做最终的媒体渲染。 AR 媒体处理由 AR 端与 IMS 媒体网元 UMF 共同完成,所有的 会话

39、处理和语音媒体都需要经过 IMS 网络。用户可根据需要实现 2D 视频电话与 AR 通话间的升级或回落。7. 基于 AI 的语音交互技术关注“数字弱势群体”,消除“数字鸿沟”,实现“数字包容”,服务各个社会群体,是通信网络的社会责任,也是 5G 新通话的发力 方向。将基于 AI 的语音交互技术,包括 ASR、TTS 等技术,应用到 VoNR 通话过程中实现语音与其他媒体类型的实时转换,可以为残障 人士、老年人等“数字弱势群体”提供便捷、温暖的通信服务,也可 以有效解决不同母语的人群无法直接通话的问题。为了实现这些 5G 新通话业务,需要引入 ASR/TTS 功能节点, CCSA TC3 WG1

40、下一代实时通信网络技术研究中提出具体实现上 的两种方案:一种是 IMS 网络自建 ASR/TTS 功能节点,提供 ASR/TTS 处理能力;另一种是 IMS 网络与语音交互服务提供商对接,调用其 提供的 ASR/TTS 服务。图 11 展示了这两种不同的实现方案。在方案一中,IMS 网络中的 UMF 集成了 ASR/TTS-M、DCS-M 等媒体处理功能,IMS AS 集成 ASR/TTS 业务触发逻辑。UE 与 UMF 建立语音、视频通道,用于传递语音、视频媒体,并建立数据通道, 用于传递文本和(或)UE 的 UI 指令。当 IMS AS 识别需要语音转文 本时,调用 UMF 中的 ASR/

41、TTS-M 服务将其从发送方 UE 接收的语 音媒体流转换文本,再通过数据通道发给接收方 UE;当 IMS AS 识别需要文本转语音时,调用 UMF 中的 ASR/TTS-M 服务将其通过数 据通道从发送方 UE 接收的文本转换为语音并进行混音处理后,再通 过语音通道发给接收方 UE。在方案二中,IMS 网络与第三方提供的 ASR/TTS 服务对接。IMS AS 事先预置第三方 ASR/TTS 服务的地址,在业务触发时,IMS AS 利用现有接口将第三方 ASR/TTS 服务的地址通知给 UMF。当 IMS AS 识别需要语音转文本时,UMF 从发送方 UE 接收语音媒体流后复制 给第三方 A

42、SR/TTS 服务;第三方 ASR/TTS 服务收到语音包后将其转 换成文本,再返回给 UMF;UMF 整合分片包并借助数据通道发给接 收方 UE。当 IMS AS 识别需要文本转语音,UMF 将其通过数据通道 从发送方 UE 接收的文本发送给第三方 ASR/TTS 服务;第三方 ASR/TTS 服务收到文本包后转换为语音再返回给 UMF;UMF 整合语 音包并进行混音处理后发给接收方 UE。方案一的优势是,终端产生的媒体流是在 IMS 网络内完成媒体 类型转换,可以有效保证媒体流的安全,同时转换时延也相对较低; 方案二中,ASR/TTS 功能扩展和升级对 IMS 网络的影响较小,具有 维护成

43、本低、扩展性好的优势。三、5G 新通话业务创新场景探索(一)ToC 场景探索到目前为止,中国已建成了全球规模最大、用户最多、质量最高 的 5G 网络,运营商、终端厂商、互联网公司 5G 大规模适配进展飞 速,面向个人消费者的应用数量、体验质量、创新幅度也已完成了显著升级,5G ToC 的规模效应已经达到全新水准。5G ToC 通信的基础逻辑是沟通更便捷、体验更丰富、娱乐更极 致。显然,随着移动终端智能化和大屏化,用户实时通信的诉求早已 不再局限于通话双方声音和影像的交流。触、摸、拖、拽等操作的互 动,针对同一事务共同协作,这些更加复杂交互需求逐渐涌现出来, 成为网络代际业务创新的发展动力。移动

44、产业具有极高的创新惯性和 机遇捕捉能力,当下 5G 网络快速发展,其大带宽、低时延等特性赋 予了 ToC 实时通信业务新的生命与活力,能更加丰富的应用场景。1. 屏幕共享+远程协作在亲朋好友、合作伙伴等多种沟通场景中,通话中主被叫双方可 以互相共享屏幕,基于桌面同屏高效沟通,可广泛应用于亲子教育辅 导、操作指引、“同屏”观看直播视频、同步云购物等场景。 说明:通话中如果只有一方的终端支持“新通话”功能,另一方为 普通终端(不支持“新通话”功能),在“新通话用户”侧,同样可 以向普通用户发起屏幕共享、发起摄像头共享、在共享的内容上作标 记;在普通用户一侧,可以实时观看“新通话用户”侧共享的内容和

45、 标记信息。2. 趣味通话趣味通话秉承年轻群体对于多元化社交的理念,通过实时计算摄 影机位置及角度并叠加相应的图片、三维模型等虚拟仿真信息。在视 频通话中,支持主被叫双方创建数智人形象,以及表情包、任务道具、 实时涂鸦等 AR 互动,满足年轻人追求时尚、彰显自我的需求。3. 语音文字互转协同 ASR、TTS 等技术,新通话可发扬科技向善,针对老年人 群、弱听弱视人群,在视频通话过程中将语音实时转换成文字,以字 幕形式呈现于手机屏幕,为“数字弱势群体”提供更加便捷、温暖的 通信服务。4. 跨语种实时翻译在国际旅游、跨国会议等场合,人们需要咨询、购票、租车、订 房、订餐等操作,常常涉及不同语种间的

46、通话。针对跨语种场景,协 同 ASR、TTS、AI 翻译等技术,在视频通话过程中将不同语种按业 务方选择进行实时翻译,并以字幕形式呈现在手机屏幕,帮助用户跨 越语言鸿沟、实现无障碍高效沟通、开创跨屏翻译新时代。5. 主叫名片针对广大希望主动标识自己身份,并主动向被叫表明去电意图的 用户需求,可通过主叫名片业务在通话前向被叫推送主叫名片、呼叫 意图,以消除陌电恐慌、提升电话接通率。主叫名片业务可广泛应用 于防控场景,如社区联络员、社区民警、流调人员使用个人 电话号码向用户发起呼叫时,主动向被叫表明来意,提升防控工作效 率。(二)ToB 场景探索5G 的历史使命是赋能千行百业,促进各行各业的数字化

47、转型, 成为社会经济生活的新型基础设施。然而,5G ToB 的成功是实现这 个历史使命的基本条件,是真正的重头戏和主战场。据 Keystone Strategy & Huawei SPO Lab 预测,预计 2025 年全球与 ICT 相关的行 业数字化收入将达到 4.7 万亿美元,其中 5G 相关的市场总空间超过 1.6 万亿美元,而运营商可参与的部分占比将超过 50%,其中 5G ToB 市场高达 6020 亿美金。5G 新通话作为企业级通信服务的重要载体,通过业务升级的形 式为企业提供多种通话业务模式的价值方案与思路,进一步实现“通 话即服务”的目标。企业可基于终端原生通话入口通过音视频

48、、图文 等富媒体方式向用户输出个性化服务,真正实现开机即用、按需服务、 用完即走的超轻量级应用,使能企业信息服务更加精准和高效触达用 户群体。5G 新通话 ToB 业务将构建可信、公平、开放的通话服务平台,赋能金融、政务、电商等千行百业,创造出产业互惠、多方共赢 的新生态。1. 服务热线可视化菜单针对有面向最终用户服务热线的企业/行业客户,可升级传统“IVR 语音+数字键盘交互”为“可视导航+点屏交互”,提供“可听可看” 的“可视化菜单”式服务热线,方便用户一目了然获取服务内容,并 通过点击菜单按钮进入相应的业务表单完成业务办理。用户不再等待 冗长的语音提示、不必担心记错或点错菜单编号,通过更

49、直观的指引 与更简单的交互,提升业务办理效率、改善业务办理体验。2. 屏幕共享+远程协作针对企业/行业用户,通话中主被叫双方可以互相共享屏幕,基 于桌面同屏双向标记高效沟通,可广泛应用于客户主动关怀、推荐新 产品、远程帮助用户解决产品售后问题,如家宽故障定位处理、车险出险远程报险等场景。例如在设备远程维修的场景中,消费者使用手机摄像头捕获目标 对象,利用 AR 提供的标注方法对其可能的故障部分进行标注,同时 借助语音描述故障过程,保证双方获取信息的对称性。维修工程师在 远端能够同步看到消费者捕获的目标对象以及标注的故障部分,并借 助 AR 进行测量、标注、记录,确定故障根源,甚至可以在设备屏幕 上借助 AR 演示故障修复过程,给予消费者更清晰、直观的指导和帮 助。整体上能够突破运维人力、上门距离,甚至是天气情况的限制, 提升

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 行业标准

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁