《人工智能的核心技术 .docx》由会员分享,可在线阅读,更多相关《人工智能的核心技术 .docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品名师归纳总结人工智能的核心技术是什么?人工智能标准化白皮书20211 机器学习机器学习 Machine Learning 是一门涉及统计学、系统辨识、靠近理论、神经网络、优化理论、电脑科学、脑科学等诸多领域的交叉学科,讨论电脑怎样模拟或实现人类的学习行为,以猎取新的学问或技能,重新组织已有的学问结构使之不断改善自身的性能,是人工 智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,讨论从观测数 据样本动身查找规律,利用这些规律对将来数据或无法观测的数据进行猜测。依据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法。1依据学习模式将机器学习分类为监督学习、无监督学习
2、和强化学习等。监督学习监督学习是利用已标记的有限训练数据集,通过某种学习策略/ 方法建立一 个模型, 实现对新数据 / 实例的标记分类/ 映射,最典型的监督学习算法包括回来和分类。监督学习要 求训练样本的分类标签已知,分类标签精确度越高,样本越具有代表性,学习模型的精确 度越高。监督学习在自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等 领域获得了广泛应用。无监督学习无监督学习是利用无标记的有限数据描述隐匿在未标记数据中的结构/ 规律, 最典型的非监督学习算法包括单类密度估量、单类数据降维、聚类等。无监督学习不需要训练样本和人工标注数据,便于压缩数据储备、削减运算量、提升算法速度,
3、仍可以防止正、负样本偏 移引起的分类错误问题。主要用于经济猜测、异常检测、数据挖掘、图像处理、模式识别 等领域,例如组织大型电脑集群、社交网络分析、市场分割、天文数据分析等。强化学习强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。由于外部环境供应的信息很少,强化学习系统必需靠自身的经受进行学习。强化学习的目标是学习从环境状态到行为的映射,使得智能体挑选的行为能够获得环境最大的奖赏,使得外部环境对 学习系统在某种意义下的评判为最正确。其在机器人掌握、无人驾驶、下棋、工业掌握等 领域获得胜利应用。2依据学习方法可以将机器学习分为传统机器学习和深度学习。传统机器学习传统机器学习从一
4、些观测训练样本动身,试图发觉不能通过原理分析获得的规律,实现对将来数据行为或趋势的精确猜测。相关算法包括规律回来、隐马尔科夫方法、支持向可编辑资料 - - - 欢迎下载精品名师归纳总结量机方法、 K 近邻方法、三层人工神经网络方法、Adaboost算法、贝叶斯方法以及决策树方法等。传统机器学习平稳了学习结果的有效性与学习模型的可说明性,为解决有限样本的学习问题供应了一种框架,主要用于有限样本情形下的模式分类、回来分析、概率密度估量等。传统机器学习方法共同的重要理论基础之一是统计学,在自然语言处理、语音识 别、图像识别、信息检索和生物信息等很多电脑领域获得了广泛应用。深度学习深度学习是建立深层结
5、构模型的学习方法,典型的深度学习算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深度神经网络指层数超过 3 层的神经网络 。深度学习作为机器学习讨论中的一个新兴领域,由Hinton等人于2006 年提出。 深度学习源于多层神经网络,其实 质是给出了一种将特点表示和学习合二为一的方式。深度学习的特点是舍弃了可说明性,单纯追求学习的有效性。经过多年的摸索尝试和讨论,已经产生了诸多深度神经网络的模型,其中卷积神经网络、循环神经网络是 两类典型的模型。卷积神经网络常被应用于空间性分布数据。循环神经网络在神经网络中 引入了记忆 和反馈,常被应用于时间性分布数据。深度学习
6、框架是进行深度学习的基础底层 框架,一般包含主流的神经网络算法模型,供应稳固的深度学习API,支持训练 模型在服务器和 GPU、TPU 间的分布式学习,部分框架仍具备在包括移动设备、云平台在内的多种平台上运行的移植才能,从而为深度学习算法带来前所未有的运行速度和有用性。目前 主 流 的 开 源 算 法 框 架 有TensorFlow 、 Caffe/Caffe2 、 CNTK、MXNet 、 Paddle-paddle 、Torch/PyTorch、Theano 等。3此外,机器学习的常见算法仍包括迁移学习、主动学习和演化学习等。迁移学习迁移学习是指当在某些领域无法取得足够多的数据进行模型训练
7、时,利用另一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到新的模型指导新模型训练,可以更有效的学习底层规章、削减数据量。目前的迁移学习技术主要在变量有限的小 规模应用中使用,如基于传感器网络的定位,文字分类和图像分类等。将来迁移学习将被 广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、规律推理等。主动学习主动学习通过肯定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够挑选性的获取学问,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性准就和差异性准就选取有效的样 本。演化学习演化学习对优化
8、问题性质要求极少,只需能够评估解的好坏即可,适用于求解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、多目标演化算法等。目前针对演化学习的讨论主要集中在演化数据聚类、对演化数据更有效的分类,以及供应某可编辑资料 - - - 欢迎下载精品名师归纳总结种自适应机制以确定演化机制的影响等。2 学问图谱学问图谱本质上是结构化的语义学问库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是 “实体 关系实体” 三元组, 以及实体及其相关“属性值”对。不同实体之间通过关系相互联结,构成网状的学问结 构。在学问图谱中, 每个节点表示现实世界的“
9、实体”,每条边为实体与实体之间的 “关系”。通俗的讲, 学问图谱就是把全部不同种类的信息连接在一起而得到的一个关系网络,供应了从“关系”的角度去分析问题的才能。学问图谱可用于反欺诈、不一样性验证、组团欺诈等公共安全保证领域,需要用到反常分析、静态分析、动态分析等数据挖掘方法。特殊的,学问图谱在搜索引擎、可视化展现和精准营销方面有很大的优势,已成为业界的热门工具。但是,学问图谱的进展仍有很大的 挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余。随着学问图谱应用的不 断深化,仍有一系列关键技术需要突破。3 自然语言处理自然语言处理是电脑科学领域与人工智能领域中的一个重要方向,讨论能实现人与
10、电脑之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读懂得和问答系统等。1机器翻译机器翻译技术是指利用电脑技术实现从一种自然语言到另外一种自然语言的翻译过程。基于统计的机器翻译方法突破了之前基于规章和实例翻译方法的局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一些场景的胜利应用已经显现出了巨大 的潜力。随着上下文的语境表征和学问规律推理才能的进展, 自然语言学问图谱不断扩充, 机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展。目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解码两个阶段。训练阶段的目标是获得模型参数
11、,解码阶段的目标是利用所估量的参数和给定的优化目标, 猎取待翻译语句的最正确翻译结果。统计机器翻译主要包括语料预处理、词对齐、短语抽 取、短语概率运算、最大熵调序等步骤。基于神经网络的端到端翻译方法不需要针对双语 句子特的设计特点模型,而是直接把源语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的翻译结果。在基于端到端的机器翻译系统中,通常采纳递归神经网络或卷积神经网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的成效。2语义懂得语义懂得技术是指利用电脑技术实现对文本篇章的懂得,并且答复与篇章相
12、关问题的过程。语义懂得更留意于对上下文的懂得以及对答案精准程度的把控。随着 MCTest 数据集的发可编辑资料 - - - 欢迎下载精品名师归纳总结布,语义懂得受到更多关注,取得了快速进展,相关数据集和对应的神经网络模型层出不穷。语义懂得技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。在数据采集方面,语义懂得通过自动构造数据方法和自动构造填空型问题的方法来有效扩充数据资源。为明白决填充型问题,一些基于深度学习的方法相继提出,如基于留意力的神经网络方法。当前主流的模型是利用神经网络技术对篇章、问题建模,对答案的开头和 终止位置进行猜测,抽取出篇章片段。对于进
13、一步泛化的答案,处理难度进一步提升,目 前的语义懂得技术仍有较大的提升空间。3问答系统问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是指让电脑像人类一样用自然语言与人沟通的技术。人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有了不少应用产品显现,但大多是在 实际信息服务系统和智能助手等领域中的应用,在问答系统鲁棒性方面仍旧存在着问题 和挑战。自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同层面存在不确定性。二是新的词汇、术语、语义和语法导致未知语言现象的不行猜测性。三是数据资源的不充分使其难以掩盖复杂的语言现象。
14、四是语义学问的模糊性和错综复杂的关联性难以 用简洁的数学模型描述,语义运算需要参数巨大的非线性运算。4 人机交互人机交互主要讨论人和电脑之间的信息交换,主要包括人到电脑和运算机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、 虚拟现实技术等亲密相关的综合学科。传统的人与电脑之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备, 以及打印机、 绘图仪、 显示器、 头盔式显示器、 音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,仍包括语音交互、情感交互、体感交互
15、及脑 机交互等技术,以下对后四种与人工智能关联亲密的典型交互手段进行介绍。1语音交互语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同电脑进行交互的综合性技术,结合了语言学、心理学、工程和电脑技术等领域的知识。语音交互不仅要对语音识别和语音合成进行讨论,仍要对人在语音通道下的交互机理、行为方式等进行讨论。语 音交互过程包括四部分:语音采集、语音识别、语义懂得和语音合成。语音采集完成音频 的录入、采样及编码。语音识别完成语音信息到机器可识别的文本信息的转化。语义懂得依据语音识别转换后的文本字符或命令完成相应的操作。语音合成完成文本信息到声音信息的转换。作为人类沟通和猎取信息最自然便利的
16、手段,语音交互比其他交互方式具备更多优势, 能为人机交互带来根本性变革, 是大数据和认知运算时代将来进展的制高点,具 有宽阔的进展前景和应用前景。可编辑资料 - - - 欢迎下载精品名师归纳总结2情感交互情感是一种高层次的信息传递,而情感交互是一种交互状态,它在表达功能和信息时传递情感,勾起人们的记忆或内心的情愫。传统的人机交互无法懂得和适应人的心情或心境, 缺乏情感懂得和表达才能,电脑难以具有类似人一样的智能,也难以通过人机交互做到真 正的和谐与自然。情感交互就是要给予电脑类似于人一样的观看、懂得和生成各种情感的 才能,最终使电脑像人一样能进行自然、亲切和生动的交互。情感交互已经成为人工智能
17、领域中的热点方向,旨在让人机交互变得更加自然。目前,在情感交互信息的处理方式、情感描述方式、情感数据猎取和处理过程、情感表达方式等方面仍有诸多技术挑战。3体感交互体感交互是个体不需要借助任何复杂的掌握系统,以体感技术为基础,直接通过肢体动作与周边数字设备装置和环境进行自然的交互。依照体感方式与原理的不同,体感技术主要分为三类: 惯性感测、 光学感测以及光学联合感测。体感 交互通常由运动追踪、手势识别、运动捕获、 面部表情识别等一系列技术支撑。与其他交互手段相比, 体感交互技术无论是硬件仍是软件方面都有了较大的提升,交互设备向小型化、 便携化、 使用便利化等方面进展, 大大降低了对用户的约束,使
18、得交互过程更加自然。目前,体感交互在嬉戏消遣、医疗辅助与康复、全自动三维建模、帮助购物、眼动仪等领域有了较为广泛的应用。4脑机交互脑机交互又称为脑机接口,指不依靠于外围神经和肌肉等神经通道,直接实现大脑与外界信息传递的通路。脑机接口系统检测中枢神经系统活动,并将其转化为人工输出指令,能够替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而转变中枢神经系统与 内外环境之间的交互作用。脑机交互通过对神经信号解码, 实现脑信号到机器指令的转化, 一般包括信号采集、特点提取和命令输出三个模块。从脑电信号采集的角度,一般将脑机接口分为侵入式和非侵入式两大类。除此之外,脑机接口仍有其他常见的分类方式
19、:依据信号传输方向可以分为脑到机、机到脑和脑机双向接口。依据信号生成的类型,可分为自发式脑机 接口和诱发式脑机接口。依据信号源的不同仍可分为基于脑电的脑机接口、基于功能性核磁共振的脑机接口以及基于近红外光谱分析的脑机接口。5 电脑视觉电脑视觉是使用电脑仿照人类视觉系统的科学,让电脑拥有类似人类提取、处理、懂得和分析图像以及图像序列的才能。自动驾驶、机器人、智能医疗等领域均需要通过电脑视觉技术从视觉信号中提取并处理信息。近来随着深度学习的进展,预处理、特点提取与算法 处理慢慢融合,形成端到端的人工智能算法技术。依据解决的问题,电脑视觉可分为运算 成像学、图像懂得、三维视觉、动态视觉和视频编解码五
20、大类。1运算成像学运算成像学是探究人眼结构、 相机成像原理以及其延长应用的科学。在相机 成像原理方面,可编辑资料 - - - 欢迎下载精品名师归纳总结运算成像学不断促进现有可见光相机的完善,使得现代相机更加轻巧,可以适用于不同场景。同时运算成像学也推动着新型相机的产生,使相机超出可见光的限制。在相机应用科学方面,运算成像学可以提升相机的才能,从而通过后续的算法处理使得在受限条件下拍 摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超辨论率等。2图像懂得图像懂得是通过用电脑系统说明图像,实现类似人类视觉系统懂得外部世界的一门科学。通常依据懂得信
21、息的抽象程度可分为三个层次:浅层懂得,包括图像边缘、图像特点点、纹理元素等。中层懂得,包括物体边界、区域与平面等。高层懂得,依据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿势估量、图像文字说明等。目前高层图像理 解算法已逐步广泛应用于人工智能系统,如刷脸支付、聪明安防、图像搜寻等。3三维视觉三维视觉即讨论如何通过视觉猎取三维信息三维重建以及如何懂得所获取的三维信息的科学。三维重建可以依据重建的信息来源,分为单目图像重建、多目图像重建和深度图像重建等。三维信息懂得,即使用三维信息帮助图像懂得或者直接懂得三维信息。三维信 息懂得可分为,浅层:角点、边缘、法向量等。中层:平面、立方体等。高
22、层:物体检测、 识别、分割等。三维视觉技术可以广泛应用于机器人、无人驾驶、聪明工厂、虚拟/ 增强现实等方向。4动态视觉动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视觉问题可以定义为查找图像元素,如像素、区域、物体在时序上的对应,以及提取其语义信息的问题。动态视觉讨论被广泛应用在视频分析以及人机交互等方面。5视频编解码视频编解码是指通过特定的压缩技术,将视频流进行压缩。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264、H.265、M -JPEG 和 MPEG 系列标准。视频压缩编码主要分为两大类: 无损压缩和有损压缩。 无损压 缩指使用压缩后的数
23、据进行重构时, 重构后的数据与原先的数据完全相同,例如 磁盘文件的压缩。 有损压缩也称为不行逆编码, 指使用压缩后的数据进行重构时,重构后的数据与原先的数据有差异,但不会影响人们对原始资料所表达的信息产生误会。有损压缩的应用范畴广泛,例如视频会议、可视、视频广播、视频监控等。目前,电脑视觉技术进展快速,已具备初步的产业规模。将来电脑视觉技术的进展主要面临以下挑战:一是如何在不同的应用领域和其他技术更好的结合,电脑视觉在解决某些问题时可以广泛利用大数据,已经逐步成熟并且可以超过人类,而在某些问题上却无法到达 很高的精度。二是如何降低电脑视觉算法的开发时间和人力成本,目前电脑视觉算法需要 大量的数
24、据与人工标注,需要较长的研发周期以到达应用领域所要求的精度与耗时。三是可编辑资料 - - - 欢迎下载精品名师归纳总结如何加快新型算法的设计开发,随着新的成像硬件与人工智能芯片的显现,针对不同芯片与数据采集设备的电脑视觉算法的设计与开发也是挑战之一。6 生物特点识别生物特点识别技术是指通过个体生理特点或行为特点对个体身份进行识别认证的技术。从应用流程看,生物特点识别通常分为注册和识别两个阶段。注册阶段通过传感器对人体的生物表征信息进行采集,如利用图像传感器对指纹和人脸等光学信息、麦克风对说话声等 声学信息进行采集,利用数据预处理以及特点提取技术对采集的数据进行处理,得到相应 的特点进行储备。
25、识别过程采纳与注册过程一样的信息采集方式对待识别人进行信息采集、 数据预处理和特点提取,然后将提取的特点与储备的特点进行比对分析,完成识别。从应用任务看,生物特点识别一般分为识别与确认两种任务,识别是指从储备库中确定待识别人身份 的过程, 是一对多的问题。 确认是指将待识别人信息与储备库中特定单人信息进行比对,确定身份的过程,是一对一的问题。生物特点识别技术涉及的内容非常广泛,包括指纹、掌纹、人脸、虹膜、指静脉、声纹、步态等多种生物特点,其识别过程涉及到图像处理、电脑视觉、语音识别、机器学习等多项技术。目前生物特点识别作为重要的智能化身份认证技术,在金融、公共安全、训练、 交通等领域得到广泛的
26、应用。下面将对指纹识别、人脸识别、虹膜识别、指静脉识别、声 纹识别以及步态识别等技术进行介绍。1指纹识别 指纹识别过程通常包括数据采集、数据处理、 分析判别三个过程。数据采集通过光、电、力、热等物理传感器猎取指纹图像。数据处理包括预处理、畸变校正、特点提取三个过程。分析判别是对提取的特点进行分析判别的过程。2人脸识别 人脸识别是典型的电脑视觉应用,从应用过程来看, 可将人脸识别技术划分为检测定位、面部特点提取以及人脸确认三个过程。人脸识别技术的应用主要受到光照、拍照角度、图像遮挡、年龄等多个因素的影响,在约束条件下人脸识别技术相对成熟,在 自由条件下人脸识别技术仍在不断改良。3虹膜识别 虹膜识
27、别的理论框架主要包括虹膜图像分割、虹膜区域归一化、 特点提取和识别四个部分,讨论工作大多是基于此理论框架进展而来。虹膜识别技术应用的主要难题包含传感器和光照影响两个方面:一方面,由于虹膜尺寸小且受黑色素遮挡,需在近红外光源下采纳高辨论图像传感器才可清楚成像,对传感器质量和稳固性要求比较高。另一方 面,光照的强弱变化会引起瞳孔缩放,导致虹膜纹理产生复杂形变,增加了匹配的难度。4指静脉识别 指静脉识别是利用了人体静脉血管中的脱氧血红蛋白对特定波长范畴内的近红外线有很好的吸取作用这一特性,采纳近红外光对指静脉进行成像与识别的技术。由于指静脉血管分布随机性很强,其网络特点具有很好的唯独性,且属于人体内
28、部特点,不受到外界影响,因此模态特性非常稳固。指静脉识别技术应用面临的主要难题来自于成像 单元。5声纹识别声纹识别是指依据待识别语音的声纹特点识别说话人的技术。声纹识别技术通常可以分为前端处理和建模分析两个阶段。声纹识别的过程是将某段来自某个人的语音可编辑资料 - - - 欢迎下载精品名师归纳总结经过特点提取后与多复合声纹模型库中的声纹模型进行匹配,常用的识别方法可以分为模板匹配法、概率模型法等。6步态识别步态是远距离复杂场景下唯独可清楚成像的生物特点,步态识别是指通过身体体型和行走姿势来识别人的身份。相比上述几种生物特点识别, 步态识别的技术难度更大, 表达在其需要从视频中提取运动特点,以及
29、需要更高要求的预处理算法,但步态识别具有远距离、跨角度、光照不敏锐等优势。7 虚拟现实 /增强现实虚拟现实 VR / 增强现实 AR是以电脑为核心的新型视听技术。结合相关科学技术, 在肯定范畴内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近似真实环境的感受和体 验,通过显示设备、跟踪定位设备、触力觉交互设备、数据猎取设备、专用芯片等实现。虚拟现实 / 增强现实从技术特点角度,依据不同处理阶段,可以分为猎取与建模技术、分析与利用技术、交换与分发技术、展现与交互技术以及技术标准与评判体系五个方面。猎取与建模技术讨论如何把
30、物理世界或者人类的创意进行数字化和模型化,难点是三维物理世 界的数字化和模型化技术。分析与利用技术重点讨论对数字内容进行分析、懂得、搜寻和 学问化方法,其难点是在于内容的语义表示和分析。交换与分发技术主要强调各种网络环境下大规模的数字化内容流通、转换、集成和面对不同终端用户的个性化服务等,其核心是开放的内容交换和版权治理技术。展现与交换技术重点讨论符合人类习惯数字内容的各种显示技 术及交互方法,以期提高人对复杂信息的认知才能,其难点在于建立自然和谐的人机交互环境。 标准与评判体系重点讨论虚拟现实/ 增强现实基础资源、内容编目、信源编码等的标准标准以及相应的评估技术。目前虚拟现实 / 增强现实面临的挑战主要表达在智能猎取、普适设备、 自由 交互和感知融合四个方面。在硬件平台与装置、核心芯片与器件、软件平台与工具、相关标准与标准等方 面存在一系列科学技术问题。总体来说虚拟现实/ 增强 现实出现虚拟现实系统智能化、虚实环境对象无缝融合、自然交互全方位与舒服化的进展趋势。可编辑资料 - - - 欢迎下载