《人工智能全套课件完整版ppt教学教程最新最全 (1).ppt》由会员分享,可在线阅读,更多相关《人工智能全套课件完整版ppt教学教程最新最全 (1).ppt(507页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、人工智能概述人工智能导论人工智能概述 人工智能正在快速地改变着人们的生活、学习和工作,把人类社会带入一个全新的、智能化的、自动化的时代。人们在享受人工智能带来的便捷生活的同时,需要全面而深入地了解人工智能的基本知识与研究领域,以便更好地了解社会的发展趋势,把握未来的民展机会。人工智能概述第一部分第二部分第三部分第四部分人工智能概述人工智能的社会价值人工智能的应用领域人工智能的未来与展望人工智能概述厦门无人驾驶巴士在软件园上路!阿尔法鹰眼,情绪识别的人工智能,让谎言无处可藏阿里鹿班让设计更美好!人工智能时代即将来临,你准备好了吗?案例引入查阅与思考【查阅与思考】(1)讲述几个你所看到的人工智能应
2、用实例。(2)查阅人工智能的应用实例与同学交流。(3)观看电影人工智能,同学们互相交流观后感。什么是人工智能人工智能(Artificial Intelligence, AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门学科,其目标是希望计算机拥有像人一样的思维过程和智能行为(如学习、推理、思考、规划等),使机器能够胜任一些通常需要人类智能才能完成的复杂工作人工智能的研究领域人工智能的发展创始人物艾伦图灵与图灵测试:艾伦图灵(Alan Turing)是英国著名的数学家、逻辑学家,被称为“计算机科学之父”、“人工智能之父”。人工智能的诞生和蓬勃发展 1956年的夏天,
3、在一个名叫达特茅斯的小镇上,一群年轻的科学家在一起聚会,讨论着用机器模拟智能的一系列有关问题。从此,一个崭新的学科人工智能诞生了,并以它独具魅力的发展势头,开启了传奇曲折的漫漫征程。2016的春天,一场AIphaGo与世界顶级围棋高手的人机对决,再次将人工智能推到了世界舞台的聚光灯下人工智能的发展阶段第一阶段(1956年1980年):计算推理,奠定基础第二阶段(1980年1993年):知识表示,走出困境第三阶段(1993年2005年):机器学习,迎来曙光第四阶段(2006年至今)深度学习,蓬勃兴起近年人工智能主要事件 IBM的国际象棋机器人深蓝战胜国际象棋世界冠军卡斯帕罗夫 1997年 Sta
4、nford开发的一台机器人在一条沙漠小径上成功地自动行驶了131英里,赢得了DARPA挑战大赛头奖2005年 Geoffrey Hinton提出多层神经网络的深度学习算法;Eric Schmidt在搜索引擎大会提出“云计算”概念2006年 Google发布个人助理GoogleNow2010年 近年人工智能主要事件IBM Waston参加智力游戏危险边缘,击败最高奖金得主BradRutter和连胜纪录保持者KenJennings;苹果发布语音个人助手Siri2011年 微软亚洲研究院发布人工智能小冰聊天机器人和语音助手Cortana百度发布DeepSpeech语音识别系统2014年 Facebo
5、ok发布了一款基于文本的人工智能助理“M”2015年 深度学习算法在语音和视觉识别率获得突破性进展2013年 近年人工智能主要事件Google AlphaGo以比分4:1战胜围棋九段棋手李世石Google发布语音助手Assistant2016年 Google AlphaGo以比分3:0完胜世界第一围棋九段棋手柯洁苹果在WWDC上发布CoreML,ARKit等组件百度AI开发者大会正式发布Dueros语音系统,无人驾驶平台Apollo1.0自动驾驶平台华为发布全球第一款AI移动芯片麒麟970iPhone X配备前置3D感应摄像头(TrueDepth),脸部识别点达到3W个,具备人脸识别、解锁和支
6、付等功能2017年 人工智能的社会价值人工智能的社会价值 人工智能是引领未来的战略性高科技,作为新一轮产业变革的核心驱动力,催生新技术、新产品、新产业、新模式,引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。 “无论是体力工作还是脑力工作,只需要单调工作的职业,不需要创造性和灵活性的职业,都将被取代。因为这些职业的思维是AI最容易替代的。”人类简史和未来简史的作者尤瓦尔赫拉利。1、人工智能的应用价值 随着人工智能理论和技术的日益成熟,应用范围不断扩大,既包括城市发展、生态保护、经济管理、金融风险等宏观层面,也包括工业生产、医疗卫生、交通出行、能源利用等具体领
7、域。专门从事人工智能产品研发、生产及服务的企业迅速成长,真正意义上的人工智能产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。2、人工智能的社会价值人工智能带来产业模式的变革2、人工智能的社会价值人工智能带来智能化的生活人工智能的应用领域人工智能的产业发展应用AI+家居AI+医疗AI+零售AI+教育AI+金融AI+农业人工智能的产业发展应用AI+制造AI+安防智能驾驶AI+网络安全智能机器人AI+人力资源学习思考(1)查阅相关文献资料,定义 “人工智能”。(2)查阅相关文献资料,简述人工智能的应用价值。(3)说明人工智能的研究领域。(4)请结合查阅的相关资料,举例说明人工智能的应
8、用领域。人工智能的未来与展望人工智能的未来与展望2030年,AI将怎样影响人们的生活?查阅与思考(1)查阅相关文献资料, 设想一下未来五年内人工智能的发展蓝图。(2)自己在哪一方面想得到人工智能的帮助?(3)编写一个情景剧:2030年我们的美好生活。人工智能的未来与展望 人工智能的发展的终极目标是类人脑思考。目前的人工智能已经具备学习和储存记忆的能力,人工智能最难突破的是人脑的创造能力。而创造力的产生需要以神经元和突触递质传递为基础的一种化学环境。目前的人工智能是以芯片和算法框架为基础。若在未来能再模拟出类似于大脑突触传递的化学环境,计算机与化学结合后的人工智能,将很可能带来另一番难以想象的未
9、来世界。新一代AI布局图人工智能的未来与展望1.从专用智能到通用智能2.从机器智能到人机混合智能3.从“人工+智能”到自主智能系统4.学科交叉将成为人工智能创新源泉5.人工智能产业将蓬勃发展6.人工智能的法律法规将更加健全7.人工智能将成为更多国家的战略选择8.人工智能教育将会全面普及THINKS人工智能导论知识表示和知识图谱人工智能导论2.1知识表示 人类之所以有智能行为是因为他们拥有知识,智能活动过程其实就是一个获得并运用知识的过程,要使机器系统具有人的智能能力(人工智能AI),则必须以人的知识为基础,知识是人工智能的基石。但人类的知识要用适当的模式表示出来,才能够存储到计算机中并被识别运
10、用,本节将对人工智能中常用的几种知识表示方法进行介绍,为后续学习奠定基础。知识表示第一部分第二部分第三部分第四部分知识知识表示产生式框架式状态空间第五部分知识机器可以模仿人类的视觉、听觉等感知能力,但这种感知能力不是人类的专属,动物也具备感知能力,甚至某些感知能力比人类更强,比如狗的嗅觉,机器一定程度也可以比人类更强。但认知是人类的专属能力,也是机器实现人工智能的核心所在,知识的价值就在于可以让机器在感知能力的基础上形成认知能力。因此,什么是知识?这是人工智能首先要解决的问题。知识 知识是人类在实践中认识客观世界(包括人类自身)的成果,它包括事实、信息的描述或在教育和实践中获得的技能 ,知识是
11、人类从各个途径中获得并经过提升、总结与凝练的系统的认识。人们把实践中获得的信息关联在一起,形成的信息结构就是知识。知识的分类在人工智能中,通常从知识的作用及表示来划分,把问题求解所需的知识分为3种类型:(1)叙述型知识。有关系统状态、环境和条件、问题的概念、定义和事实的知识。(2)过程型知识。有关系统状态变化、问题求解过程的操作、演算和行动的知识。(3)控制型知识。有关如何选择相应的操作、演算和行动的比较、判断、管理和决策的知识。知识表示知识表示知识表示(Knowledge Representation)是对知识的描述,即用一组符号将知识表示成计算机可以接受的某种结构。人工智能问题的求解是以知
12、识表示为基础的,如何将已获得的知识以计算机内部代码形式加以合理的描述、存储、有效的利用就是知识表示应该解决的问题。知识表示目前已经提出了许多种知识表示的方法,比较常见的有谓词逻辑表示法、产生式表示法、状态空间表示法、框架式表示法、语义网络法等,具体选择哪种知识表示方法,应从以下几个方面进行考虑: 1. 充分表示领域知识 2. 有利于对知识的利用 3. 便于对知识的组织、维护与管理 4. 便于理解和实现状态空间表示法产生式表示法框架表示法本书介绍三种常用的知识表示方法知识表示产生式表示法产生式的基本形式(1)事实型知识的产生式表示事实型知识可以使用三元组或四元组来表示。对于确定性事实用一个三元组
13、表示:(对象,属性,值) 或者 (关系,对象1,对象2)如果考虑事情的不确定性,可以再加一个置信度构成四元组:(对象,属性,值,置信度) 或者 (关系,对象1,对象2,置信度)产生式的基本形式(1)事实型知识的产生式表示 例如:“小田的职业是教师”可以表示为(Tian,job,teacher);“小李和小王是夫妻”可以表示为(couple,Li,Wang)。 例如:“小田的职业不大可能是教师”可以表示为(Tian,job,teacher,0.1),置信度0.1表示可能性非常小;“小李和小王很可能是夫妻”可以表示为(couple,Li,Wang,0.9),0.9表示可能性很大。产生式的基本形式(
14、2)规则型知识的产生式表示规则描述的是事物间的因果关系。含义是:如果则,规则型知识的产生式表示基本形式是: PQ 或者 IF P THEN Q其中,P是生产式的前提,用于指出该生产式是否可用的条件;Q是一组结论或操作,用于指出当前提P所指示的条件被满足时,应该得出的结论或应该执行的操作。整个产生式的含义是:如果前提P被满足,则可推出结论Q或执行Q所规定的操作。产生式的基本形式(2)规则型知识的产生式表示 例如:r6: IF 动物有犬齿 AND 有爪 AND 眼盯前方THEN 该动物是食肉动物。其中,r6是该产生式的编号;“动物有犬齿 AND 有爪 AND 眼盯前方”是产生式的前提P;“该动物是
15、食肉动物”是产生式的结论Q。产生式系统 把一组产生式放在一起,让它们互相配合,协同作用,一个产生式生成的结论可以供另一个产生式作为已知事实使用,以求得问题的解决,这样的系统称为产生式系统。通常,一个产生式系统由综合数据库、规则库、控制器3部分组成,如下图所示。产生式系统规则集规则集控制器控制器综合数据库综合数据库匹配匹配检索检索匹配排序匹配排序冲突裁决冲突裁决产生式系统结构与工作过程产生式系统【例2.1】建立一个动物识别系统的规则库,用以识别虎、豹、斑马、长颈鹿、企鹅、鸵鸟、信天翁等7种动物。框架表示法框架 我们无法把过去的经验一一都存在脑子里,而只能以一个通用的数据结构的形式存储以往的经验。
16、这样的数据结构就是框架(frame),框架提供了一个结构,一种组织。在这个结构或组织中,新的资料可以用从过去的经验中得到的概念来分析和解释。实例框架:对于一个框架,当人们把观察或认识到的具体细节填入后,就得到了该框架的一个具体实例,框架的这种具体实例被称为实例框架。框架系统:在框架理论中,框架是知识的基本单位,把一组有关的框架连结起来便形成一个框架系统。框架的构成 框架通常由描述事物的各个方面的槽(slot)组成,每个槽可以拥有若干个侧面(facet),而每个侧面又可以拥有若干个值(value)。这些内容可以根据具体问题的具体需要来取舍,一个框架的一般结构如下:框架的构成槽名1: 侧面名1 :
17、值11,值12,值1n 侧面名m1 :值m11,值m12,值m1n槽名n: 侧面名1 :值11,值12,值1n 侧面名m1 :值m11,值m12,值m1n约束 : 约束条件1:constraint 1 约束条件n:constraint n框架表示法【例2.2】对于犯罪行为的新闻报道中都会提到犯罪意图、犯罪结果、证人指控等信息,这些信息可以用一个犯罪框架来表示。【例2.3】如图2-5所示为一高校人员的框架网络系统。状态空间表示法状态空间表示 任何事物都会随着时间和环境而变化,也就是处于不同的状态。设想如果能有效列出事物在不同时期可能处于的所有状态及它们之间的相互转换关系,那么当已知问题的初始状态
18、和目标状态时,就可以对初始状态进行变换,经过一系列的中间状态,最终到达目标状态,从而解决问题。因此,人工智能中引入状态空间法进行知识表示。所谓状态空间(State Space)是利用状态变量和操作符号表示系统或问题的有关知识的符号体系。状态空间表示状态空间可以用一个四元组表示:(S,O,S0,G) 其中,S是状态集合,S中每一个元素表示一个状态,状态是某种结构的符号或数据。O是操作算子的集合,利用算子可将一个状态转换为另一状态。S0是问题的初始状态集合,是S的一个非空子集,也就是S0 S。G是问题的目标状态的集合,也是S的非空子集,即G S。G可以是若干具体的状态,也可以是满足某些性质的路径信
19、息描述。从初始状态S0到目标状态G的路径称为求解路径。状态空间表示 其中O1,O2,,Ok即为状态空间的一个解。注意,解并不是唯一的,只要是能将初始状态S0转换为G 的路径,都是状态空间的解。状态空间表示【例2.4】八码数问题的状态空间描述 八码数问题也是重排九宫阁的问题,如左图所示,在一个33的九宫格上,放置1到8八个数字,中间为一空格,四周数字可移到空格,求如何移动可以使数字变为如右图所示的有序序列。2578 16431238 4765状态空间的与/或图描述 为使问题更直观,状态空间可以用与/或图来描述,也称与/或树,一个与/或图中包含:状态节点,弧(表示状态的转移),起始状态集合,目标状
20、态集合。与/或图实际是把初始问题分解成若干子问题和子子问题的集合;或者是把初始问题变换为若干容易解决的等价问题,而这些问题还可以再进一步变换成若干更容易解决的等价问题,如下图所示为一个问题的与/或图描述。状态空间的与/或图描述图中A为根节点,是初始状态,问题A可以分解成B与C的求解,或变换为问题D的求解,也可以变换为问题E的求解,B问题可以进一步分解为F、G与H三个问题,D又可以变换为较容易的I或J问题,E可以变换为K的求解。IABCDEHGKFJ状态空间的与/或图描述 【例2.5】如图所示,猴子想要摘挂在屋顶的香蕉。它的初始位置在a处,香蕉悬挂的位置在c,猴子站在地面上是够不着香蕉的,它只能
21、站在箱子上才能够到。而箱子的初始位置在b,猴子只有把箱子推到c处,站到箱子上,才能摘到香蕉。acb学习思考(1)什么是知识?有哪几种分类方法? (2)试着构造一个描述学校图书馆的框架。(3)用产生式表示:如果一个人出现腹痛、腹泻及呕吐的症状,那么得肠胃炎的可能性有8成。THINKS人工智能导论知识表示和知识图谱人工智能导论2.2知识图谱 信息技术飞速发展,不断推动着互联网技术的变革,互联网的核心性技术Web经历了网页链接到数据链接的变革后,正逐渐向大规模的语义网络演变。语义网络将知识采用网络的形式表示,它将经过加工和推理的知识以图形的方式提供给用户,而实现智能化语义检索的基础和桥梁就是知识图谱
22、。知识图谱第一部分第二部分第三部分第四部分什么是知识图谱知识图谱的表示知识图谱的应用知识图谱的总结与展望什么是知识图谱“度秘”是另一种形式的百度搜索框IBM想让机器人沃森和你一起开会疾病症状被Google纳入“知识图谱”之中什么是知识图谱?案例引入查阅与思考(1)查阅一个知识图谱的应用实例。(2)你能列举一些应用知识图谱解决问题的领域吗?什么是知识图谱 知识图谱的概念,由Google于2012年率先提出,其初衷是用以增强自家的搜索引擎的功能和提高搜索结果质量,使得用户无需通过点击多个链接就可以获取结构化的搜索结果,并且提供一定的推理功能,创造出一种全新的信息检索模式。本质上,知识图谱就是利用可
23、视化的图谱形象展示客观世界中的概念、实体及其间的复杂关系。Google 知识图谱的宣传语“Things, not strings” 给出了知识图谱的精髓,即:不要无意义的字符串,而是获取字符串背后隐含的对象或事物。搜索引擎中知识图谱的应用知识卡片:早期互联网搜索仅仅是基于本文的链接,搜索时仅单纯的给出包含搜索词的网页,让用户去网页中寻找答案。2012年谷歌提出知识图谱并且将其应用于语义搜索,改进搜索质量,搜索算法会在网页搜索时尽可能的链接与其相关的结构化信息,这些信息会以知识卡片(Knowledge Card)的形式返回给用户,知识卡片就是知识图谱在搜索引擎中最早的表现形式。知识卡片知识图谱在
24、搜索中的展现-知识卡片(图片来源于搜狗)知识图谱在搜索中的展现-知识卡片(图片来源于百度)知识卡片关系搜索中的知识卡片展现(图片来源于搜狗)关系搜索中的知识卡片展现(图片来源于百度)知识图谱的表示知识图谱的表示 从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph),就是把所有不同种类的信息连接在一起而得到的一个关系网络。如图所示为一多关系图,它包含多种类型的节点和多种类型的边,不同形状和颜色代表不同种类的节点和边。知识图谱的表示边边 边边 节节点点 节点节点 节点表示实体或概念,边则构成关系。实体指的是现实世界中的具体事物或具体的人,比如著
25、名的物理学家爱因斯坦、伟大的思想家马克思等;概念是指人们在认识世界过程中形成的对客观事物的概念化表示,如人、动物、组织结构等;关系则用来表达不同实体、概念之间的联系,例如小王和小李是“同事”、李红-“工作在”-上海等等。知识图谱的表示知识图谱可以方便的表示生活中的很多场景,比如一个人的社交网络图谱,如图所示,以图谱的形式清晰呈现出社交人脉。知识图谱的表示社交关系图谱中的实体既可以有“人”,也可以包含“公司”“学校”等组织机构实体。人与人之间可以是亲人、朋友,同学、同事、邻居等。人和学校之间可以是“在读”或者“毕业”的关系,如图所示。小刚小刚苏宁苏宁大大学学百度百度小白小白小红小红同学同学 同事
26、同事 毕业于毕业于 毕业于毕业于 现任职于现任职于 现任职于现任职于 曾任职于曾任职于 知识图谱的表示实体和关系也会拥有各自的属性,比如人可以有“年龄”和“身高”等属性。当我们把所有这些信息作为关系或者实体的属性添加后,所得到的图谱称之为属性图 (Property Graph)。如图所示为一个简单的属性图,小白年龄35岁,任职于百度,职位为区域经理,百度公司成立于2000年1月。小小刚刚苏宁苏宁大学大学百度百度小白小白小红小红同学同学 同事同事 毕业于毕业于 毕业于毕业于 现任职现任职于于 现任职现任职于于 曾任职曾任职于于 年龄年龄:3535,职位职位:区域区域经理经理 成立时间成立时间:2
27、000年年1月月 学习思考(1)查阅资料,思考一下传统知识表示和知识图谱的区别与联系。(2)试着为自己绘制一个社交网络的知识图谱。知识图谱的应用知识图谱的应用百度知识图谱在生活中的应用知识图谱的应用查阅与思考(1)谈谈生活中你所使用的智能设备里,哪些涉及到了知识图谱?(2)查阅相关文献资料,了解知识图谱在教育、医疗行业及农业方面的应用。(3)想一想未来的知识图谱将会怎样改变我们的生活?知识图谱的应用 知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。目前,除了我们前面提到的搜索引擎的应用外,知识图谱已
28、在智能问答、智能推荐以及一些垂直行业中有所应用,成为支撑这些应用发展的动力源泉。知识图谱的应用1.智能问答智能问答目前也是一个非常热门的方向,它是信息检索系统的一种高级形式,它降低了人机交互的门槛,非常适合成为互联网的新入口。相较于传统的用户输入问题,搜索引擎返回网页的方式,智能问答系统可以直接通往答案。目前很多问答平台引入了知识图谱,典型的应用有苹果的Siri,下图为苹果Siri的问答展示。天津聚问网络技术服务中心开发的大型在线问答系统OASK,就是专门为门户、企业、媒体、教育等各类网站提供良好的交互式问答解决方案的。 知识图谱的应用Siri的问答展示1 1SiriSiri的问答展示2 2知
29、识图谱的应用2.智能推荐 在智能推荐方面,可基于知识图谱构建场景,提供基于场景的推荐。例如在电商领域,通过整合商品间关联的信息以及从互联网抽取的相关信息,形成知识库和产品库,构建企业自身的知识图谱。当用户输入关键词查看商品时,知识图谱会为用户提供此次购物方面最相关的信息,并且还能通过用户已购产品推断其购物场景,向其推荐其他相关场景产品。 社交网络Facebook于2013年推出的Graph Search产品,其核心技术就是通过知识图谱将人、地点、事情等联系在一起,帮助用户在庞大的社交网络中找到与自己最具相关性的人,其主要功能就是智能推荐。知识图谱的应用 3.金融领域 金融领域的应用主要包括风险
30、控制和智能投顾等。 在风险控制方面,通过构建工商知识图谱,可以将人、公司的信息用可视化的方式清晰的展示出来。 在智能投顾方面,通过对金融数据进行结构化提取和智能化分析,根据客户自身的理财需求,实现自动理财顾问。当在某个宏观经济事件或者企业相关事件发生的时候,券商分析师、交易员、基金公司基金经理等投资研究人员可以通过知识图谱做更深层次的分析和更好的投资决策。知识图谱的应用教育医疗科研农业旅游人力资源管理知识图谱的总结与展望知识图谱的总结与展望 知识图谱的构建是多学科的结合,需要知识库、自然语言理解,机器学习和数据挖掘等多方面知识的融合,是相关领域研究的最新成果,在未来的几年时间内,知识图谱毫无疑
31、问将是人工智能的前沿研究问题,各行各业都在讨论适合自己的知识图谱。 虽然现在知识图谱很多,但大部分还处于初级阶段,只是侧重于简单事实,对于常识的覆盖十分有限,依然面临众多挑战和难题,如:知识库的自动扩展、异构知识处理、推理规则学习、跨语言检索等。总体而言,知识图谱技术的落地应用前景是光明的,但是也需要充分意识到知识图谱面临的巨大挑战。THINKS人工智能导论机器学习人工智能导论机器学习第一部分第二部分第三部分第四部分第五部分机器学习概述机器学习发展机器学习范畴机器学习方法机器学习工具第六部分机器学习挑战3.1机器学习概述机器学习是用计算机程序模拟人的学习能力,从实际例子中学习得到知识和经验,不
32、断改善性能,实现自我完善。机器学习概述 机器学习是用计算机程序模拟人的学习能力,从实际例子中学习得到知识和经验,不断改善性能,实现自我完善。它从样本数据中学习得到知识和规律,然后用于实际的推断和决策。它和普通程序的一个显著区别是需要样本数据,是一种数据驱动的方法。机器学习VS人类学习机器学习致力于研究如何通过计算机的手段,利用经验改善系统自身的性能,其根本任务是数据的智能分析与建模,进而从数据里面挖掘出有用的价值。3.2机器学习发展机器学习属于人工智能中一个较为年轻的分支,可以大致分为以下三个发展历程:萌芽时期、发展时期、繁荣时期。卡内基梅隆大学的教授Tom Mitchell在机器学习的过程中
33、起到了不可估量的作用,他是机器学习的早期建立者和守护者。 机器学习发展卡内基梅隆大学的教授Tom Mitchell在机器学习的过程中起到了不可估量的作用,他是机器学习的早期建立者和守护者。机器学习发展的另一个重要的里程碑之一是统计学和机器学习的融合 萌芽时期 20世纪50年代中期60年代中期,这一时期处于萌芽时期。人们试图通过软件编程来操控计算机完成一系列的逻辑推理功能,进而使计算机具有一定程度上类似人类一样的智能思考能力。然而这时期计算机所推理的结果远远没有达到人们对机器学习的期望。通过进一步研究发现,只具有逻辑推理能力并不能使得机器智能。研究者们认为,使得机器拥有人工智能的前提还必须是拥有
34、大量的先验知识。发展时期 20世纪60年代中期80年代中期,这一时期处于发展时期。人们试图利用自身思维提取出来的规则来教会计算机执行决策行为,主流便是各式各样的“专家系统”,然而这些系统总会面临“知识稀疏”的问题,即面对无穷无尽的知识与信息,人们无法总结出万无一失的规律。因此,让机器自主学习的设想自然地浮出水面。基于20世纪50年代对于神经网络的研究,人们开始研究如何让机器自主学习。 繁荣时期 20世纪80年代至今,机器学习达到了一个繁荣时期。由于这一时期互联网大数据以及硬件GPU的出现,使得机器学习脱离了瓶颈期。机器学习开始爆炸式发展,开始成为了一门独立热门学科并且被应用到各个领域。各种机器
35、学习算法不断涌现,而利用深层次神经网络的深度学习也得到进一步发展。同时,机器学习的蓬勃发展还促进了其他分支的出现,例如模式识别,数据挖掘,生物信息学和自动驾驶等等。 3.3机器学习范围从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科。机器学习范围机器学习技术的发展促使了很多智能领域的进步,改善着我们的生活。3.4机器学习方法机器学习可以分为监督学习(supervised learning)、无监督学习(unsupervised learning)、强化学习(reinforcement le
36、arning),同时随着人工智能越来越被人们重视,深度学习( Deep learning)也成为机器学习的一个新的领域。机器学习方法深度学习也成为机器学习的新领域。机器学习方法 机器学习是建立在数据建模基础上的,因此,数据是进行机器学习的基础。可以把所有数据的集合称为数据集(dataset),其中每条记录称为一个“样本”,在面对一个新样本时,可以根据样本的不同属性对样本进行相应的分类。为了学习到这一模型,相关研究者提出了不同的策略,这些不同的策略就构成了机器学习的方法,常见的有监督学习,非监督学习,强化学习以及最近兴起的深度学习。3.5监督学习监督学习就是在已知的输入和输出情况下训练出一个模型
37、,将输入映射到输出。简单地说,监督学习就是在训练之前已经知道了输入和输出,而任务的建立就是为了组建一个输入准确映射到输出的模型,当模型输入新的值时就能预测出对应的输出。 监督学习 监督学习就是在已知的输入和输出情况下训练出一个模型,将输入映射到输出。简单地说,监督学习就是在训练之前已经知道了输入和输出,而任务的建立就是为了组建一个输入准确映射到输出的模型,当模型输入新的值时就能预测出对应的输出。 3.5.1K-近邻算法 K-近邻算法(K-nearest neighbors,KNN)核心思想就是“站队”:给定训练集,对于待分类的样本点,计算带预测样本和训练集所有数据点的距离,将距离从小到大取前K
38、个样本,则哪个类别在前K个数据点中的数据量最多,就认为待预测的样本属于该类别。可以使用一句谚语来说明:“近朱者赤,近墨者黑。”K-近邻算法过程1)计算测试数据与各个训练数据之间的距离;2)按照距离的递增关系进行排序;3)选取距离最小的K个点;4)确定前K个点所在类别的出现频率;5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。K-近邻算法缺点对参数的选择很敏感。当选取不同的K值的时候我们会得到完全不同的结果。计算量特别大,每次分类都需要计算位置数据和所有训练样本之间的距离,尤其在遇到训练集非常大的情况。3.5.2决策树决策树(decision tree)是基于树形结构来进行决策的,这
39、恰是人类在面临决策问题时一种很自然的处理机制。一棵决策树一般包含一个根节点,让俺个内部节点和若干个叶子结点,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶子结点代表一种类别。决策树 决策树学习的关键是如何选择最优划分属性。一般而言,随着划分过程不断进行,我们希望决策树的分支节点所包含的样本尽可能属于同一类别,即节点的“纯度”越来越高。但经典决策树在存在噪音的情况下,其性能会出现明显的下降,这在使用过程中要极为注意。3.5.3支持向量机支持向量机(support vector machine,SVM) 模型是将实例表示为空间中的点,这样映射就能使得单独类别的实例被尽可能大
40、地分割开来。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别,通俗来讲,他是一种二类分类模型, 支持向量机支持向量机支持向量机支持向量机 在现实生活中,我们把这些球叫做data,把线条叫做classifier, 找到最大间隙的trick叫做optimization,将球抛向空中叫做kernelling, 而那张纸叫做hyperplane。3.6无监督学习 无监督学习就是不受监督的学习。无监督学习不需要人类进行数据标注,而是通过模型不断地自我认知,自我巩固,最后进行自我归纳来实现其学习的过程。虽然目前无监督学习的使用不如监督学习广泛,但这种独特的方法论为机器学习的未来发展
41、方向给出了很多启发和可能性,正在引起越来越多的关注。 无监督学习顾名思义,无监督学习就是不受监督的学习。同监督学习建立在人类标注数据的基础上不同,无监督学习不需要人类进行数据标注,而是通过模型不断地自我认知,自我巩固,最后进行自我归纳来实现其学习的过程。无监督学习更接近于人类的学习方式,常见的无监督学习方法主要有聚类和降维。 3.6.1聚类 俗话说:“物以类聚,人以群分”,在聚类算法中,训练样本的标记信息是未知的,给定一个由样本点组成的数据及,数据聚类的目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,将样本点划分成若干类,使得属于同一类的样本点非常相似,而属于不同类的样本点不相似。
42、K-均值算法K-均值算法K-均值算法K-均值算法K-均值算法K-均值算法K-均值算法K-均值算法小练习:从16张扑克牌从随机抽取3张作为基数,然后使用聚类算法对这16张扑克牌进行分类,然后换3张作为基数从新分类,最后再选取5张作为基数进行分类,观察分类结果的不同。3.6.2降维 降维(dimensionality reduction)是将数据的维度降低,目的是为了在尽可能保存相关的结构的同时降低数据的复杂度。用少数几个新的变量代替原有数目庞大的变量,把重复的信息合并起来,既可以降低现有变量的维度,又不会丢失重要信息的思想,就称它为“降维”。降维学生ID数学物理化学语文历史英语总分1800182
43、869194818151518002517277906767424180036769517168653911800471779389896348218005867880866279471180066997557167784371800768719561100544491800884987865517545118009769692938389529180105892877672974821801157926792589345918012657555617187414180137096549098744823.6.2降维 通常的做法是计算所有成绩的总分来衡量学生成绩的好坏,但是总会存在一些特殊的学
44、生,比如表中总分为482的三位学生,总分相同,各科成绩差别很大,那如何去区分评价总分相同的学生的学习表现呢?这时可以引入方差的概念,即计算每一个学生成绩的方差,方差的大小可以表明学生各科成绩的波动。因此可以使用一个二维数据(总分,方差)来替代原来的六维数据(数学,物理,化学,语文,历史,英语)来衡量一个学生的学习表现。3.7强化学习强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。强化学习强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision mak
45、ing 问题,即自动进行决策,并且可以做连续决策。它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。著名学者David Silver(Alpha Go的发明者之一)认为,强化学习是解决通用人工智能的关键路径。强化学习强化学习通常有两种不同的策略:一种是探索,也就是尝试不同的事情,看他们是否会获得比之前更好的回报;二是利用,也就是尝试过去经验当中最有效的行为。可以通过旅行商的案例来说明这两种策略的不同,如图3-22所示的旅行商行走的路线图。途中A、B等圆形节点代表城市;两个节点之间的连线代表两个城市之间有路可以行走;线条上的数字代表行走这条线路所产生的
46、消耗。如果旅行商要从A到F,如何选择路径可以是成本消耗最小?强化学习强化学习如果采用利用策略,从A点出发可以走的有B、C、D、E,按照以往的经验,应该走D消耗最少,到达D后可以走的有B、C、F,则应该选择消耗最少的F。由于每次都想获得最少的消耗,所以路线总归会是A-D-F,永远也不会知道会不会有比这个消耗更低的路线。如果采用探索策略,则会在A点不断的尝试,看是否会有消耗更低的路线,最后找到最优路线A-C-F,这里第一步A-C就不是第一步消耗最少的线路。这就是探索和利用之间的矛盾,也是强化学习要解决的一个难点问题。3.8机器学习工具常言道“工欲善其事,必先利其器”,在业务实践中光有理论是不够的,
47、还需要有合适的工具。由于机器学习算法不同于传统的数据处理,涉及很多复杂的计算逻辑并且解决的数据量级通常比较大,所以如何选用合适的机器学习工具也是业务解决方案中非常关键的一个步骤。 机器学习工具3.9机器学习挑战人工智能(AI)的未来令人充满期待,但目前却存在着一些问题,而且往往和道德伦理相关。机器学习在哪些方面让人们感到震惊?人类能骗过一台机器吗?如果能,难度有多大?终结者里的Skynet(天网)和机器人会真的出现在现实生活中吗?强人工智能VS弱人工智能 强人工智能是一种有思考能力、有自我意识的假想机器,不仅能处理有针对性的任务,还可以学习新事物。弱人工智能目前已经存在,具体应用于解决特定问题
48、,如图像识别、汽车驾驶、下围棋等。弱人工智能有时候也狭义的称之为“机器学习”。目前我们还不知道是否能发明出强人工智能。目前还不清楚什么时候才能开发出强人工智能,但弱人工智能已经出现,并在许多领域进行应用。 机器学习挑战我们如果教会一支无人机部队使用机器学习来杀人,这符合道德吗?不良企图医疗机器人选择最贵的治疗方案而不是最优的。忽略道德伦理请在推荐系统的影响下,人类已经慢慢的失去了自己选择的主动权和选择的意识。机器学习改变人类教会了机器人说脏话和发誓;病毒文件欺骗杀毒软件。污染毒化数据THINKS人工智能导论人工神经网络与深度学习人工智能导论作为机器学习的一种重要技术,人工神经网络是一个形式上非
49、常简单,但分类功能非常强大的机器学习工具。无论是在计算机科学、通信、生物统计和医学,还是在金融和经济学(包括股市预测)中,大多数与“智能”有点关系的问题,都可以归结为一个在多维空间进行模式分类的问题,而这些正是人工神经网络所擅长的模式分类。随着计算机计算能力的提高和大数据时代的来临,对人工神经网络的研究进入了一个崭新的时代,深度学习大概念被提出。深度学习的核心理念是通过增加网络的层数来让机器自动地从数据中进行学习,可以凭借无标签的数据进行学习,而不需要依赖于监督信息的支撑。目前,深度学习的研究和应用如火如荼,其成果也成为AI领域关注的的焦点。本章内容4.14.24.34.4神经网络发展概况神经
50、元人工神经网络深度学习神经网络发展概况众所周知,人脑是由几十多亿个高度互联的神经元组成的复杂生物网络,也是人类分析、联想、记忆和逻辑推理等能力的来源。模拟人脑中信息存储和处理的基本单元神经元而组成的人工神经网络模型具有自学习与自组织等智能行为,能够使机器具有一定程度上的智能水平。借助现代计算机计算能力的提升,卷积神经网络 CNN 将神经网络推向第三次发展高潮21世纪初Hopfield神经网络、Kohonen神经网络等的出现,特别是BP网络及算法的提出,将神经网络推向第二次发展高潮20世纪80年代由于各种预言的失败,研究经费被大量削减甚至取消,人工智能进入被称为“AI Winter”的人工智能之