《3.1 认识机器学习.pptx》由会员分享,可在线阅读,更多相关《3.1 认识机器学习.pptx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、授课人:,认识机器学习,目录,01,机器如何学习,02,机器学习算法,PART 01,机器如何学习,要让机器听我们的话,按照我们的意图去完成一些任务,就必须首先让机器会学习,学会自我生存和解决问题的能力。机器学习就是利用经验数据和算法(一种学习方法)来反复训练机器,让它获得一种处理数据的优化方案即模型,然后机器就可以利用这个模型对新输入的数据进行计算,得到预测结果。这样,机器通过学习,就具备了可以自主获得事物规律的能力。机器学习的一般流程如右图所示。,机器如何学习,经验数据,01,经验数据是指来自生活、工作、生产等领域的累积到一定规模的有潜在价值的数据,数据量越大,能够学习的东西也就越多,也更
2、容易发现数据中隐藏的有价值的规律或模式。,算法,02,模型,03,机器在对经验数据进行训练学习过程中,必须是有一定章法的,或者说,要告诉机器如何开展有效的学习的求解策略,这个章法或学习策略就称之为算法。机器在算法的指导下,基于大量经验数据的不断迭代的训练学习,才有可能发现一种已知变量与预测值之间的关系。,机器学习的目标,就是要找到一种表达式,该表达式能根据未来的解释变量来计算得出预测目标变量。这个经训练学习得到的表达式称之为模型。,机器如何学习,PART 02,机器学习算法,1.监督学习 监督学习是机器学习中最重要的一类方法,占据了机器学习算法中绝大多数。所谓监督学习是指:机器在有已知输入值x
3、i和输出值y的经验数据(样本)的情况下开展的学习。当输出y的值集是有限集合时,该学习问题为分类。诸如输出值y=0|1|2,就认为该预测样本为0类或1类或2类。若y值是数值型的连续值,则该学习问题为回归。以下图为例,我们将基于该样本集建立一个二分类模型,将图中的猫和老鼠分类开来。,机器学习算法,此处的监督学习,就是在已知动物样本的属性xi=胡须,体色、门齿、输出值y=猫|鼠的情况下,让机器利用某种算法建立输入量xi和输出变量y的函数关系的过程。当模型训练结束后,只要你告诉机器某动物的特征值xi,它就能较为准确告诉你此动物是猫还是鼠。,这种学习方法有以下几点特点: 训练的数据有标签(lable)。
4、即训练样本的输出变量是样本的标签。 样本的特征和标签已知。简单说,在训练前就知道输入和输出的值。 学习的目的就是建立一个将输入准确映射到输出的模型。,机器学习算法,2.无监督学习 无监督学习就是指机器在学习过程中不受监督,学习模型不断自我认知和巩固,最后进行自我归纳来达到学习目的。在现实生活中,我们常常遇到这样的场景:对有些问题缺乏足够的先验知识,难以对问题的输出结果进行人工标注。或者即便可以标注,但成本太高。因此,我们希望计算机能代替完成此类工作,比如将所有的样本自动分为不同的类别,再由人工对这些类别进行标注,有可能发现世界中新的类别。,机器学习算法,如下图所示,有一组不同形状和颜色的图形,我们对这些图形没有任何标注,也就是机器事先并不知道这些几何图形的形状、大小和颜色,我们把这个图形数据输入到无监督学习的模型中,机器就试图去理解图形的内容,会将相似的物体放在一块,如机器学习模型可能将这些几何图形按不同规则聚集到不同的类别中。,一组图形,三种不同的分类结果,机器学习算法,无监督学习相对监督学习而言,有以下特点: 无需大量的标注数据,从而减少大量的人力、物力和财力。 以更接近人类的学习方式不断自我发现、学习和调整,有利于发现世界的内在结果,找到新的模式或新的知识。 常见的无监督学习算法有聚类、关联分析等。,机器学习算法,携手同行,走向辉煌!,