《机器学习的决策树解题思路与答案检查.docx》由会员分享,可在线阅读,更多相关《机器学习的决策树解题思路与答案检查.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、机器学习的决策树解题思路与答案检查 决策树是一种模拟人类学习行为的有效方法,它经过训练之后看起来就 像是以树状形式排列的一系列if-then语句。一旦我们有了决策树,只 要沿着树的路径一直向下,正确回答每一个问题,最终就会得到答案。 沿着最终的叶节点向上回溯,就会得到一个有关最终分类结果的推理过 程。决策树方法的核心问题是如何在己知训练样本数据的基础上构建树的 拓扑结构。ID3算法是一种用来构造决策树的贪心算法,采用自顶向下 的方式贪婪搜索遍历所有可能的决策空间,学习后得到的函数被表示为 一棵决策树,其本质是对一组离散的目标函数进行逼近。以此为基础,针 对考试过程中的错误和问题,可以构建以信息
2、牖为节点分裂准则,以节点 数据量,信息睛贡献度,结构深度为分裂停止准则的机器学习算法。在基 本学习模型的基础上,可以进一步明确决策树的剪枝和冲突消解问题。答 题系统基于悲观错误修剪和最小错误修剪的决策树修剪准则设计,同时 还可以扩展新的冲突消解策略。以上述工作为基础,可以讨论习题错误诊 断推理机设计问题,包括特征提取、故障诊断知识库与规则库的建立,属 性表、决策表的建立,决策树学习建模的问题,并对所建立的决策树模型 进行测试分析。通过研究2010-2018年的高考数学试卷,在把自然语 言表达的试题转化为形式化语言后,80%的题目都可以用决策树的方法 来处理。由于计算机强大的计算能力和逻辑的准确
3、性,这些题目基本上 就是满分了。为了解决推理思路准确性和计算步骤优越性问题,系统还 是需要加强学习才行哈。如果用概率来决定遍历的顺序,以及剪枝的决 策方法,那么多练习做题的机器就会有更好的概率分布,这个是显而易 见的事实。如果采用神经网络的学习方法,那么训练数据的准确性和数 量也会非常重要。总而言之,由于我们已经有了阿尔法对围棋的经验,对比高考的各种计 算路径空间应该是小了很多。相信只要开发者能够努力工作,收集足够 多的数据,通过训练获得更好的模型参数,成功应该是一个大概率事件。多功能自动推理机与生成系统大飞机与航天器的设计生产都需要精密推理,进行系统验证。如今希尔 伯特的形式化思想已经外化成
4、了自动推理机,它与逻辑程序语言有一定 的区别,能够处理所有的一阶逻辑,但需要控制信息来使它更具效率。自动推理机的控制信息是独立在知识库之外的,使用者可设定一个启发 函数来控制搜索策略,过滤函数则可以避免浪费时间在不感兴趣的子目 标上。框图系统与语意网络是以图形来表示各对象的内容和关系,由于 图形比文字叙述更容易理解,更容易看清楚对象间的关系,所以它在关 系的表达能力方面较强,适合用来描述物件间之关系。描述逻辑更侧重 于事物的分类及其定义,它的主要推理形式有决定某一种类是否为另一 种类的子集的合包含,以及决定某一物件是属于哪一个种类的分类。描 述逻辑可直接对述词做运算,但是一阶逻辑则不行。它的优
5、点是推理的 时间复杂度为多项式时间,缺点是对困难的问题可能无法叙述或者需要 指数级时间。具有综合分析功能的系统都具备说明如何及为何 的能力,生成系统又叫做规则库系统,它是由一系列if条件M和 then动作K的规则建立起来的。每一条规则都包括if及then 两个部分,条件和动作的数量不限。若推理机从指定条件的if部分向 then部分进行,这种方式称做前向链结法。生成系统的推论过程,可 分为比对(Match)、冲突解决(Conflict resolution).执行(Act)三个阶 段。在比对的方法上,有Naive演算法中的RETE演算法,还有针对 RETE改良或深入探讨的平行处理方法及线性前向链
6、结演算法。当推理 规则经比对被选出后,可能会发生冲突,此时便进入冲突解决阶段。我 们可采用几种标准来排序,比如专门性、规则特性、资料特性、约束条 件多寡、时间关系、类别关系等,然后挑选出最合适规则加以执行。生成式系统的优点是直观,类似于人类的思维习惯,并且其推理过程的 可解释性让它成为了早期人工智能的首选。但是在知识库的实体与关系 数量成指数增长的互联网时代,它的查询速度和效率就变得有些吃不消。推理的形式与分类推理是指依据一定的规则从已有的事实推出结论的过程,最早的推理机 被用于专家系统中完成基于知识的推理任务。它是知识系统的重要组成 部分,位于自动推理系统中用户和知识库之间,可以检验已有的事
7、实和 规则,并在一定的条件下加进新的事实。推理机能够自动确定推理路线,多次调用知识库中的知识,进行逻辑推 理,最后得到问题的结论。一个自动推理系统的推理机包括推理机制和 控制机制。推理机制的基本类型有假言推理、启发式推理、反事实推理、 分解法。推理方向控制机制有前向推理、后向推理、双向推理;深度优 先推理和广度优先推理。基于知识的推理所要解决的问题是如何在问题 求解过程中,合理选择和运用知识,完成问题求解。知识的运用模式称 为推理方式,知识的选择称之为推理控制,它直接决定着推理的效果和 效率。推理控制的核心是推理控制策略。传统的形式化推理技术是以经 典逻辑为基础的,其中运用谓词逻辑中由一组已知
8、事实,根据公理系统 推出某些结构的演绎过程,称为演绎推理方式。演绎推理就是根据公理 系统把一个问题中包含在已知事实中的事实作为结论推导出来。演绎是 人类思维的一种主要表现形式。由于严格的演绎方式不能够处理所有的 问题,各种非经典逻辑推理的研究已成为人工智能的重要内容之一。非 单调推理包括常识推理,它大量地依赖于默认信息,又称为默认推理。 这种默认信息是指当且仅当没有事实证明S不成立时,S总是成立的。 约束推理可以表示为当且仅当没有事实证明S在更大范围内成立时, S只在指定的范围内成立。此外,归纳推理和类比推理在人们认知世 界、解决问题时也发挥着重要的作用。为了搞清一个物理系统的行为,往往不需要使用严格的定量方法,而且 在许多问题环境下难以使用严格的定量方法。定性推理方法从人类的直 观思维出发,它不依赖于定量数值的描述。