《南农 农业决策支持系统考试总结.doc》由会员分享,可在线阅读,更多相关《南农 农业决策支持系统考试总结.doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章:1决策支持系统与管理信息系统的关系DSS是从MIS的基础上发展起来的,都是以数据库系统为基础,都需要进行数据处理,也都能在不同程度上为用户提供辅助决策信息。DSS与MIS具有以下不同:MIS是面向中层管理人员,为管理服务的系统。DSS是面向高层人员,为辅助决策服务的系统。MIS按事务功能(生产,销售,人事)综合多个事务处理的EDP。DSS是通过模型计算辅助决策MIS是以数据库系统为基础,以数据驱动的系统。DSS是以模型库系统为基础,以模型驱动的系统。MIS分析着重于系统的总体信息的需求,输出报表模式是固定的。DSS分析着重于决策者的需求,输出数据的模式是复杂的。MIS系统追求的是效率,
2、即快速查询和产生报表;DSS追求的是有效性,即决策的正确性。MIS支持的是结构化决策。DSS支持的是半结构化决策。2决策支持系统与专家系统的关系 (1)专家系统(ES)的基本原理与方法用于DSS,即构成了智能型DSS。专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。(2)包括推理机、知识库、知识获取子系统等;DSS的交互式人机接口、友好的对话系统、启发知识的模型库及数据库等。3半结构化、结构化概念结构化程度:是指对某一过程的环境和规律,能否用明确的语言(数学的或逻辑的,形式的或非形式的,定量的或推理的)给予
3、清晰的说明或描述。如果能描述清楚的,称为结构化问题;不能描述清楚而只能凭直觉或经验作出判断的,称为非结构化问题;介于两者之间的,则称为半结构化问题数学模型的定量分析作用西蒙(Simon)决策的四阶段情报设计抉择实施决策问题的要素有哪些?决策的人;决策的目标;决策的方案;后果集;信息集第三章DSS的基本部件 DSS的基本部件,在不同的历史时期,是不一样的。它随着DSS的发展而变化(1)20世纪70年代,DSS大都由模型库、数据库及人机交互系统等三个部件组成(2)20世纪80年代,即对话管理系统、数据库管理系统、模型库管理系统、知识库管理系统、方法库管理系统(3)20世纪80年代以后,DSS是由语
4、言系统(LS)、问题处理系统(PPS)和知识系统(KS)三部分组成画出DSS的结构图并简述每部分的作用语言系统功能:(1)自然语言转化为机器能够理解的形式;(2)机器对问题的解答或系统内部的其他信息转化为自然语言,并向用户输出问题处理系统(PPS),问题处理系统是针对实际问题,提出问题处理方法、途径,利用语言系统对问题进行形式化描述,写出问题求解过程,利用知识系统提供的知识进行实际问题求解,最后得出问题的解答。产生辅助决策所需要的信息,支持决策。新一代的DSS,其人机界面应当满足的要求交互为决策者提供进一步理解决策问题的过程交互给决策者一种“身临其境”的感受交互提供DSS适应新的决策问题及环境
5、的手段交互应该为决策者提供控制的权力交互接口的有效性直接影响DSS的有效性演绎推理、归纳推理、逻辑推理的概念演绎推理:它是由普遍性的前提推出特殊性结论和推理。演绎推理有三段论、假言推理和选言推理等形式归纳推理:由特殊的前提推出普遍性结论的推理。(特殊到一般)逻辑推理(确定性推理):所处理的事实与结论之间存在着确定的因果关系,事实也是确定的2.对象与属性的概念对象与属性,实体可分为“对象”和“属性”,3.个体及总体的概念个体指单个的能互相区别的特定个体。总体可分为同质总体和异质总体4.记录与数据项的概念记录:指描述对象的数据;项:描述属性的数据。 一个记录有若干个数据项组成5.型与值的概念数据也
6、有型(表示总体)和值(表示个体)之分6.关系数据模型的概念关系数据模型是把数据的逻辑结构归为满足一定条件的二维表的模型数据库设计过程(1)需求分析,是通过调查收集和分析用户对数据库的信息需求和处理需求,建立数据库说明文档,是设计的第一步和后续设计阶段的基础(2)概念设计,概念设计的目标是产生一个用户易于理解的、反映数据库信息需求的整体概念模型(3)逻辑设计,目的在于设计一个反映现实世界的概念模型。一般,可采用“分步法”设计方法(4)物理设计物理设计是指如何利用现有的存储设备有效地存储数据第五章模型、农业模型的概念模型(Model)是以某种形式对一个系统的本质属性的抽象描述,以揭示系统的功能、行
7、为及其变化规律。农业模型概念:就是仿各种农业物体或农业过程的一种替代物农业模型的分类、特点经验(Experiential)模型和机理(Mechanistial)模型描述性(Descriptive)模型和解释性(Explainatory)模型统计(Statistical)模型和过程(Process)模型应用(Application)模型和研究(Research)模型 特点:(1)复杂性和多元性;(2)整体性和系统性(3)动态性和阶段性(4)连续性和离散性(5)确定性和随机性农业模拟模型的研制步骤 模型选择与系统定义资料获取与算法构建模块设计与模型实现模型检验与改进模型库的组成模型库由模型结构库、
8、模型数据库和模型目录库三部分组成模型库系统的功能 模型库的作用: 直接用于制定决策对决策的制定提出建议用来估计决策实施后可能产生的后果模型库管理系统的主要功能是利用与维护模型,包括模型的储存管理、模型的运行管理、模型的组合。模型的表示方法模型的表示:与模型的自身特点相关数学模型:以程序形式表示数据处理模型:程序文件图形、图像模型:程序文件、数据文件报表模型:程序文件、数据文件第六章1人机交互系统的概念人机交互系统是决策支持系统中的三大组成部分之一。作为决策支持系统的人机交互系统,既包括一般意义下的人机交互系统,还包括将模型库部件、数据库部件组合成系统的系统集成功能。2人机交互的三元素是什么?人
9、的因素、交互设备及实现人机对话的软件。3系统界面设计的黄金原则是什么?让用户拥有控制权 减少用户的记忆负担 保持界面一致 4简述用户界面的颜色设计必须遵循的原则。色彩的感官刺激(暖色、冷色)专业、社会、文化背景限制颜色的种类分类和对比具有统一性用颜色表示状态第七章1、理解以下名词的概念:先验知识、数据、信息、知识、推理、知识库管理系统先验知识(Priori):不依赖于源于感觉器官所获得的知识数据客观事物的属性、数量、位置及其相互关系等的抽象表示。信息数据所表示的含义(语义),因而说“数据是信息的载体”。知识信息之间结构化的关联关系。推理机 利用知识库中的知识进行推理,对给定问题进行求解,得到结
10、论。(1)演绎推理由前提条件逻辑地推出结论的推理。(2)归纳推理由个别到一般,从足够大的局部推断全局的知识。2、知识的层次包括哪些?事实指人类对客观事物属性的值或状态的描述。(不包含任何变量)概念是关于具有共同属性的一组对象、事件或符号的知识。规则表示因果关系的知识,分为前提(条件)和结论两部分。规律带有变量的规则。启发式知识 是知识的最高层,是关于规则的知识,利用启发式知识,我们可直接得到求解问题的捷径。3、知识的属性包括哪些?真实性 即知识经得起实践检验或逻辑推理证明。相对性 知识的真实性也是相对的。不完全性条件或结论的不完全。模糊性处于中介状态,非真非假。可表示性符号、图形、物理形式第九
11、章数据仓库兴起的原因。(1)“数据太多,信息不足”的现状(2) 异构环境的数据源 据美国幸福杂志所列的全球2000家大公司中已有90%将Internet网络和数据仓库这两项技术列入企业计划。(3)决策支持系统所需数据必须预先提取、转化、过滤并与其他数据源整合数据仓库的定义(1)W.H.Inmon在建立数据仓库一书中,对数据仓库的定义为:数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。2)SAS软件研究所定义:数据仓库是一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。(3)SSC 公司:数据仓库是一种可扩展的结构化数据环境,用于分析
12、不在变化的数据,这些数据来自与企业有关的各种应用,经过逻辑上或物理上的转换后,能够保持很长时间,具有简单的事务表示形式以及快速分析汇总功能。数据仓库特点有哪些?(1)数据仓库是面向主题的(2)数据仓库是集成(整合)的(3)数据仓库是稳定的(4)数据仓库是随时间变化的(5)数据仓库中数据量大(6)数据仓库对软件和硬件要求高数据仓库的结构包括哪些内容。为了将它们有机地组织起来,还需要通过有关每一个数据层的数据来进行控制,这种数据即称为元数据。 在当前基本数据层的基础上,可以对详细数据进行不同程度的汇总和抽象,形成概略数据(SummaryData)层(又可分为轻度概略层和高度概略层)。 从作业性数据
13、源获得的是数据仓库的输入,根据决策者所需要的主题进行存储。这一层所存储的是详细数据(Detail Data),因而称为当前基本数据层。 随着时间的推移,通过时间控制机构将当前基本数据层转化为历史详细数据层数据集市的概念。数据集市是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。数据集市是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。数据集市的特性。规模是小的、特定的应用、面向部门、由业务部门定义,设计和开发、由业务部门管理和维护、快速实现、购买较便宜、投资快速回收、工具集的紧密集成、更详细的,预先存在的数
14、据仓库的摘要子集、可升级到完整的数据仓库元数据的概念。元数据是数据仓库的重要组成部分。元数据描述了数据仓库的数据和环境,即关于数据的数据(meta data)元数据在数据仓库中起着非常重要的作用,它提供了对于数据仓库中内容进行整理、归纳、分类、化简等活动的说明和指南。元数据是将数据仓库中的数据化为知识的关键画出数据仓库系统结构图。数据仓库系统由数据仓库(DW)、仓库管理和分析工具三部分组成。星型模型的概念。星型模型 大多数的数据仓库都采用“星型模型”。星型模型是由“事实表”(大表)以及多个“维表”(小表)表所组成。 “事实表”中存放大量关于企业的事实数据(数量数据)。“维表”中存放描述性数据,
15、维表是围绕事实表建立的较小的表。第十章OLAP(联机分析处理)的定义、特征。联机分析处理是共享多维信息的快速分析。它体现了四个特征: (1)快速性:用户对OLAP的快速反应能力要求很高。 (2)可分析性:应能处理任何逻辑分析和统计分析。 (3)多维性:必须提供对数据分析的多维视图和分析。 (4)信息性:及时获得信息,并且管理大容量的信息。 OLAP准则是什么?其主要的准则有:多维概念视图;一致稳定的报表性能;客户/服务器体系结构;多用户支持等。 简述OLAP与OLTP(联机事务处理系统)的比较。OLAP的基本概念。(1)变量 :变量是数据的实际意义,即描述数据“是什么”。 (2)维:维是人们观
16、察数据的特定角度。如产品维、顾客维、时间维等。 (3)维的层次:数据的细节不同程度为维的层 次。如日、月、季、年是时间维的层次。(4)维成员:维的一个取值称为该维的一个维成员。如“某年某月某日”是时间维的一个成员。 (5)多维数组:一个多维数组可以表示为:(维1,维2,维n,变量) 一个3维结构,(产品,地区,时间,销售额)。(6)数据单元(单元格): 多维数组的取值称为数据单元。 3维数据单元(别墅,广州,08年10月,1千万)。 OLAP的基本操作。切片:对三维数据,通过“切片” ,分别从城市和产品等不同的角度观察销售情况切块:1、维上选定某一区间;2、多维数组的一个三维数组钻取:向上钻取
17、-概括性数据; 向下钻取细节性数据。旋转为什么要进行数据挖掘?1 网络技术的高度发展2 数据爆炸但知识贫乏3 支持数据挖掘技术的基础4 从商业数据到商业信息的进化简述数据挖掘传统的数据分析的区别。数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识.数据挖掘所得到的信息应具有先未知,有效和可实用三个特征.数据挖掘的定义。从技术上定义:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。从商业上说:数据挖掘是一种新的
18、商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘所发现的知识分类。1 广义知识 (Generalization)2 关联知识 (Association)3 分类知识(Classification & Clustering)4 预测型知识(Prediction)5 偏差型知识(Deviation举例数据挖掘方法。1、分类就是找出一个类别的概念描述。 分类代表了同类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型。 一般用规则或决策树模式表示。 分类可被用于规则描述和预测。2、决策树方法 决策树方法主
19、要用于挖掘与发现分类模式。3、神经网络方法 神经网络方法是模拟人脑神经元的工作机理发现知识和规则。是一种复杂的分类和回归算法,常被称为“黑箱”。4、遗传算法 是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,主要应用于优化计算和分类机器学习等方面。5、模糊论方法 就是利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析、模糊分类等。 例如规定工作两年,年收入为5万元可以获得信用卡,因此年收入为49999元的客户就没有资格。这显然不够合理6、统计分析方法 是数据挖掘中使用比较多的一类传统方法。7、可视化技术
20、可视化数据分析技术建立在传统的图表功能的扩展上。8、聚类分析 主要的数据挖掘聚类方法有:划分的方法、层次的方法、基于密度的方法、基于网格的方法、基于模型的方法。9、关联规则 反映一个事物与其它事物之间的相互依存性和关联性,如果两个事物或者多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其他事物预测到。人们希望在海量的商业交易记录中发现感兴趣的数据关联关系,用以帮助商家作出决策。简述数据挖掘的过程。(1)数据准备数据集成:包括数据合并、处理遗漏和清脏数据等。 数据选择:选择需要分析的数据,缩小数据处理范围,提高数据开采质量。 数据预处理:克服目前数据开采工具的局限性。2)数据挖掘 提出假设; 选择合适的工具; 发掘知识的操作;证实发现的知识。(3)结果的表达和解释 把结果利用适当的方法表达出来,还要对信息进行过滤处理。(4)知识的同化将分析所得到的知识集成到业务信息系统的组织结构中去。