《《智能数据分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《智能数据分析》PPT课件.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、智能数据分析智能数据分析(Intelligent Data Analysis,IDA)Josipa Kern,PhDAndrija Stampar公共卫生学院萨格勒布大学医学院萨格勒布,克罗地亚 对智能数据分析的兴趣和激情对智能数据分析的兴趣和激情n n决策的过程就是寻求信息和知识的过程n n数据处理可以提供这些n n问题的多维度在于寻找合适的解决方案和进行深入的数据处理和分析 学习目标学习目标n n理解IDA的概念n n浏览相关的网页和文献n n接触一些IDA的工具n n学习如何使用IDA工具和验证IDA的结果 n n识别需要使用IDA来解决的问题n n准备数据并进行分析n n验证并解释ID
2、A的结果 绩效目标绩效目标n n与有效的数据分析相关的多学科研究n n用来从大量的联机数据中提取有用信息;从固有数据库中提取需要的知识和感兴趣的模型。IDA就是就是n n数据开发(data mining)n n从数据中获得的知识n n基于算法(algorithm-based)的遗传规律的发现n n知识的发现n n学习分类系统n n机器学习(machine learning)n n其他 IDA还是还是IDA提供知识提供知识n n经过收集,分类,组织,整合,概括和增值的信息的精华n n位于比资料和信息更高的抽象概念的水平,并能用来推出新的信息和知识n n往往表现为用来解决特定问题的专门技能知识就是
3、知识就是n n是一个抽提、分析、转换、分类、组织和整合知识并以一种能用于计算机系统的形式来阐明的过程 知识的获得知识的获得一个领域的知识能用一系列的一个领域的知识能用一系列的规律来表达规律来表达 n n用来规定建议、指令或策略的正规方式。常用“如果前提,那么结论”或“如果条件那么行为”的形式表达 规律就是规律就是怎样发现隐藏在数据中怎样发现隐藏在数据中的规律?的规律?n nSee5以决策树和/或规律设置的形式来分析数据和生成分类器的程序 一些一些IDA的工具的工具 http:/n nCubist分析数据和生成基于规律的分段线形模型规律的集合,每个规律都有相关的线形表达来计算目标值 一些一些ID
4、A的工具的工具 http:/n nILLM此工具以规律的形式建立了分类模型,这种规律阐述了有关隐藏在数据中的关系的知识 一些一些IDA的工具的工具 http:/n nMagnum Opus找寻相关性规律,因可以揭示数据中因素之间潜在的相互作用而具有竞争性优势 一些一些IDA的工具的工具 http:/n n绝对&相对精确性n n灵敏性&特异性n n假阳性&假阴性n n误差率n n规律的可靠性n n及其他 IDA结果评价结果评价使用See5进行IDA演示IDA举例举例 n n应用.姓名列出案例可能所属的组别以及用来描述每个案例的属性n n属性有两类:离散属性从一系列可能性中提取出一个数值,而连续性
5、属性有数字值 See5应用应用n n应用.数据提供训练案例的信息,See5从中提取出模型n n每个案例的入口由一条或多条决定所有属性值的线组成 See5应用应用n n应用.测试提供测试案例的信息(用于结果评价)n n每个案例的入口由一条或多条决定所有属性值的线组成 See5应用应用n n流行病学研究(1970-1990)n n在这段时间内死于心血管病的受试者样本n n问题:他们知道自己生病了吗?11他们是健康的他们是健康的 22他们有疾病(药物治疗,临床和实验室检他们有疾病(药物治疗,临床和实验室检 查阳性结果)查阳性结果)See5应用应用实例实例 n n应用.姓名实例 See5应用应用实例实
6、例 目标性别:男,女活性:1,2,3年龄:连续的吸烟:否,是目标:1,2n n应用.数据实例See5应用应用实例实例 男,1,59,是,0,0,0,0,119,73,103,86,247,87,15979,?,?,?,1,73,2.5男,1,66,是,0,0,0,0,132,81,183,239,?,783,14403,27221,19153,23187,1,73,2.6男,1,61,否,0,0,0,0,130,79,148,86,209,115,21719,12324,10593,11458,1,74,2.5 See5应用应用实例实例 n n结果实例 规律 1:(包括26名)性别=男 收缩压
7、111 油脂2.9 -1组 0.929See5应用应用实例实例 n n结果实例规律 4:(包括14名)吸烟=是 收缩压131 葡萄糖93 葡萄糖=118 油脂=2.9 -2组 0.938See5应用应用实例实例 n n结果实例 规律 15:(包括2名)收缩压=111 油脂2.9 -2组别 0.750See5应用应用实例实例 n n结果实例 训练数据评价(199例)(a)(b)-分组为 -107 3 (a):组 1 17 72 (b):组 2n n结果实例(训练集)See5应用应用实例实例 灵敏性=0.97特异性=0.81See5应用应用实例实例 n n结果实例 测试数据评价(73例)(a)(b)-分组为 -43 1 (a):组 1 3 26 (b):组 2n n结果实例(测试集)See5应用应用实例实例 灵敏性=0.98特异性=0.90所有推荐的所有推荐的IDA工具在提到的工具在提到的URL上上都是可用的,至少也有测试版本都是可用的,至少也有测试版本 试试你自己的IDA 谢谢!