实验四 Clementine数据挖掘.docx

上传人:太** 文档编号:64531159 上传时间:2022-11-29 格式:DOCX 页数:7 大小:594.54KB
返回 下载 相关 举报
实验四 Clementine数据挖掘.docx_第1页
第1页 / 共7页
实验四 Clementine数据挖掘.docx_第2页
第2页 / 共7页
点击查看更多>>
资源描述

《实验四 Clementine数据挖掘.docx》由会员分享,可在线阅读,更多相关《实验四 Clementine数据挖掘.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、实验U!数据挖掘实验指导一、目的掌握数据挖掘工具Clementine的基本方法与操作。二、任务利用Clementine对药物数据进行简单的数据挖掘操作,熟悉数据挖掘的基本步骤。 三、要求了解数据挖掘的基本步骤,完成针对给定数据的决策树挖掘/关联规那么分析/聚类分析, 并写出实验报告。四、实验内容利用Clementine对Drug.txt中药物研究数据进行决策树、关联规那么分析,观察挖掘的结 果,比拟这些方法挖掘结果的异同,根据观察的结果写出实验报告。注:药物研究数据来源于对治疗同一疾病病人的处方,这些病人服用不同药物,取得了 相同效果。其中所含数据项如下:Cholesterol:胆固醇(Nor

2、malHigh)Na:唾液中钠元素含量K:唾液中钾元素含量Age:年龄Sex:性别(MF)Drug:病人所服药物种类(A/B/C/X/Y)BP:血压(HighNormalLow)希望通过数据挖掘发现这些处方中隐藏的规律,给出不同临床特征病人更适合服务哪种 药物的建议,为未来医生填写处方提供参考。五、实验环境1、硬件:P4/256MB台式计算机2、软件:Windows 2000 Professional/SQL Server 2000/Clementine 8.1 及以上3、数据:Drugs数据(文件Drug.txt)六、步骤(一) 启 动 clementine图标或 C:Clementine

3、8.1 binClementine.exe,双击桌面数据挖掘工具uclementine 8.1 即可启动该挖掘工具,界面如图4-1所示。Ql囹回 国BBS回叵画ESI 图冈冈 Clementine Stream 1* - Clementine 8.1File Edit Insert View Tools SuperNode Window Help-|D| x|结果输出区畲翘卷畲畲奄Neural Net C5.0 C&R Tree Kohonen KMeans Two Step Apriori GRI Sequence PCAfFactor Regression Logistic Server:

4、 Local Server图4-1 clementine操作界面(二)数据挖掘操作1 .挖掘流(stream)操作新建:File菜单New Stream命令(1) 保存/另存:File菜单TSave Stream/Save Stream As命令指定保存位置、文件名称少保存按钮(2) 翻开:File菜单-Open Stream命令9指定要翻开流的位置、文件名称今翻开 按钮2 .挖掘步骤(1)建立连接数据源1)在挖掘工具区选项卡Sources中将Var. File节点拖入到主工作区。2)右击该节点,选择“Edit”命令,并选择“File”选项卡,显示如图4-2所示界面图4-2数据源编辑器3)指定

5、数据来源的文件名,设定源数据存放格式(如是否从文件中读取字段名、数据 分隔符号、)4)如需要对数据进行过滤那么可在图4-2界面中选择“Filter”选卡;如需要对数据类型 进行转换那么可在图4-2界面中选择“Types”选卡。设置完后,单击“OK” / “Apply”按钮,完成数据源连接。(2)指定挖掘模型在挖掘工具区中选择“Modeling”选卡,将合适的挖掘模型拖到主工作区(如C5.0)。(3)将数据源与挖掘模型连接起来右击主工作区中所建立的数据源,选择“Connect”命令,再单击要与该数据源连接 的挖掘模型。(4)设置挖掘模型右击主工作区中的挖掘模型,选择“Edit”命令,如图4-3所

6、示。图4-3挖掘模型设置选择“Fields”选项卡,选择Use custom settings”,并通过下拉菜单,选择“Target” 和“Inputs”数据列,单击“OK”关闭对话框。选择“Model”选卡可设置模型名称、输出 类型等,选择“Costs”选卡那么可设置训练的代价。(4)执行挖掘执行挖掘流中的所有挖掘模型,可单击窗口上侧工具栏中按钮Execute the current stream;只执行指定挖掘模型,那么先单击相应模型,再单击窗口上侧工具栏按钮“Execute selection ”。3 .浏览挖掘结果挖掘结束后,将在挖掘结果区中显示挖掘结果图标,右击该图标,选择“Brow

7、se”即 可浏览挖掘结果。如图4-4、4-5所示。图4-4挖掘结果浏览窗口图4-5挖掘结果浏览窗口在浏览窗口中,可树状浏览,也层次结构浏览,还可浏览有关挖掘过程的总结。4 .模型准确性评价1 )在结果输出区,双击得到的模型,模型将会在主工作区显示出来2 )右击用于测试的数据源,选择“Connect”命令,再单击1)步中在主工作区中显 示的图标,这时会将测试数据连接到需要测试的模型上。3)在挖掘工具区的“output”选项卡中,将“Analysis”节点拖放到主工作区,并将其 连接到需要测试分析的节点上。4)执行节点Analysis节点,得到如图4-6所示的界面。图4-6模型测试结果医学决策支持

8、系统实验报告班 级学 号姓 名实验名称实验四数据挖掘指导老师日 期2022-5-9医药信息系医院信息系统教研室实验四数据挖掘一、目的掌握数据挖掘的基本方法与操作。二、任务利用Clementine对药物数据进行简单的数据挖掘操作,熟悉数据挖掘的基本步骤。三、要求了解数据挖掘的基本步骤,完成针对给定数据的决策树挖掘/关联规那么挖掘,并写出实 验报告。四、实验内容利用Clementine对Drug.txt中药物研究数据进行决策树、关联规那么分析,观察挖掘的结 果,比拟这些方法挖掘结果的异同,根据观察的结果写出实验报告。注:药物研究数据来源于对治疗同一疾病病人的处方,这些病人服用不同药物,取得了 相同

9、效果。其中所含数据项如下:Age:年龄Cholesterol:胆固醇(NormalHigh)Sex:性别(MF)Na:唾液中钠元素含量Drug:病人所服药物种类(A/B/C/X/Y)K:唾液中钾元素含量BP:血压(HighNormalLow)五、希望通过数据挖掘发现这些处方中隐藏的规律,给出不同临床特征病人更适合服务哪种 药物的建议,为未来医生填写处方提供参考。六、实验环境1 .硬件:P4/256MB台式计算机2 . 软件:Windows 2000 Professional/SQL Server 2000/Clementine 8.13 .数据:Drugs数据(文件Drug.txt)七、实验结果1 .决策树所选择的决策树算法:决策目标:输入数据列:挖掘结果(树状图):模型评价结果:测试集准确率:%,训练集准确率:% 根据挖掘得到的结果,写出一到两条规那么:2 .关联规那么所选择的关联规那么分析算法: 挖掘时选择的前提数据列:挖掘时选择的结论数据列:最小支持度:最小置信度:写出挖掘出的前两条规那么:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁