利用Excel实现R型聚类分析.pdf

上传人:qwe****56 文档编号:69616776 上传时间:2023-01-07 格式:PDF 页数:4 大小:250.26KB
返回 下载 相关 举报
利用Excel实现R型聚类分析.pdf_第1页
第1页 / 共4页
利用Excel实现R型聚类分析.pdf_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《利用Excel实现R型聚类分析.pdf》由会员分享,可在线阅读,更多相关《利用Excel实现R型聚类分析.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第3 l 卷第4 期2 0 0 7 年8 月物探与化探G E O P H Y S I C A L G E O C H E M I C A LE X P L O R A l l 0 NV 0 1 3 1 N o 4A u g,2 0 0 7利用E x c e l 实现R 型聚类分析春乃芽(辽宁有色葫芦岛地质勘查院,辽宁葫芦岛1 2 5 0 0 0)摘要:R 型聚类分析是对若干个元素进行数量化相似程度分类的一种数理统计方法,主要步骤包括:原始数据转换;求解相关系数;对结果聚类。利用E x c e l 的数据分析工具实现R 型聚类分析的方法和步骤,对野外一线地质人员的工作相当适用。关键词:E x c

2、 e l;数据分析;相关系数;显著性检验中图分类号:P 6 3 2文献标识码:A文章编号:1 0 0 0 8 9 1 8(2 0 0 7)0 4 一0 3 7 4 一0 3化探工作中,聚类分析可提供数量化的衡量元素或样品相似程度的指标,利用这些指标可以将元素或样品划分为不同的类别,从而揭示元素或样品之间本质上的联系,分析元素的共生组合和对岩体异常等的分类评价。聚类分析一般分为2 种:R 型聚类分析(对元素分类)和Q 型聚类分析(对样品分类)。笔者介绍运用E x c e l 数据分析工具实现R 型聚类分析的方法和步骤。利用E x c e l 数据分析工具实现R 型聚类分析的操作流程为:加载分析工

3、具库;原始数据输入;数据转换;求解相关矩阵;聚类分类;分类结果解释。以参考文献 1 的原始数据为例,介绍上述流程。1 加载数据分析工具库缺省的w i n d o w s 并不安装数据分析功能,需要重新加载,步骤如下:工具栏_ 工具_ 加载宏_+分析工具库_+确定。2原始数据输人为了快速而准确地输入原始数据,除了按照正常的E x c e l 方法输入数据以外,可以设定“工具一语音”选项,1 个数据输入完毕之后,按E n t e r 键即可语音朗读,实现数据输入的同步检查,确保其准确性。例子的原始数据如表l 所示。输人数据应按行输入字段名(元素符号),相同一列按行输入同一元素的数值,所有数据输入完

4、毕之后,所有字段名之下的其他行单元格内不再输入任何内容,以保证在5 2 步收稿日期:2 0 0 5 一l l;修回日期:2 0 0 6 0 3用C o u n t()函数求样本数n 时不发生错误。在第4步求解相关矩阵时应选择逐列,表明不同的列代表不同元素的数据。表1 几种元素的原始数据1 0 一6N iC oC uC rSA s1 9 0 3”31 6 01 1 7 88 1 6 342 3 2 87 963 1 7 55 8 61 47 4 42 618 4 l4 2 532 7 8 22 7 31 5 02 4 0 08 2 3 43 71 7 7 59 41 33 1 4 05 4l1

5、0 4 64 462 0 9 31 0 443数据转换一般认为岩石当中常量元素服从正态分布,而其他微量元素多为对数正态分布,而且数据过于离散(这是地质数理统计的一个重要前提条件,利用“数据分析-描述统计”当中的偏度峰度,依据文献 1 所介绍的方法进行检验,笔者直接使用文献3 的数据,未做检验),所以要将其转换为常用对数。选择单元格“J 3”,在公式栏中输入“=L 0 9 1 0(J 3)”之后按E n t e r 键,重新选择单元格“J 9”,将鼠标放在该单元格的右下角的复制控点上,鼠标变成黑色实心“+”形状,按住鼠标左键将其拖拽至“J 8”,完成N i 列数据的转换;重新选择“J 3”,以同

6、样方法拖拽至“0 3”,完成第1 行数据的转换,选择“J 4”将其拖拽至“0 4”,完成第2 行数据的转换,依此类推完成所有数据转换(表2)。4求解相关系数选择工具栏-+工具_ 数据分析-+相关系数+确 万方数据4 期春乃芽:利用阢d 实现R 型聚类分析3 7 5 j袭2 元素含量的对数数据一iC OC uC rSA 83 2 7 9 4 42 4 3 6 1 62 2 0 4 1 23 0 r 7 l l3 9 1 1 8 5O 6 0 2 0 63 3 6 6 9 81 8 9 7 6 3O 7 7 8 1 53 5 0 1 72 7 6 7 91 1 4 6 1 32 8 7 1 5 7

7、1 4 1 4 9 7O2 9 2 4 82 6 2 8 3 9O 4 7 7 1 23 4 4 4 3 62 4 3 6 1 62 1 7 6 0 93 3 8 0 23 9 1 5 6 11 5 6 8 23 2 4 9 21 9 7 3 1 31 1 1 3 9 43 4 9 6 91 7 3 2 3 903 0 1 9 5 31 6 4 3 4 5O 7 7 8 1 53 3 2 0 82 0 1 7 0 30 6 0 2 0 6定,显示相关系数对话框(图1),在输入区域中输入“J 2:0 8”,分组方式选择逐列,选择标准位于第一行,在输出区域输入“Q 2:W 9”(可选择新工作表组,

8、较为简洁,可以通过粘贴把相关系数矩阵与原始数据放在同一s H e e t 内,便于数据的对比),按确定即可得到关系矩阵(表3),结果与参考文献 1 完全相同。图l相关系数对话框表3相关系数5聚类分析R 型聚类分析是以相关系数为基础进行的元素分类,必须对相关系数进行显著性检验。在样本数一定的情况下,是否显著相关与显著水平a 的大小有关。一般情况下,a 值越大,相关元素个数会越多。笔者参照参考文献 2 8 ,依据显著水平a 的大小进行显著性检验,将在某一置信度a 之下显著相关的元素归为一类,逐渐增大显著水平a 值,将显著相关的元素逐一归类并画出谱系图。5 1显著性检验叫。检验求得相关系数r 后,按

9、如下方法判断显著性:如果IrI k 则表明元素之间相关,可以归类,否则,元素之间没有关联。k=l f:+(,l 一2),其中,屯为利用自由度n 一2 的t 分布求得的(双尾);n 为样本数。5 2 利用E x c e l 进行厶检验和元素归类在Y 1 单元格内输入“=C O U N T(B 3:B 1 0 0)”,求得样本数n=6(某一个元素的样品个数),在Y 2单元格内输入“=Y 1 2”,求得自由度n 一2=4,在X 4 至X 8 单元格内分别输入显著水平a 不同的值。在Y 4 单元格中输入“=r 1 1 N V(X 4,Y 2)S Q R T(1 r I N V(x 4,Y 2)2+Y

10、2)”,求得口=O 0 2 5 条件下的r n=O 8 6 79 6,选中Y 4 单元格内容,拖拽其右下角的复制控点,将其内容复制到Y 5:Y 8 单元格,将Y 5 单元格公式中的”改为Y 2,E n t e r,求得显著水平a=O 0 5 条件下的0=0 8 1 l4 0 l,依次类推分别求得显著水平a=O 0 7 5、O 1 0 和O 1 5 条件下的k 值(表4)。表4 不同口条件下的a0 0 2 5O 0 5O 0 7 5O 1O 1 50 8 6 7 9 6 2O 8 1 1 4 0 1O 7 6 7 1 7 60 7 2 9 2 9 90 6 6“5在显著水平a=0 0 2 5 即

11、L=O 8 6 79 6 条件下,相关系数满足显著性检验公式IrI L 的只有C o和c u,即两者相关性极其显著,可归为一类;在显著水平a=0 0 5,即L=0 8 u4 0 l 条件下,N i 与c o、C u 显著相关且与C o 的关系更近一些,归为一类;在显著水平口=O 1 5 条件下,A s、S 相关性显著且S 与C o、c u 的关系更近些,可以归为一类。在显著水平a 0 1 5 条件下,C r 与上述元素相关性不显著,单独归为一类。上述分类按先后顺序绘制成变量分群谱系图(图2)。值得一提的是,虽然C r 与S 的相关系数一0 3 0 39 0,但由于k O 3 0 39I O 6

12、“5,从显著性检验公式来判断,在显著水平a 0 1 5 条件下并不能就此可以确定两者是负相关的。r 一蓝,L 二:i=L 一A B _ J亲近关系O 0 5O 1L J L I J L L 一图2变量分群谱系在绘制变量分群谱系图时,参考文献 1 是以相关系数为横轴来归类的,笔者以置信水平进行分 万方数据物探与化探3 1 卷类,似乎更易理解。例如在显著水平a=0 0 5 条件下,N i 与c o、C u 显著相关,就可以理解为:在测试条件下,有9 5 的把握认为N i 与C o、C u 关系极为密切,类似地,可以说有8 5 把握判定A s、S 与N i,C o、C u 关系密切。6 统计结果的解

13、释任何一个数理统计结果必须得到合理的解释才能对实践有指导意义。上述实例聚类分析之后可以判定:6 个元素在置信水平较小的情况下(d=O 0 5),可以划分为3 组C o、C u、N i,A s、S 和C r,其中C u、c o 高度相关,相对而言N i 与C o 的关系更密切些,而S 与C u、C o 的关系较之N i 更为亲密,亲氧元素C r 与其他5 个元素关联并不显著,而这些现象符合一般意义上的地质和化探规律,所以R 型聚类分析所获得的结果是可取的。7 结语M i c r oO f f i c ex PE x c e l 具有强大的数理统计功能,在许多方面非A c c e s s 等常用数

14、据库可比,多数的地质数理统计都可以直接或间接地得以实现,特别是对小数据量的情况尤为合适,例如化探数据的正态或对数正态检验,背景值的确定,异常走向的判断(F 检验),样品化验数据误差的检验(F 检验),一次趋势面分析等等都可以用E x c e l 来实现,这些操作虽然略显繁琐,但在大众化地质行业软件欠缺的情况下,依然不失为较为理想的选择,对一线地质人员较为适用,值得了解和掌握。数据分析属E x c e l的高级用法,具备相关的多元统计学知识和E x c e l的熟练操作,运用起来更会得心应手。参考文献:1 王崇云地球化学找矿基础 M 北京:地质出版社1 9 8 6 2 杨世莹E x c e l

15、数据统计与分析范例 M 北京:中国青年电子出版社2 0 0 5 3 章哗,张文斌,范正国航空伽玛能谱测量数据分类图的自动编图系统 J 铀矿地质,1 9 9 2,8(5):2 9 7 4 赵荣军河南卢氏县杜关地区地球化学异常及找矿效果 J 物探与化探,2 0 0 1,2 5(6):4 4 7 5 王硕儒,葛宗侠鄂东南中酸性小岩体含矿性评价的模糊聚类法 J 物探与化探,1 9 9 0,1 4(1):6 3 6 杜光伟,徐开锋藏东“三江”地区地球化学特征及其找矿意义 J 物探与化探,2 0 0 l,2 5(6):4 2 5 7 胡远来大样本模糊聚类的快速计算法及应用 J 成都地质学院,1 9 9 8

16、,1 5(1):8 赵玉琛多功能聚类分析程序 J 物探化探计算技术,1 1 9 9 1,1 3(1):8 1 T H EU T I L I Z A T I O NO F E X C E L T OT H EP E R F O R M A N C Eo FR M O D EC L U S T E RA N A L Y S I SC H U NN e i y a(肠d“d 触讧姚矿锄如帕越脚f D 删加。厶r 西皤D 咖丌o m 觑础c 0 H 唧咿,删l d 1 2 5 0 0 0,吼讥o)A b s t 瑚-c t:T h eR-m o d ec l u s t e r 蒯y s i si 8

17、am a t h e m a t i cs t a t i s t i c a lm e t l l o df o ro b t a i l l i n gt l l eq 呦t i t a t i v es i m i l a r i t)ro fs e v 列e l e m e n 协I t sp r o c e d u r ei n c l u d e 8:m ec o n v e 墙i o no ft I I e 嘶g i n a ld a t a;t l I es o l u t i 0 ft l l er e l e v 蚰tc o e m c i e n t;t l ec l u

18、 8 t e r i n g“t l l er e s u J t T I 地a-b o v eo p e r a t i o nc 锄b e 聆a l i z e dh yu s i I l gn 地d a t a 锄a l y 8 i st o o l 0 fE x c e l 1 I l i sm e t h o di sq u i t e 舳i t a b l ef o rf i e l du t i I i z a t i o n K e yw o r 凼:E,【c e l;R-m o d ec l u s t e r 肌a l y s i s;d a 诅蚰a l y s i s;r

19、 e l e v 蛐tc o e 伍c i e n t;s i g I l i f i c a n c et e 8 t作者简介:春乃芽(1 9 6 9 一),男,高级地质工程师,长期在辽宁省西部地区从事野外地质找矿工作。万方数据利用Excel实现R型聚类分析利用Excel实现R型聚类分析作者:春乃芽,CHUN Nei-ya作者单位:辽宁有色葫芦岛地质勘查院,辽宁,葫芦岛,125000刊名:物探与化探英文刊名:GEOPHYSICAL AND GEOCHEMICAL EXPLORATION年,卷(期):2007,31(4)被引用次数:1次 参考文献(8条)参考文献(8条)1.赵玉琛 多功能聚类分

20、析程序 1991(01)2.胡远来 大样本模糊聚类的快速计算法及应用 1998(01)3.杜光伟;徐开锋;藏东 三江地区地球化学特征及其找矿意义期刊论文-物探与化探 2001(06)4.王硕儒;葛宗侠 鄂东南中酸性小岩体含矿性评价的模糊聚类法期刊论文-物探与化探 1990(01)5.赵荣军 河南卢氏县杜关地区地球化学异常及找矿效果期刊论文-物探与化探 2001(06)6.章晔;张文斌;范正国 航空伽玛能谱测量数据分类图的自动编图系统期刊论文-铀矿地质 1992(05)7.杨世莹 Excel数据统计与分析范例 20058.王崇云 地球化学找矿基础 1986 引证文献(1条)引证文献(1条)1.储节旺.郭春侠 EXCEL实现共词分析的方法以国内图书情报领域知识管理研究为例期刊论文-情报杂志2011(3)本文链接:http:/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁