《SPSS学习心得体会.docx》由会员分享,可在线阅读,更多相关《SPSS学习心得体会.docx(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS学习心得体会 应用统计分析学习报告 本科的时候有概率统计和数理分析的基础,但是从来没有接触过应用统计分析的东西,sp也只是听说过,从来没有学过。始终以为这一块儿会比较难,这学期最初学的时候,因为没有仔细看老师给的英文教材,课下也没有仔细搜集相关资料,所以学起来有些吃力,总感觉听起来一头雾水。老师说最终的考核是通过提交学习报告,然后我从图书馆里借了些教材查了些资料,发觉许多问题都弄清晰了。结合软件和书上的例子,实战一下,发觉sp的功能相当强大。最终总结出这篇报告,以巩固所学。 sp,全称是statistical product and service solutions,即“统计产品与服
2、务解决方案”软件,是ibm公司推出的一系列用于统计学分析运算、数据挖掘、预料分析和决策支持任务的软件产品及相关服务的总称,也是世界上公认的三大数据分析软件之一。sp具有统计分析功能强大、操作界面友好、与其他软件交互性好等特点,被广泛应用于经济管理、医疗卫生、自然科学等各个领域。详细到管理方面,sp也是一个进行数据分析和预料的强大工具。这门课中也会用到amos软件。 关于sp的书,许多都是首先介绍软件的。这个软件易于安装,我装的是19.0的,虽然20.0有一些变更和优化,但是主体都是一样的,而且都是可视化界面,用起来很方面且简单上手。所以,我学习的重点是卡方检验和t检验、方差分析、相关分析、回来
3、分析、因子分析、结构方程模型等方法的适用范围、应用价值、计算方式、结果的说明和表述。 首先是t检验这一部分。由于参数检验的基础不坚固,这部分也是最初起先接触应用统计的东西,学起来许多东西拿不准,比如说原假设默认的是什么。结果出来后依旧分不清晰是接受原假设还是拒绝原假设。不过现在弄懂了。这部分很有用的是t检验。t检验应用于当样本数较小时,且样本取自正态总体同时做两样本均数比较时,还要求两样本的总体方差相等时,已知一个总体均数u,可得到一个样本均数及该样本标准差,样原来自正态或近似正态总体。t检验分为单样本t检验、独立样本t检验、配对样本t检验。其中,单样本t 检验是样本均数与总体均数的比较的t检
4、验,用于推断样本所代表的未知总体 均数与已知的总体均数uo有无差别;独立样本t检验主要用于检验两个样本是否来自具有相同均值的总体,即比较两个样本的均值是否相同,要求两个样本是相互独立的;配对样本t检验中,要正确理解“配对”的含义,主要用于检验两个有联系的正态总体的均值是否有显著差异,跟独立检验的区分就是样本是否是配对样本。这几个方法用软件操作起来都是相对简洁的,关键是分清晰什么时候用这个什么时候用那个。 然后是方差分析。方差分析就是将索要处理的观测值作为一个整体,根据变异的不同来源把观测值总变异的平方和以及自由度分解为两个或多个部分,获得不同变异来源的均值与误差均方,通过比较不同变异来源的均方
5、与误差均方,推断各样本所属总体方差是否相等。方差分析主要包括单因素方差分析、多因素方差分析和协方差分析等。这一部分在学习的过程中出现一些问题,就是用sp来操作的时候分不清观测变量和限制变量,假如反了的话会导致结果的不精确。其次,对bonferroni、tukey、scheffe等方法的运用目的不清晰,现在基本驾驭了多重比较方法选择:一般假如存在明确的比照组,要进行的是验证性探讨,即安排好的某两个或几个组间(和比照组)的比较。宜用bonferroni(lsd)法;若须要进行多个均数间的两两比较,且各组个案数相等,相宜用tukey法;其他状况宜用scheffe法。最终,对方差齐性检验、多重比较检验
6、、趋势检验理解不够透彻,在方差检验中,post hoc键有lsd的选项:当方差分析f检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,须进一步确定是哪两个或哪几个均值显著地不同,则须要进行多重比较来检验。lsd即是一种多因变量的三个或三个以上水平下均值之间进行的两两比较检验。 相关分析是探讨现象之间是否存在某种依存关系,并对详细有依存关系的现象探讨其相关方向以及相关程度,是探讨随机变量之间的相关关系的一种统计方法。相关分析探讨现象之间是否相关、相关的方向和亲密程度,一般不区分自变量或因变量。主要有双变量相关分析、偏相关、距离相关几个方法。双变量相关分析是相关分析中最常运用的分析过程
7、,主要用于分析两个变量之间的线性相关分析,可以依据不同的数据类型和条件,选用pearson积差相关、spearman等级相关和kendall的tau-b等级相关。当数据文件包括多个变量时, 干脆对两个变量进行相关分析往往不能真实反映二者之间的关系,此时就须要用到偏相关分析,从中剔除其他变量的线性影响。距离相关分析是对观测变量之间差异度或相像程度进行的测量,其中距离须要弄清晰,距离分析是对观测量之间相像或不相像程度的一种测度,是计算一对观测量之间的广义距离。这些相像性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析困难的数据集。 接着是回来分析。相关分析探讨的是现
8、象之间是否相关、相关的方向和亲密程度,一般不区分自变量或因变量。而回来分析则要分析现象之间相关的详细形式,确定其因果关系,并用数学模型来表现其详细关系。比如说,从相关分析中我们可以得知“质量”和“用户满足度”变量亲密相关,但是这两个变量之间究竟是哪个变量受哪个变量的影响,影响程度如何,则须要通过回来分析方法来确定。回来分析的目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便视察特定变量来预料探讨者感爱好的变量。运用非常广泛,回来分析根据涉及的自变量的多少,可分为一元回来分析和多元回来分析;根据自变量和因变量之间的关系类型,可分为线性回来分析和非线性回来分析。假如在回来分析
9、中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回来分析称为一元线性回来分析。假如回来分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回来分析。应用回来分析时应首先确定变量之间是否存在相关关系,假如变量之间不存在相关关系,对这些变量应用回来预料法就会得出错误的结果。正确应用回来分析预料时应留意:用定性分析推断现象之间的依存关系;避开回来预料的随意外推;应用合适的数据资料; 接下来是因子分析。因子分析是指探讨从变量群中提取共性因子的统计技术。最早由英国心理学家c.e.斯皮尔曼提出。他发觉学生的各科成果之间存在着肯定的相关性,一科成果好的学生
10、,往往其他各科成果也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成果。因子分析可在很多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可削减变量的数目,还可检验变量间关系的假设。因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法干脆 测量到的隐性变量。从显性的变量中得到因子的方法有两类。一类是探究性因子分析,另一类是验证性因子分析。探究性因子分析不事先假定因子与测度项之间的关系,而让数据“自己说话”。而验证性因子分析假定因子与测度项的关系是部分知道的,即哪个测度项对应于哪个因子,虽然我们尚且不知道详细的系数。这一部分
11、不能用sp来操作,要用amos,用起来也很便利。 最终一部分学习的是结构方程模型。结构方程模型是一种融合了因素分析和路径分析的多元统计技术。它的强势在于对多变量间交互关系的定量探讨。在近三十年内,其大量应用于社会科学及行为科学的领域里,并在近几年起先渐渐应用于市场探讨中。结构方程模型是对顾客满足度的探讨采纳的模型方法之一。其目的在于探究事物间的因果关系,并将这种关系用因果模型、路径图等形式加以表述。结构方程模型与传统的回来分析不同,结构方程分析能同时处理多个因变量,并可比较及评价不同的理论模型。与传统的探究性因子分析不同,在结构方程模型中,我们可以提出一个特定的因子结构,并检验它是否吻合数据。
12、通过结构方程多组分析,我们可以了解不同组别内各变量的关系是否保持不变,各因子的均值是否有显著差异。 这门课要学习完了,整个学习的过程是充溢曲折和挑战的,我见证了自己从一窍不通到困惑迷茫再到略懂再到会用的过程。甚至学完之后有些问题还没有彻底搞清晰,自己接下来还会不断的探究的。sp是个很奇妙的工具,结合amos和excel更是如虎添翼,信任学习了sp在以后的论文和数据分析中很有用。这门课给我的感觉是看起来很难,但是实际学起来就好许多,因为当我结合详细实例和软件的时候,许多抽象的问题就豁然开朗了。但是想给老师一个建议,这门课须要很强的统计和概率论的基础,要不然就会很难听懂或者听得半懂。然后这门课的许
13、多方法的相关资料都是用在医疗卫生、自然科学领域的,在管理中的应用的资料不怎么多。老师希望我们上课的时候结合在管理中的应用来学习,但是资料有限,希望老师在这个方面多给学生一些引导。篇二:sp心得体会 学习sp在教化统计中的应专心得体会 一、什么是sp?为什么要学习sp? 新学期起先时,在信息化教化测量与评价的课程中第一次接触 到sp这个软件,作为本科是计算机专业出身的我,当时只知道sp是一套统计软件,就是一套依据统计学原理所编写出来的统计分析软件,至于统计什么?分析什么?我一窍不通,尤其是看到老师举荐的sp在教化统计中的应用这本书的时候,就简洁的把它理解为用sp软件来统计、分析与教化相关的数据,
14、最终得出想要的结论而已,而现在看来,我当时的想法未免有点简洁与无知。下面就来让我们了解一下sp。sp软件是一组专业的、通用的统计软件包,同时它也是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能。它广泛用于教化、心理、医学、市场、人口、保险等探讨领域,也用于产品质量限制、人事档案管理和日常统计报表等。sp软件对计算机硬件系统的要求较低;对运行的软件环境要求宽松,有各种版本可运行在windows xp、win7系统环境下, sp统计软件采纳电子表格的方式输入与管理数据,能便利地从其他数据库中读入数据(如dbase,excel,lotus等)。 我为什么要学习sp呢?其实很简洁,一
15、方面,做为一名 探讨生,要具备肯定的科研实力,如今量化探讨的方法大行其道,一切要以事实说话、要以数据说话,有了数据支持的探讨才能更简单被认可、被推论。另一方面,依据对aect94定义的理解,教化技术 学探讨的对象是学习过程和学习资源,包含大量的偶然现象和非精确现象。因此,要深化探讨教化技术现象及其规律,必需运用统计描述、统计分析方法和模糊数学分析方法,才可能使这门学科达到真正完善的地步。教化技术学探讨的现象多数是偶然的现象,其改变发展往往具有几种不同的可能性,原委出现哪一种结果,那是带有偶然性的,是随机的。这类偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次数时
16、,就能体现统计平均规律。我们只有对数据资料作统计处理,才可能可以发觉它们的内在规律,驾驭现象的特征,检验探讨的假设,才能得出精确的、牢靠的探讨结果。 二、对本sp各章节学习的心得 新课程老师带领下,实行一种新的学习方式,老师讲解了基础部分后,全班同学实行小组分工、协作学习,然后对全班同学进行讲解学习内容,老师进行当堂指导,这种方法变更了同学们的学习看法,同学们不再是课前不预习,课下不复习的状态,每组都有自己的任务,课前有肯定的压力,同学间的探讨也明显的增多,例如:一次课下同学们在一起吃饭,有几位同学还在调侃说“两个菜之间用sp进行分析后得出的结果不接受h0假设,也就是两个菜之间不相关”,虽然这
17、只是一个课下的玩笑,但是这也可以体现出对学习的看法的转变。下面就本学期的所学sp的各章节做一下归纳,这些归纳也是基于本人平常在课前预习,课上及课后的一些所思所想,或许会有一些理解上的偏颇在内,但这仅限于心得而已。本学期学习各个章节 及分工如下表: 章节名称 1.sp的相识 及数据文件的 处理 2.数据清理与 基本统计及测 量质量分析 3.t检验 4.方差分析 1、2人 3人 7.聚类分析 8.统计图形 2人 1人 2人 6.卡方检验 3人 2人 5.相关分析 3人 分工人数 章节名称 分工人数 sp的相识及数据文件的处理心得体会 可能是由于是同学们第一次讲,万事开头难,压力很大,在大家认为最为
18、简洁的内容讲解上,两位同学并没有完全呈现出二人实际水平,大家在这一节课上都感觉到很压抑,总的感觉是这节内容很简洁,但是内容又很松散,可讲的东西太多,讲的东西多就没有突出重点和难点,所以听过之后就有种多数的碎片漂移在脑海中一样,很难将学问系统化,课后总结一下无非就是两块,一块是了解sp软件的历史及基本功能,还有一块就是sp软件当中一个模块叫做数据文件的处理,在相识sp软件当中了解到它是一组社会科学统计软件包,诞生于1968年,当时美国的3位高校生开发出了它,经过这么多年的后续开发,sp已经有了许多的版本,具有了更的兼容性、和更友好的操作界面,也在许多的学科领域得到了应用,而在教化中的应用 只是它
19、的一个分支。此外它对硬件的要求也很低,当前一般的电脑都能安装它,安装的过程中也没有什么特别的方法,傻瓜式的安装方式完全就可以满意。在数据文件的处理方面,主要是要学会定义变量、处理变量两方面;定义变量是要留意依据自己实际采集的数据来定义变量,例如是数值型的变量还是文本型的变量及变量的长度,小数点保留尾数等,总之就是一句话,依据实际调查的数据要求来定义相应变量。变量定义只有只要细心的将实际调查的数据录入到sp当中即可,当然也可以在sp软件之外进行数据编制,可以通过execel等编辑后可以干脆导入到sp中。在处理变量模块当中,可以对变量进行添加、删除、拆分与合并等操作,只要依据实际调查数据,细心调整
20、变量,使操作更加简便和明白。 2、数据清理与基本统计及测量质量分析的心得体会 数据的清理与基本统计及测量质量分析由两名同学进行讲解,由于吸取了上节课两名同学的阅历,本节讲授的明显好于上节课,这里我也是把它分为两块进行学习,一块是数据的清理,另一块是相关统计理论的学习。在数据清理方面主要学习了奇异数据的检查与清理,在这里本人觉得特别有必要进行数据清理,在实际的调查数据时难免会出现错误或者遇到极为特别的典型案例,所以这些数据很难符合大众规律,在统计、分析过程中可能会造成分析结果异样,从而干脆影响最终的结论。所以觉得特别有必要进行数据检查与清理。而我认为本节的难点不是怎样娴熟运用sp软件,而是在其次
21、块中的,相关统计理论的学习,学习这些理论须要肯定的数学基础,只有明确这些 理(论如均值、标准误差、中数、众数、全距、四分位等)原理,知其然,知其所以然,这才是关键,在sp中想要实现对数据进行以上分析只须要轻轻点击一下按钮就可以是轻松实现,但是假如不清晰究竟用它们来做什么就无从谈起做数据分析了,所以本节内容知道分析原理的重要性要远远大用sp对数据做出相关分析的重要性。总结为一句话“知道它们是做什么的后才会让它们去做该做的工作”。 3、t检验的心得体会 t检验由两名同学讲解,在学习t检验时,首先要明确什么样的数据适合t检验,t检验的结果要说明什么问题?经过学习可以知道,t检验是对两组数据间的平均水
22、平或均数的比较,通过比较可以得出两组数据间的显著性水平,而这两组数据都要符合正态分布,方差具有齐同性,t检验由两种状况,一种配对提检验,要求两组数据不行以独立颠倒依次,假如颠倒依次就会变更问题的性质,这种t检验称为配对t检验;另一种状况下的t检验是两组数据可以随意颠倒顺的检验称为独立样本的t检验。但是这两种状况都必需符合最先的要求,即都是符合正态分布,方差都具有齐同性。通过sp的相关操作可以轻松完成检验,但是在检验的过程中必需设置置信区间,一般设置为95%,在设置置信区间时必需要考虑到所做分析的数据,假如像要得到显著性差异的结果则可尽量将置信区间设置小些,假如想要得到不显著差异就要将置信区间甚
23、至大些,本人的理解为若置信区间小,则可以理解为在小范围内是可以信任的,但假如将分析结果的置信区间值调大则说明在很大的范围内这个结果可信,反之则不行信,篇三:sp学习总结 学习sp感想 以前学统计学的时候就听老师讲过sp有特别强大的统计功能,对我们学习、工作有很大的帮助,所以我始终认为sp很神奇。通过这个学期周老师的课让我对此清晰了很多,也学到了sp强大的统计功能,更加让我明白了sp与excel的区分。 sp是“社会科学统计软件包”(statistical package for the social science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福高校h.n
24、ie等三位高校生开发了最早的sp统计软件,并于1975年在芝加哥成立了sp公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场探讨、科研、教化等多个领域和行业。sp是世界上公认的三大数据分析软件之一(sas、sp和systat)。 在学习sp期间,我主要遇到的问题是后面几章,sp的参数检验、方差分析、相关分析、线性回来分析、聚类分析、因子分析等。 在参数检验中我不知道原假设是什么,导致分析的时候不知道该拒绝原假设还是接受原假设,不能分析出统计结果。不会区分单样本t检验和两配对样本t检验的区分,现在懂得了它们都要听从正态分布,基本思想是
25、小概率反证法,反证法思想是先提出假设(检验假设h0),再用适当的统计方法确定假设成立的可能性大小,假如可能性小,则认为假设不成立,否则,还不能认为假设不成立。 在学习方差分析中,起先经常把观测变量和限制变量弄混淆,在分析的时候应分别送入哪个对应框中,假如反了的话会导致结果的不精确。其次,对lsd、bonferroni、tukey、scheffe等方法的运用不清晰,现在基本驾驭了多重比较方法选择:一般假如存在明确的比照组,要进行的是验证性探讨,即安排好的某两个或几个组间(和比照组)的比较。宜用bonferroni(lsd)法;若须要进行多个均数间的两两比较,且各组个案数相等,相宜用tukey法;
26、其他状况宜用scheffe法。最终,对方差齐性检验、多重比较检验、趋势检验理解不够透彻,在方差检验中,post hoc键有lsd的选项:当方差分析f检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,须进一步确定是哪两个或哪几个均值显著地不同,则须要进行多重比较来检验。lsd即是一种多因变量的三个或三个以上水平下均值之间进行的两两比较检验。 在学习相关分析的过程中,在绘制散点图时,不知道哪个该做横坐标,哪个该做纵坐标,明白了横坐标是说明变量,纵坐标是被说明变量,还有对相关系数的种类分析不娴熟等 。在学习回来分析的过程中,对dw可检验的含义不理解,不记得对应的dw表示的残差序列的相关性
27、。对说明变量向前筛选、向后筛选、逐步帅选策略不能娴熟驾驭,特殊是对向前向后筛选时到处的结果不会进行分析。 学习聚类分析中, 变量的选择分不清,无关变量有时会引起严峻的错分,应当只引入在不同类间有显著差别的变量,尽量只运用相同类型的变量进行分析 。 分类数不明确,从好用角度讲,28 类比较合适 。 驾驭了k-means cluster 分析,样本量大于100时有必要考虑,只能运用连续性变量。 学习因子分析的过程中,对提取出来的因子的实际含义不清楚,不能使因子具有命名说明性。 学习了sp后,我不禁想到了sp与excel的区分,这一点是针对像我这样起先只懂得用excel的人来说。从个人的体会来说,二
28、种软件有肯定相像,操作都简便,同时又有一些可以互补的地方。但是sp又比excel更加强大: 一、图型的表现力是sp的主要优点之一 应当说,excel的图型表现主要是简便,对很多的人来说基本够用,但对于科学的表现,sp就更为具体和精确,这一点据说在全部统计软件中都突出。 二、通过sp检验方差齐性和数据分布 假设检验中,采纳的t检验和方差检验都须要满意二个要求,即 1样本方差齐性 2样本总体呈正态分布 在excel中,供应了f检验来检验方差齐性问题,也就是可以先通过f检验确定方差齐性与否来选择下一步用哪个t检验或方差检验分析工具。但只要数据多于二组则无从下手;通过描述统计大约能从峰度和偏度来了解样
29、本的分布实际工作中,只要分布单峰且近似对称分布,也可应用,但要详细确定样本的分布也有难度。这二个问题在sp就可以解决 最终,在感叹它的便利与快捷的同时,对软件开发人员的才智到了肃然起敬的地步。始终觉得计算机语言是最难的一门外语。虽然本科时曾经对这种逻辑性很强的东西很感爱好,并在编程课上取得不错的成果,但始终觉得这好像不是我能掌控的东西。sp的奇妙之处在于,它省去了运用者巨大的计算量,并提高精确性。它开发了开发者的才智,却弱化了运用者的大脑。篇四:sp学习心得 学院:传播学院 专业:10级广播电视新闻学 学号:129012022023 姓名:许咪咪 学习sp有感与excel之比较 在学习sp软件
30、的过程中,自己不敢有丝毫松懈,但同时感到学习压力很大,有肯定的学习难度,软件的操作可以通过短时间内熟识,但对数据的结果分析还须要很大很大的提高。在驾驭了sp相关技能和熟知了sp之于excel的优越性之后,sp成了往后我进行数据分析、调查的首选软件,如若能自由地结合二者运用,便是更佳选择。 excel的基本功能中包括了比较强大的数据处理功能,还供应了丰富的工作表函数,可以完成许多类型的数据处理和分析任务。除了工作表函数以外,excel还供应了一个称为“分析工具库”的加载宏。 excel应用的普及性,很多人都把它作为最常用的统计软件来运用。excel供应的统计功能包括数据管理、描述统计、概率计算、
31、假设检验、方差分析和回来分析等等,对于统计学原理所涉及的大部分内容已经足够了。然而,在学习excel的统计功能以前我们有必要先交待一下excel在统计分析方面的局限性。 1、就统计学原理所涉及的统计方法而言,excel没有干脆供应的方法包括:箱线图(boxplot)、茎叶图、相关系数的p-值、无交互作用可重复的双因素方差分析、方差分析中的多重比较、非参数检验方法、质量限制图等。 2、根据优秀图形的标准,excel做出的许多图形都不合格。excel的有些图形可能适合于一般大众,但不适合用于科学报告中。例如二维图形的三维表示,圆柱图,圆锥图等等。 excel供应的有些图形可能恒久不应当运用。 3、
32、excel不能很好的处理缺失值(miing data)问题。总体来说excel对缺失值的处理方式远不如特地的统计软件恰当。 4、虽然大部分状况下excel的计算结果都是牢靠的,但在一些极端状况下excel的计算程序不够稳定和精确(特殊是excel2003以前的版本中);有些自动功能可能会导致意想不到地结果。 总体来说,excel为我们输入和管理数据、描述数据特征、制作统计表和统计图都供应了强大的支持,但在处理困难的计算时有时候误差相对较大,因而一些数据处理专家建议人们避开采纳excel处理困难的统计问题。sp能在简洁操作基础上,解决excel存在的这些问题,甚至非统计学相关专业的人员也可以利用
33、这个软件对困难的统计问题进行处理、分析。 平常我惯常运用的数据分析软件也是excel。虽然运用excel可以对数据进行透视、分类、筛选以及计算相关系数等,但是这些操作都须要自己每一步每一步的进行手动操作,而运用sp软件在对数据进行整理时,只需对软件某选项内设 置变量条件,系统便自动的进行整理。而且,在学习与应用sp过程中,我了解到应用sp软件只要了解统计分析的原理无需知晓统计方法的各种算法就能得到自己所须要的统计分析结果。另外对于常见的统计方法,sp的吩咐语句、子吩咐及选择项的选择绝大部分在软件内的对话框操作完成,我们无需花费大量的时间记忆大量的吩咐和选择项。在这方面,sp软件的应用可以使我们
34、节约大量时间,而且软件操作比较简单上手,在当今这个时间就是金钱的社会上,我们驾驭sp软件的应用,也就是为自己赚取了不少金钱。 另外在与sp的接触中,我渐渐了解到sp软件的强大与便利。sp供应了从简洁的统计描述到困难的多因素统计分析方法,其中有数据的统计分析、统计描述、交叉表分析、二维相关、方差分析、多元回来、因子分析、聚类分析、降维等分析方法。利用这些方法可以得出计算数据和统计图形,看出数据的离散程度、集中趋势和分散程度,单变量的比重,还有对数据进行标准化处理。利用这个软件对问卷数据进行分析是极好的。虽然,这些方法大部分我还是不会运用,能够让我利用并胜利分析的方法只有寥寥几种,但是这种简洁便捷
35、的操作让我对sp的爱好却是越来越浓。 sp 像手枪,对于社会统计应用sp,足够精度了。exce对初级统计技术也差不多了,里面有许多类型的图,配之以数据透视表,模拟运算表,宏,高级筛选,窗体,而且便利的单元格和变量操作这些优点都使得excel 更利于小规模,低精度,逻辑关系简洁的数据,但是简洁的图和表,有时不须要通过假设检验,也能看出许多关系或结论,这些直观的现象有的时候比sp的假设检验更有劝服力(sp的假设检验虽然精确,但是成本是许多模型假定)其统计思想易于被日常生活所接受,所以execl用得好,更能显出访用者谙熟探讨背景和统计思想,这个修炼层次更高,就像武功最高深的人更最简洁的工具,最简洁的
36、招式,实而不华一样。 了解了excel和sp的这个比较后,可以看出sp的统计思想体现了更多数理统计的味道,而excel 则更多体现了描述统计的味道,所以了解sp更重要的是了解不同模型背后的统计想法,当然这些在运用sp的过程中会渐渐的积累的。一个和学习统计思想无关的,但是在学习sp中必需学会的是“数据组织方式和数据测度”,这个对于那些学习信息的人简单理解,对文科出身的人不简单理解。但是这个问题对于初学者很重要。在实际运用sp时,就得按部就班地根据先定义变量,调测度,在录入(导入数据),再分析。分析并不是整个流程。不留意数据的组织方式和数据测度会使许多统计模型误用(事实上不能用,但是软件输出了统计
37、结果),这种误用不是统计模型用得好不好的问题,而是能不能用的问题! 现在,学期即将结束,同样的这门课程也到了尾期,在这学期学到了许多,并且还有许多没有学到。我们学习时所操作的软件是英文版,这对英语基础不好的我来说是个考验。同时,由于我们所学专业并非必需拥有计算机,导致我们平常能够练习的机会比较少,造成了驾驭不坚固,前学后忘现象比较严峻。现在呢,很是希望能够把sp的应用娴熟操作,并且能把它变为自己的一种本能,使自己在今后的工作与学习中,可以轻松运用。篇五:sp学习总结 随着速度越来越快,计算机的功能越来越多,计算统计功能反而已经成为了计 算机的一个次要部分。不过,对于我们这些从事社会学学习和探讨
38、的人来说,快速 的计算和统计照旧是我们运用计算机的主要功能,所以我们平日的工作总是离不开 sp(statistical package for the social science社会科学统计软件)。s p虽然好用,但是学起来并不简单,特殊是在目前高校的教化体制下,教材的过时 以及课程设置的不合理,使得sp的学习成为了社会学、统计学以及其他社会科学 学科学生极为头痛的一件事情。更为麻烦的是:往往在学生还没有学会sp之前, 一些调查探讨任务却又强迫他们运用sp进行分析工作,使得他们非常苦恼。 本教程就是为那些已经学习过统计学,并且粗通计算机,但尚未学习过sp的 社会科学学科的学生打算的,运用面对
39、问题的教学方法,通过一个调查问卷的详细 分析过程使学生们对sp有一个感性相识,并能够再没有完全驾驭sp的前提下利 用sp完成一些分析任务。因此,本文不强调四平八稳只强调读者能够完成调查分 析的任务,所以会有意忽视一些非常重要但未必会用到的功能,还请读者 见谅。假如读者的确须要运用这些功能,建议参考一本好一点的辅导书。 信任大家知道:依次完整的利用计算机协助的问卷调查包括问卷设计、问卷访 问、数据输入、数据分析、数据输出、调查报告的撰写六大部分。sp软件参加的 主要是数据输入、数据分析和数据输出这三个部分。接着,本文就将分成这三块, 分别介绍sp的运用以及一些技巧、阅历。 1、数据输入 在完成了
40、问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷, 这些问卷计算机是无法干脆识别处理的,我们必需将它们进行适当的编码。由于采 用计算机分析,问卷在设计阶段就应当考虑到今后的编码问题,所以应当将问卷设 计地以客观题为主,被访问者填写的应当只是注入数字、选项这些计算机能够处理 的信息。我们首先要为问卷的每一个填写项都起一个代号,并确定它的数据属性( 主要是区分为字符串、逻辑串还是数字)。笔者的习惯是首先用英文字母表示填写 项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写 项是本小题的第几项,最终再加上表示数据属性的后缀,比如说其次大题第三小题 的第四个字符串填写项
41、的代号便为b3d_s。在以后的全部分析过程中便利用这个代号 来表示数据的详细内容。 接下来,便是详细的输入过程了。首先,我们要对sp的数据文件有一个大致的 了解,这对以后的学习非常关键。打开sp之后,我们便会看到一个类似excel电子 表格的东西,但假如你因此便把sp的数据文件理解为是类似于excel的东西那么就 错了,虽然sp数据的表现形式酷似excel,但就实质而言它更接近于一个数据库文 件,每一个数据列都有它的列名称(也就是我们刚刚起的代号)、列属性(也就是 刚刚我们确定的数据属性),这些都类似于数据库中的字段名称、字段属性,假如 读者以前学习过数据库的相关学问,那里理解起来就非常简洁了
42、。 由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据 录入人员代劳,而那些人员往往是不会运用sp的,所以我们在实际运用过程中数 2、数据分析 对于外行人来说。sp最犯难学的部分便是它analyze菜单下十多项子菜单以及 这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说 就像是天书一般。但是对于学习过统计学的读者来说,这应当不是问题。再加上sp 在操作的简易性上还是非常优秀的,每一项统计功能一般只须要在窗口下选择统 计用的变量,然后设置一下必要的选项,最终按下ok便可以了。所以在这里,详细 的操作就不再介绍了。在这里,笔者觉得有必要先介绍一下sp的vi
43、ewer。在下面 的数据分析和数据输出过程中,我们调用sp的数据分析和制图模块所得到的结果 都会由sp自动输出到一个名为viewer的程序中,并且可以以spo为后缀名保存成为 特地的文件。这样做的好处是假如你的分析和制图工作一次没有完成,那么利用保 存的spo文件,就不必下一次重新作过了。同时,将全部的分析和制图的结果都保存 在一个spo文件中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检 验分析的牢靠性,二来也适合于今后电子化、网络化的趋势。 依据笔者的阅历,sp的学习者在这一阶段(数据分析阶段)最主要的问题在于以往 学习的统计指标总是中文的,而sp中的统计指标是英文的,指标的中
44、文和英文往 往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对 照表,如下: summarize菜单项 数值分析过程 frequencies子菜单项 单变量的频数分布统计 descriptives子菜单项 单变量的描述统计 explore子菜单项 指定变量的综合描述统计 crotabs子菜单项 双变量或多变量的各水平组合的频数分布统计 means子菜单项 单变量的综合描述统计 independent sample t test子菜单项 独立样本的t检验 paired sample t test子菜单项 配对样本的t检验 one-way anova子菜单项 一维方差分析(单
45、变量方差分析) anova models菜单项 多元方差分析过程 simple factorial子菜单项 因子设计的方差分析 general factorial子菜单项 一般方差分析 multivariate子菜单项 双因变量或多因变量的方差分析 repeated factorial子菜单项 因变量均值校验 correlate菜单项 相关分析 bivariate子菜单项 pearson积矩相关矩阵 和kendall、spearman非参数相关分析 partial子菜单项 双变量相关分析 distance子菜单项 相像性、非相像性分析 regreion菜单项 回来分析 liner子菜单项 线性
46、回来分析 logistic子菜单项 二分变量回来分析(逻辑回来分析) probit子菜单项 概率分析 nonlinear子菜单项 非线性回来分析 weight estimation子菜单项 不同权数的线性回来分析 2-stage least squares子菜单项 二阶最小平方回来分析 loglinear菜单项 对数线性回来分析 general子菜单项 一般对数线性回来分析 hierarchical子菜单项 多维交叉变量对数回来分析 logit子菜单项 单因变量多自变量回来分析 claify菜单项 聚类和判别分析 k-means cluster子菜单项 指定分类数聚类分析 hierarchic
47、al cluster子菜单项 未知分类数聚类分析 discriminent子菜单项 聚类判别函数分析 data reduction菜单项 降维、简化数据过程 factor子菜单项 因子分析 correspondence analysis子菜单项 对应表(交叉表)分析 homogeneity analysis子菜单项 多重对应分析 overals子菜单项 非线性典则相关分析 scale菜单项 reliability ananlysis子菜单项 加性等级的项目分析 multidimensional scaling子菜单项 多维等级分析 nonparametric tests菜单项 chi-square子菜单项 相对比例假设检验 binomial子菜单项 特定时间发生概率检验 run子菜单项 随即序列检验 1-sample kolmogorov smirnov子菜单项 样本分布检验 2-independent samples子菜单项 双不相关组分布分析 (转载于:sp学