《最新AB专业三门公共数学课期末成绩数据分析资料.doc》由会员分享,可在线阅读,更多相关《最新AB专业三门公共数学课期末成绩数据分析资料.doc(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateAB专业三门公共数学课期末成绩数据分析资料附录2 AB专业三门公共数学课期末成绩数据分析摘要针对问题一,我们首先对数据进行了处理,剔除异常值。我们统计了A、B专业每个同学的高等数学、线性代数、概率论与数理统计的成绩,按照专业和科目划分为六个子样本。首先对各个子样本做KS正态性检验,以判断样本总体的正态性。使用SPSS软件对A专业的高等数学和B专业的高等数学,A专业线性
2、代数和B专业的线性代数,A专业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验。最终我们得出A、B两专业在三个科目上没有显著性差异的结论。针对问题二,我们需要探究的是两个专业的学生的数学水平有无明显差异。我们首先将每个同学的高等数学,线性代数,概率论与数理统计成绩按照一定权重计算出三科成绩的平均值,该平均值代表了每个同学的数学成绩。按照A、B专业划分为两个子样本。我们使SPSS软件对各子样本做KS正态性检验,得出样本总体正态性良好的结论。然后对两个样本采用做两个平均值的t检验,得出P值,大于显著性水平0.05,拒绝原假设,即认为两组数据之间没有显著性差异。我们得出A、B两专
3、业数学水平没有差异的结论针对问题三,需要分析高等数学对线性代数和概率论与数理统计的影响。我们我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说,该同学的高数成绩、线性代数成绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验。我们确定了高等数学成绩成绩和线性代数成绩具有很强的相关性。进一步使用EXCEL画出散点图,对高等数学与线性代数之间的关系有初步的认识。然后我们使用线性回归的方法确定高等数学成绩和线性代数成绩的回归模型。接下来我们使用相关系数来检验模型的显著性
4、。使用同样的方法我们确定了高等数学成绩和概率论与数理统计的回归模型。最终我们得出结论,高等数学成绩的优劣会影响线性代数、概率论与数理统计的成绩。针对问题四,是紧扣上面三问的结果,对三门课程的分析,和对不同专业相同课程的不同成绩的分析,从学生学习的角度提出我们自己的看法。关键词:KS正态性检验 t检验 显著性差异 双变量相关检验 线性回归 相关系数一、问题重述附件一是某高校A专业和B专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计三门公共数学课程的期末考试成绩数据,请根据数据分析并解决以下几个问题:(1)针对每门课程分析,两个专业学生的分数是否有明显差异?(2)针对专业分析,两个专业
5、学生的数学水平有无明显差异?(3)通过数据分析说明:高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?(4)根据你所作出的以上分析,面向全校本科生同学,撰写一篇1000字左右的论文,阐述你对于大学数学课程学习方面的看法。二、问题分析问题一要求针对每门课程分析,两个专业学生的分数是否有明显差异。我们首先对数据进行了处理,剔除异常值。我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,按照专业和科目划分为六个子样本。首先对各个子样本做KS正态性检验,以判断样本总体的正态性。使用SPSS软件对A专业的高等数学和B专业的高等数学,A专业线性代数和B专业的线性代数,A专
6、业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验。进而确定A、B两专业在三个科目上有无显著性差异。问题二要求的是分析两个专业学生的数学水平有无明显差异,而供我们研究使用的数据是A、B两专业高等数学、线性代数及概率论与数理统计的成绩,于是我们将此类归结为显著性差异检验的问题。我们首先将每个同学的高等数学,线性代数成绩,概率论与数理统计按照一定权重计算出三科成绩的平均值,该平均值代表了每个同学的数学成绩。按照A、B专业划分为两个子样本。我们使SPSS软件对各子样本做KS正态性检验。在验证样本整体正态性后,进而对对两个样本采用做两个平均值的t检验,以确定两组数据之间是否有显著性
7、差异。最终得出确定两个专业学生的数学水平有无明显差异。问题三要求是需要分析高等数学对线性代数和概率论与数理统计的影响。我们我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说,该同学的高数成绩、线性代数成绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验。然后我们确定高等数学成绩和线性代数成绩的回归模型,我们使用相关系数来检验模型的显著性。使用同样的方法我们确定了高等数学成绩和概率论与数理统计的回归模型。问题四是对上面三问的总结,我们需要根据上述的建模结果提出我们
8、的看法。三、模型假设与符号说明3.1 模型假设(1)假设0分当缺考处理,有0分的那组数据没有处理意义。(2)假设样本准确,处理做出的分析是接近实际,能够反映实际状况的。(3)学生和学生之间,班级和班级之间的成绩是相互独立的,没有影响的。(4)假设样本学生的成绩均来自于实际,成绩能真实的反应学生的数学水平由此做出的分析是接近实际。3.2 符号说明符号说明样本中第个同学的成绩样本中的同学的个数样本的方差样本的平均值样本的自由度在置信度下的标准值R相关系数P结果可信程度的一个递减指标四、模型建立与求解4.1问题一的模型建立与求解4.1.1 两个平均值的t检验简介统计学指出:对于两个平均值的比较,设有
9、两组试验数据:与,其中分别是两组数据的个数,这两组数据都服从正态分布,根据两组数据的方差是否存在显著差异,分为以下两种情况进行分析。 如果两组数据的方差无显著差异时,则统计量服从自由度的t分布。式中s为合并标准差,其计算式为: 如果两组数据的精密度或方差有显著差异时,则统计量服从自由度为服从自由度的t分布。其中根据给定的显著性水平,将所计算的t值与临界值比较,做出检验结论。双侧检验时,若,则可判断两平均值无显著差异,否则就有显著差异。单侧检验时,若,且,则可判断平均值1较平均值2无显著减小,否则有显著减小,此为左侧检验;若,且,则可判断平均值1较平均值2无显著增大,否则有显著增大,此为右侧检验
10、。4.1.2 F检验法简介F检验(F-test)适用于两组具有正态分布的实验数据之间的精密度的比较。设有两组试验数据:和,两组数据都服从正态分布,样本方差分别为和,则服从第一自由度为,第二自由度为的F分布(F-distributon)对于给定的显著性水平,将所计算的F值与临界值比较,即可作出检验结论。双侧检验时,若,则可判断方差1与方差2无显著差异,否则有显著差异。单侧检验时,若,且,则判断方差1比方差2无显著减小,否则有显著减小,此为左侧检验;若,且,则判断方差1比方差2无显著增大,否则有显著增大,此为右侧检验。4.1.3 样本的确定剔除异常值:t检验法要求样本总体满足正态分布,我们需要验证
11、各个子样本的正态性,从而判断样本整体的正态性。首先我们需要剔除异常值,我们将含有0分的学生所有科目的成绩予以剔除,另外A专业的一位线性代数取得100分的同学的成绩使得A专业的线性代数成绩不满足正态分布,所以也将其所有成绩剔除。另外原数据中有一处成绩记为725,明显的是输入错误,我们将其修改为72.5,不做剔除处理。在剔除异常值的基础上,我们首先将每个同学个高等数学1成绩和高等数学2成绩求平均值,记作该同学的高等数学成绩。按照A、B专业划分为两个样本,分别别记作样本一和样本二,样本一、二构成了t检验的两组数据。同理将A专业每个同学的线性代数成绩数据记作样本三,将B专业每个同学的线性代数成绩数据记
12、作样本四,同样样本三和样本四构成了t检验的两组数据。同理将A专业每个同学的概率论和数理统计成绩数据记作样本五,将B专业每个同学的概率论和数理统计数据记作样本六,同样样本五和样本六构成了t检验的两组数据。4.1.4 样本总体的K-S正态性检验样本总体的正态性检验方法如下:以每个同学的高等数学,线性代数和概率论与数理统计的成绩为变量分析,利用SPSS 软件绘制A、B专业的高等数学,线性代数和概率论与数理统计的直方图和趋势图依次如下图所示:我们假设这六组数据都服从正态分布,利用SPSS 软件进行K-S 正态性检验的具体结果见附表4.1-1。组数据的近似相伴概率值P 分别为0.142,0.051,0.
13、200,0.711,0.089和0.286均大于一般的显著水平0.05,则接受原来假设,即A、B专业高等数学,线性代数和概率论与数理统计的成绩数据符合近似正态分布。4.1.5 A、B专业高等数学,线性代数和概率论与数理统计的平均成绩的t检验使用SPSS软件对A专业的高等数学和B专业的高等数学,A专业线性代数和B专业的线性代数,A专业的概率论与数理统计和B专业的概率论和数理统计分别做两个平均值的t检验,分析结果如图所示;统计学指出如果显著性概率P显著性水平(),则不拒绝零假设,即认为两组样本的均值不存在显著性差异。 根据SPSS得出的数据可知三组数据比较得出的P值分别为0.507,0.787,0
14、.192,均大于显著性水平(),则不拒绝零假设,即认为这三组样本的均值不存在显著性差异。即我们认为A专业的高等数学成绩和B专业的高等数学之间没有显著性差异,A专业的线性代数成绩和B专业的线性代数成绩没有显著性差异,C专业的概率论与数理统计和B专业的概率论与数理统计成绩没有显著性差异。4.2问题二的模型建立与求解4.2.1 样本的确定在剔除异常值的基础上,我们首先将每个同学的高等数学1成绩和高等数学2成绩求平均值,记作该同学的高等数学成绩。对A、B专业每个同学高等数学、线性代数、概率论与数理统计成绩按照11:2.5:2.5的权重计算其加权平均值,该平均值代表了每个同学的数学水平,我们称其为每个同
15、学的数学平均成绩。按照A、B专业分为两个样本,记作样本一和样本二。4.2.2 样本总体的K-S正态性检验t检验法要求样本总体满足正态性分布,我们验证各个子样本的正态性,从而判断样本整体的正态性,样本总体的正态性检验方法如下:以每个同学的数学平均成绩为变量分析,利用SPSS 软件绘制A、B专业数学成绩的直方图和趋势图如下图所示:我们假设两组数据都服从正态分布,利用SPSS 软件进行K-S 正态性检验的具体结果见附表4.2-1。组数据的近似相伴概率值P 分别为0.184和0.487,大于我们一般的显著水平0.05,则接受原来假设,即A、B专业数学平均成绩数据符合近似正态分布。4.2.3 A、B专业
16、数学平均成绩的t检验使用SPSS软件对A、B两专业数学平均成绩做两个平均值的t检验,分析结果如图所示:统计学指出如果显著性概率P显著性水平(),则不拒绝零假设,即认为两组样本的均值不存在显著性差异。在本题中,P=0.725,大于显著性水平,所以我们认为两组样本数据之间不存在显著性差异,即我们认为A、B两专业的数学水平没有差异。4.3问题三的模型建立与求解4.3.1双变量相关检验的简介统计学指出:双变量分析目标是确定两个变量之间的相关性,测量它们之间的预测或解释的能力。在本题中,我们想通过对高等数学、线性代数、概率论与数理统计成绩的分析确定高数成绩是否对其他两门课目成绩存在某种影响,进一步探究课
17、程之间的相互影响关系。双变量统计分析技术包括:相关分析和回归分析。相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。4.3.2 高数成绩和线性代数的关系Step1:样本的双变量相关检验我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学的线性代数成绩,也就是说,
18、该同学的高数成绩、线性代数成绩,就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验,检验结果如图所示:由此我们可以得出结论,在0.01的显著水平下,同一个同学的高数成绩和它的线性代数成绩具有明显的相关性。Step2:使用EXCEL软件绘制散点图在确定了数学成绩和线性代数成绩具有明显的相关性后,我们进一步探讨同一个同学的高数成绩和线性代数成绩的数学关系。首先我们以同学的高数成绩为自变量,以该同学的线性代数成绩为因变量,绘制出二者的散点图,结果如图所示:初步我们可以得出结论,高数成绩和线性代数成绩呈正相关关系,在误差允许的范围内,当一个同学的高数成绩越高时,它的线性代数成绩
19、一般也较高。Step3:线性回归分析由步骤2的散点图我们初步可以确定高数成绩和线性代数成绩呈线性相关系,于是我们使用EXCEL软件,计算出高数成绩和线性代数成绩的函数表达式为y =0.5964x+29.889(其中x代表高等数学成绩,y代表线性代数成绩)。Step4:线性回归方程显著性的检验在置信度0.05,自由度252下,我们查询相关系数表得出,于是我们得出线性回归方程是可信的结论。4.3.3 高数成绩和概率论与数理统计成绩的关系Step1:样本的双变量相关检验我们统计了A、B专业每个同学的高数、线性代数、概率论与数理统计的成绩,分别看做样本一、二、三。当给出一个同学的高数成绩就对应了该同学
20、的概率论和数理统计成绩,也就是说,该同学的高数成绩、概率论与数理统计就构成了两个变量。我们借助SPSS软件对两个样本之间数据做了双变量相关检验,检验结果如图所示:由此我们可以得出结论,在0.01的显著水平下,同一个同学的高数成绩和它的线性代数成绩具有明显的相关性。Step2:使用EXCEL软件绘制散点图在确定了数学成绩和概率论与数理统计成绩具有明显的相关性后,我们进一步探讨同一个同学的高数成绩和概率论和数理统计的数学关系。首先我们以同学的高数成绩为自变量,以该同学的概率论和数理统计成绩为因变量,绘制出二者的散点图,结果如图所示:初步我们可以得出结论,高数成绩和概率论与数理统计成绩呈正相关关系,
21、在误差允许的范围内,当一个同学的高数成绩越高时,它的概率论与数理统计成绩一般也较高。Step3:线性回归分析由步骤2的散点图我们初步可以确定高数成绩和概率论和数理统计成绩呈线性相关系,于是我们使用EXCEL软件,计算出高数成绩和线性代数成绩的函数表达式 y=0.7084x+24.702(其中x表示高等数学成绩,y表示概率论和数理统计成绩)。Step4:线性回归方程显著性的检验在置信度0.05,自由度252下,我们查询相关系数表得出,于是我们得出线性回归方程是可信的结论。4.4问题四的求解我们发现就针对高等数学,线性代数,概率论与数理统计这些课程的成绩进行分析,我们发现这两个专业学生的分数没有明
22、显差异。通过比较我们发现这两个专业的这三门课程的成绩是没有显著性差异的,所以可以说关于这个三门课程,这两个专业是差不多的,就是说个人的学习情况也可以以另外这个专业的情况为基础进行比较,也能够得到比较合理的对比结果。因此我们可以明确知道自己如果置身于另外的专业中自己所学的这三门课成绩所处于的层次水平。我们通过第二问的研究发现就针对专业进行分析,两个专业学生的数学水平没有明显差异。所以我们认为就专业而言并没有因为专业的不同而导致数学水平上的差异。所以从学生角度而言,因为数学水平是专业课程学习的基础,尤其是对理工科学生而言。另外我们根据比较常用的计算数学水平方法根据学分进行加权平均数计算从而得到数学
23、水平的一个分数值,所以学生们在学习过程中应该抓住主要矛盾,也就是高等数学上下两册。努力在学分高的科目上多一点努力,这样可以使评价个人数学水平的分数值的提高效益最大化,当然也不能在任何一门上懈怠,因为这个评价个人数学水平的分数值仍是考虑所有科目的成绩。根据以上的建模内容,我们从而知道:高等数学成绩的优劣影响着线性代数、概率论与数理统计的得分情况。所以我们认为大学本科学生需要努力学好高等数学。就我们大多数学生而言,高等数学上册是在大学一年级上学期学的,大学第二学期学生们应该是学习高等数学下册和线性代数,接着的一个下学期会学习概率论与数理统计。由此可见,高等数学在前学习,对于之后的线性代数,概率论与
24、数理统计会产生巨大的影响。数学本身就是一门基础学科,高等数学是一门基础学科中的基础,是为接下来的线性代数,概率论与数理统计打下基础的,学生们应该认真对待。而且高等数学是基础,重要的不只是那些公式,概念。最重要的是一些思路和方法,这些以后都会在线性代数,概率论与数理统计中得到应用,如果再往后说,这些东西对于专业课的学习也会产生深远的影响。综上所述,我们认为大学期间在数学类科目的学习中,高等数学,线性代数,概率论与数理统计的学习不能放松,这个是无关乎专业。尤其是高等数学,必须投入更多的精力。五、模型的评价5.1模型的优点:(1)本文建立了t检验和回归分析分析模型,模型适用范围较广,能有效地反映各专
25、业的数学水平和各科目之间的关系。(2)数据充分利用,实际可行,结果可靠,方法科学,可信度强,结果直观,适用范围广,对于问题的求解合理(3)运用SPSS软件进行求解在很大程度上减少计算的冗余度,方便快捷,易于推广5.2模型的缺点: (1)由于给出的数据有限,模型的适用范围有限,模型的正确性和适用性都需要在近一步的推广检验。(2)数据输入繁琐,易发生错误。六、模型的改进与推广可以搜集更多资料,比如学科的实用程度和受欢迎程度,作为参考融入第四问的解题中,从而可以合理地做到一方面减轻学生的学习负担,另一方面为学生择取更宜于实际运用的学科,从而将模型更好地运用到实际生活中。七、参考文献1 李云雁,胡传荣,试验设计与数据处理M,北京:化学工业出版社,2008。2 宋志刚,何旭洪,SPSS16实用教程M,北京:人民邮电出版社,2008。3 张文彤,SPSS 统计分析高级教程M,北京:高等教育出版社,2007。八、附表8.1、附表4.1-18.2、附表4.2-1-