《心理统计学-全套课件.ppt》由会员分享,可在线阅读,更多相关《心理统计学-全套课件.ppt(142页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、心理统计学心理统计学统计学是一种思想方法统计学是一种思想方法常用统计指标常用统计指标 概率及概率分布概率及概率分布抽样分布参数估计参数假设检验抽样分布参数估计参数假设检验平均数差异的显著性检验方差分析平均数差异的显著性检验方差分析2检验总体比率的推断检验总体比率的推断相关分析回归分析相关分析回归分析非参数检验非参数检验抽样设计抽样设计第一章统计学是一种思想方法第一章统计学是一种思想方法确定现象与随机现象确定现象与随机现象回归现象回归现象数量规律性数量规律性概率概率随机现象随机现象学生成绩学生成绩心理测验得分心理测验得分候车人数候车人数作物产量作物产量产品质量产品质量收入支出收入支出数量规律性数
2、量规律性平均数平均数方差、标准差方差、标准差比率、百分比比率、百分比相关系数相关系数数量分布数量分布双峰分布双峰分布其他分布其他分布统计学中的几个基本概念统计学中的几个基本概念随机变量随机变量总体总体有限总体与无限总体有限总体与无限总体样本样本大样本与小样本大样本与小样本参数与统计量参数与统计量返回返回数据的水平数据的水平间断型随机变量间断型随机变量连续型随机变量连续型随机变量称名量表称名量表顺序量表(等级量表)顺序量表(等级量表)等距量表等距量表等比量表等比量表间断型随机变量间断型随机变量取值个数有限的数据取值个数有限的数据人数人数个数个数名次名次五分制得分五分制得分四种数据水平四种数据水平
3、称名量表称名量表学号、房间号、邮政编码、电话号码学号、房间号、邮政编码、电话号码顺序量表(等级量表)顺序量表(等级量表)名次、等级、五分制得分名次、等级、五分制得分等距量表等距量表温度计读数、百分制得分温度计读数、百分制得分等比(比率)量表等比(比率)量表长度、时间长度、时间次数分布表次数分布表某学校学生人数按性别分类某学校学生人数按性别分类性别性别人数人数百分比百分比男生男生200040女生女生300060总和总和5000100次数分布表次数分布表某学校一年级学生语言能力测验得分次数分布表某学校一年级学生语言能力测验得分次数分布表分数分数人数人数百分比百分比低于低于20分分20-3940-5
4、960-6970-7980-8990-991001030405170544053.3310.0013.3317.0023.3318.0013.331.67总和总和300100答案答案组别组别组中值组中值次数次数(f)相对相对次数次数累积累积次数次数累积相累积相对次数对次数累积百累积百分比分比95-9990-9485-8980-8475-7970-7465-6960-6455-5997928782777267625723261411741.04.06.04.12.28.22.14.08.0250484543372312511.00.96.90.86.74.46.24.10.02100969086
5、744624102总和总和501.00次数分布图次数分布图简单次(频)数分布图简单次(频)数分布图相对次数分布图相对次数分布图累积次数分布图累积次数分布图累积相对次数分布图累积相对次数分布图简单次数分布图直方图简单次数分布图直方图简单次数分布图次数多边图简单次数分布图次数多边图次数多边图的优点次数多边图的优点累积相对次数分布图累积相对次数分布图散点图散点图轮廓图轮廓图脸谱图脸谱图第三章常用统计指标第三章常用统计指标集中量集中量算术平均数算术平均数中位数中位数众数众数加权平均数加权平均数几何平均数几何平均数调和平均数调和平均数差异量差异量全距全距平均差平均差方差与标准差方差与标准差相对差异量相对
6、差异量差异系数差异系数偏态量偏态量峰态量峰态量算术平均数算术平均数算算术术平平均均数数是是所所有有观观察察值值的的总总和和除除以以总总次数所得之商,简称为平均数或均数。次数所得之商,简称为平均数或均数。算术平均数的优点算术平均数的优点反应灵敏;反应灵敏;严密确定,简明易懂,计算方便;严密确定,简明易懂,计算方便;适合代数运算;适合代数运算;受抽样变动的影响较小;受抽样变动的影响较小;样本算术平均数是总体平均数的最好估样本算术平均数是总体平均数的最好估计值计值算术平均数的缺点算术平均数的缺点易受两极端数值(极大或极小)的影响;易受两极端数值(极大或极小)的影响;某村农户月收入状况某村农户月收入状
7、况120,127,130,131,132,132,135,136,137,139,140,145,146,149,153,158,160,320,400平均数平均数162.63一一组组数数据据中中某某个个数数值值的的大大小小不不够够确确切切时时就无法计算其算术平均数。就无法计算其算术平均数。中位数中位数中中位位数数是是位位于于依依一一定定顺顺序序排排列列的的一一组组数数据据中中央央位位置置的的数数值值,在在这这一一数数值值上上、下各有一半次数分布着。下各有一半次数分布着。中位数的原始数值计算方法:中位数的原始数值计算方法:121415151718202324:17121415151718202
8、32425:17.5中位数的应用及其优缺点中位数的应用及其优缺点中中位位数数虽虽然然也也具具备备一一个个良良好好的的集集中中量量所所应应具具备备的的某某些些条条件件,例例如如比比较较严严格格确确定定、简简明明易易懂懂,计计算算简简便便,受受抽抽样样变变动动影影响响较较小小,但但是是它它不不适适合合进进一一步步的的代代数运算。它适用于以下几种情况:数运算。它适用于以下几种情况:(1)一一组组数数据据中中有有特特大大或或特特小小两两极极端数值时;端数值时;(2)一一组组数数据据中中有有个个别别数数据据不不确确切切时;时;(3)资料属于等级性质时。)资料属于等级性质时。地位量地位量*百分位数次数百分
9、位数次数分布中相对于某个分布中相对于某个特定百分点的原始特定百分点的原始分数,它表明在分分数,它表明在分布中低于该分数的布中低于该分数的个案占总次数的百个案占总次数的百分比。分比。百分等级次数百分等级次数分布中低于特定原分布中低于特定原始分数的次数百分始分数的次数百分比。比。众数众数众数是集中量的一种指标。众数是集中量的一种指标。对对众众数数有有理理论论众众数数及及粗粗略略众众数数两两种种定定义义方法方法理理论论众众数数是是指指与与次次数数分分布布曲曲线线最最高高点点相相对对应应的横坐标上的一点。的横坐标上的一点。粗粗略略众众数数是是指指一一组组数数据据中中次次数数出出现现最最多多的的那那个数
10、。个数。众数的优缺点众数的优缺点众众数数虽虽然然简简明明易易懂懂,但但是是它它并并不不具具备备一一个个良良好好的的集集中中量量的的基基本本条条件件。它它主主要在以下情况下使用:要在以下情况下使用:当当需需要要快快速速而而粗粗略略地地找找出出一一组组数数据据的的代代表值时;表值时;当当需需要要利利用用算算术术平平均均数数、中中位位数数和和众众数数三者关系来粗略判断次数分布的形态时;三者关系来粗略判断次数分布的形态时;利利用用众众数数帮帮助助分分析析解解释释一一组组次次数数分分布布是是否确实具有两个次数最多的集中点时。否确实具有两个次数最多的集中点时。加权平均数加权平均数加权平均数是不同比重数据(
11、或平加权平均数是不同比重数据(或平均数)的平均数。计算公式为:均数)的平均数。计算公式为:几何平均数几何平均数几几何何平平均均数数是是n个个数数值值连连乘乘积积的的n次次方根。计算公式为方根。计算公式为当当一一个个数数列列的的后后一一个个数数据据是是以以前前一一个个数数据据为为基基础础成成比比例例增增长长时时,要要用用几几何何平平均数求其平均增长率。均数求其平均增长率。差异量差异量差差异异量量用用于于表表示示数数据据的的变变异异程程度度或或离离散散程程度度。常常用用的的差差异异量量有有全全距距、平平均均差、方差、标准差和差异系数等。差、方差、标准差和差异系数等。全距全距全全距距指指一一组组数数
12、据据中中最最大大值值与与最最小小值值之差。之差。优优点点:概概念念清清楚楚,意意义义明明确确,计计算算简单;简单;缺缺点点:容容易易受受极极端端数数值值的的影影响响,反反应不灵敏。应不灵敏。平均差平均差平平均均差差就就是是每每一一个个数数据据与与该该组组数数据据的的中中位位数数(或或算算术术平平均均数数)离离差差的的绝绝对对值值的的算算术术平平均均数。数。计算公式:计算公式:总体的方差和标准差总体的方差和标准差方差:指离差平方的算术平均数方差:指离差平方的算术平均数定义公式和计算公式:定义公式和计算公式:标准差标准差标准差是指离差平方和平均后的方标准差是指离差平方和平均后的方根。即方差的平方根
13、。根。即方差的平方根。定义公式和计算公式:定义公式和计算公式:样本的方差与标准差样本的方差与标准差样本的方差样本的方差样本的标准差样本的标准差相对差异量(差异系数)相对差异量(差异系数)差差异异系系数数:标标准准差差与与其其算算术术平平均均数数的百分比。的百分比。其计算公式为其计算公式为用途:用途:两种单位不同两种单位不同单单位位相相同同而而两两个个平平均均数数相相差差较较大大的的资料。资料。第四章概率及概率分布第四章概率及概率分布概率的一般概念概率的一般概念后验概率先验概率后验概率先验概率概率的性质概率的性质概率的加法和乘法概率的加法和乘法二项分布二项分布正态分布正态分布概率的统计定义概率的
14、统计定义后验概率后验概率以随机事件以随机事件A在大量重复试验中出现的稳在大量重复试验中出现的稳定频率值作为随机事件定频率值作为随机事件A概率的估计值,概率的估计值,这样获得的概率称为后验概率。计算公这样获得的概率称为后验概率。计算公式为:式为:硬币朝向试验硬币朝向试验试验者试验者抛掷次数抛掷次数正面朝上次数正面朝上次数 正面朝上比率正面朝上比率德摩根德摩根蒲丰蒲丰皮尔逊皮尔逊皮尔逊皮尔逊20484040120002400010612048601912012.5181.5069.5016.5005概率的古典定义概率的古典定义先验概率先验概率是通过古典概率模型加以定义的,该模型要是通过古典概率模型
15、加以定义的,该模型要求满足两个条件:(求满足两个条件:(1)试验的所有可能结果)试验的所有可能结果是有限的;(是有限的;(2)每一种可能结果出现的可能)每一种可能结果出现的可能性(概率)相等。若所有可能结果的总数为性(概率)相等。若所有可能结果的总数为n,随机事件,随机事件A包括包括m个可能结果,则事件个可能结果,则事件A的的概率计算公式为:概率计算公式为:概率的性质概率的性质任任何何随随机机事事件件A的的概概率率都都是是介介于于0与与1之之间间的正数;的正数;不可能事件的概率等于不可能事件的概率等于0;必然事件的概率等于必然事件的概率等于1。小概率事件小概率事件P.05P.01概率的加法概率
16、的加法在在一一次次试试验验中中不不可可能能同同时时出出现现的的事事件件称称为为互互不不相容相容的事件。的事件。两两个个互互不不相相容容事事件件和和的的概概率率,等等于于这这两两个个事事件件概率之和。用公式表示为:概率之和。用公式表示为:P(A+B)=P(A)+P(B)其推广形式是其推广形式是P(A1+A2+An)=P(A1)+P(A2)+P(An)例题例题某学生从某学生从5个试题中任意抽选一题,如个试题中任意抽选一题,如果抽到每一题的概率为果抽到每一题的概率为1/5,则抽到试,则抽到试题题1或试题或试题2的概率为多少?的概率为多少?概率的乘法概率的乘法A事事件件出出现现的的概概率率不不影影响响
17、B事事件件出出现现的的概概率,这两个事件为率,这两个事件为独立事件独立事件。两两个个独独立立事事件件积积的的概概率率,等等于于这这两两个个事事件概率的乘积。用公式表示为:件概率的乘积。用公式表示为:P(A B)=P(A)P(B)其推广形式是其推广形式是P(A1A2An)=P(A1)P(A2)P(An)例题例题上例中,如果第一个学生把抽出的试题上例中,如果第一个学生把抽出的试题还回后,第二个学生再抽,则两个学生还回后,第二个学生再抽,则两个学生都抽第一题的概率为多少?都抽第一题的概率为多少?基础比率基础比率假设癌症患者占总人口的比例为假设癌症患者占总人口的比例为1%,癌,癌症患者在症患者在X光检
18、查中有光检查中有80%呈阳性,未患呈阳性,未患癌症的人在癌症的人在X光检查中有光检查中有10%呈阳性。现呈阳性。现在有一个人在在有一个人在X光检查中呈阳性,问这个光检查中呈阳性,问这个人患癌症的概率是多大?人患癌症的概率是多大?基础比率基础比率基础比率基础比率在一个城市中,有两个出租车公司。甲在一个城市中,有两个出租车公司。甲公司都是绿色车,占公司都是绿色车,占85%,乙公司都是,乙公司都是蓝色车,占蓝色车,占15%。一天晚上发生了严重。一天晚上发生了严重车祸。有一个目击证人说是蓝色车。在车祸。有一个目击证人说是蓝色车。在相同的条件下测得该目击证人辨别蓝色相同的条件下测得该目击证人辨别蓝色车和
19、绿色车的正确率为车和绿色车的正确率为80%。问:肇事。问:肇事车是蓝色车的概率是多大?车是蓝色车的概率是多大?基础比率基础比率二项试验与二项分布二项试验与二项分布满足以下条件的试验称为二项试验:满足以下条件的试验称为二项试验:一次试验只有两种可能结果,即成功和一次试验只有两种可能结果,即成功和失败;失败;各次试验相互独立,互不影响各次试验相互独立,互不影响各次试验中成功的概率相等。各次试验中成功的概率相等。问题问题一个学生全凭猜测答一个学生全凭猜测答2道是非题,则答对道是非题,则答对0、1、2题的概率是多大?题的概率是多大?如果是如果是3道题、道题、4道题呢?道题呢?2道是非题的情况道是非题的
20、情况TTTF,FTFF答对答对2题题答对答对1题题答对答对0题题1种种2种种1种种3道是非题的情况道是非题的情况TTTTTF,TFT,FTTTFF,FTF,FFTFFF答对答对3题题答对答对2题题答对答对1题题答对答对0题题1种种3种种3种种1种种4道是非题的情况道是非题的情况TTTTTTTF,TTFT,TFTT,FTTTTTFF,TFFT,FFTT,TFTF,FTTF,FTFTTFFF,FTFF,FFTF,FFFTFFFF答对答对4题题 答对答对3题题 答对答对2题题 答对答对1题题 答对答对0题题1种种4种种6种种4种种1种种二项分布函数二项分布函数用用n次次方方的的二二项项展展开开式式来
21、来表表达达在在n次次二二项项试试 验验 中中 成成 功功 事事 件件 出出 现现 不不 同同 次次 数数(X=0,1,n)的概率分布叫做二项分布。)的概率分布叫做二项分布。二项展开式的通式就是二项分布函数,运二项展开式的通式就是二项分布函数,运用这一函数式可以直接求出成功事件恰好用这一函数式可以直接求出成功事件恰好出现出现X次的概率:次的概率:二项分布图二项分布图二项分布图二项分布图从从二二项项分分布布图图可可以以看看出出,当当p=q,不不管管n 多大,二项分布呈对称形。多大,二项分布呈对称形。当当n 很很大大时时,二二项项分分布布接接近近于于正正态态分分布布。当当n趋趋近近于于无无限限大大时
22、时,正正态态分分布布是是二二项项分布的极限。分布的极限。当当p.5时时设某厂产品合格率为设某厂产品合格率为90%,抽取,抽取3个进行个进行检验,求合格品个数分别为检验,求合格品个数分别为0,1,2,3的概率?的概率?当当p=.9,q=.1时时检验结果检验结果概率概率结果结果AAAAABABABAAABBBABBBABBBpppppqppqppqpqqpqqpqqqqq.729.081.081.081.009.009.009.001合计合计1.00二项分布的平均数和标准差二项分布的平均数和标准差当当二二项项分分布布接接近近于于正正态态分分布布时时,在在n次次二二项项实实验验中中成成功功事事件件出
23、出现现次次数数的的平平均均数数和和标准差分别为:标准差分别为:=np和和二项分布的应用二项分布的应用做对题数做对题数可能结果数可能结果数概率概率累积概率累积概率PXx010.0010.0011100.0100.0112450.0440.05531200.1170.17242100.2050.37752520.2460.62362100.2050.82871200.1170.9458450.0440.9899100.0100.9991010.0011.000总和总和10241.000正态分布正态分布正态分布正态分布正态分布概率密度函数正态分布概率密度函数标准正态分布标准正态分布标准正态分布函数标
24、准正态分布函数其中其中Z=(X)/正态分布表正态分布表根据根据Z分数分数查查概率概率根据根据概率概率查查Z分数分数练习题练习题设设XN(,2),求以下概率:,求以下概率:(1)P-X=+(2)P-3X=+3(3)P-1.96X=-(4)PX+正态分布的简单应用正态分布的简单应用标准分数体系标准分数体系T=KZ+C确定录取分数线确定录取分数线确定等级评定的人数确定等级评定的人数品质评定数量化品质评定数量化练习题练习题某年高考平均分某年高考平均分500,标准差,标准差100,考分,考分呈正态分布,某考生得到呈正态分布,某考生得到650分。设当年分。设当年高考录取率为高考录取率为10,问该生能否被录
25、取,问该生能否被录取?练习题答案练习题答案Z=1.5,P=.933录取分数线:录取分数线:500+1.28*100=628练习题练习题某地区某地区47000人参加高考,物理学平均分人参加高考,物理学平均分为为57.08,标准差为,标准差为18.04。问:。问:(1)成绩在)成绩在90以上有多少人?以上有多少人?(2)成绩在)成绩在8090之间有多少人?之间有多少人?(3)60分以下有多少人?分以下有多少人?练习题答案练习题答案(1)成绩在)成绩在90以上有多少人?以上有多少人?0.03438,1615.86(2)成绩在)成绩在8090之间有多少人?之间有多少人?0.06766,3180(3)6
26、0分以下有多少人?分以下有多少人?0.56356,26487第五章推断统计学基本原理第五章推断统计学基本原理抽样分布抽样分布参数估计参数估计假设检验假设检验抽样分布是参数估计与假设检验的抽样分布是参数估计与假设检验的理论基础理论基础三种不同性质的分布三种不同性质的分布总体分布:总体内个体数值的次数分布。总体分布:总体内个体数值的次数分布。样本分布:样本内个体数值的次数分布。样本分布:样本内个体数值的次数分布。抽样分布:根据样本(抽样分布:根据样本(X1,X2,Xn)所有可能的样本观察值计算出来的某一)所有可能的样本观察值计算出来的某一种种统计量的观察值统计量的观察值的概率分布。的概率分布。例如
27、:若(例如:若(X1,X2,Xn)是抽自总体)是抽自总体X的一个容量为的一个容量为n 的简单随机样本,则依据的简单随机样本,则依据所有可能样本的观察值计算出的样本均值所有可能样本的观察值计算出的样本均值的分布,称为样本均值的抽样分布。的分布,称为样本均值的抽样分布。抽样方法抽样方法单纯随机抽样单纯随机抽样机械抽样机械抽样分层抽样分层抽样整群抽样整群抽样总体分布到抽样分布总体分布到抽样分布总体总体X的概率分布的概率分布这是一个均匀分布总体这是一个均匀分布总体住户住户第一户第一户 第二户第二户 第三户第三户 第四户第四户 第五户第五户日支出日支出(X)2025303540户数户数11111概率概率
28、0.200.200.200.200.20样本(样本(n=2)的所有可能结果)的所有可能结果第一户第一户第二户第二户第三户第三户第四户第四户第五户第五户第一户第一户(20,20)M=20(25,20)M=22.5(30,20)M=25(35,20)M=27.5(40,20)M=30第二户第二户(20,25)M=22.5(25,25)M=25(30,25)M=27.5(35,25)M=30(40,25)M=32.5第三户第三户(20,30)M=25(25,30)M=27.5(30,30)M=30(35,30)M=32.5(40,30)M=35第四户第四户(20,35)M=27.5(25,35)M=
29、30(30,35)M=32.5(35,35)M=35(40,35)M=37.5第五户第五户(20,40)M=30(25,40)M=32.5(30,40)M=35(35,40)M=37.5(40,40)M=40样本(样本(n=2)的平均数的抽样分布)的平均数的抽样分布平均数平均数2022.52527.53032.53537.540次数次数123454321概率概率.04.08.12.16.20.16.12.08.04样本样本(n=2)的平均数的抽样分布图的平均数的抽样分布图不同总体情况下的抽样分布不同总体情况下的抽样分布抽样分布的定理抽样分布的定理设总体设总体X服从分布服从分布F(x),(,(X
30、1,X2,Xn)是抽自该总体的一个简单随机样本,)是抽自该总体的一个简单随机样本,总体均值与样本均值、总体方差与样本总体均值与样本均值、总体方差与样本均值的方差有如下关系:均值的方差有如下关系:抽样分布的定理抽样分布的定理从总体中随机抽出容量为从总体中随机抽出容量为n的一切可能样的一切可能样本的平均数之平均数等于总体的平均数;本的平均数之平均数等于总体的平均数;从总体中随机抽出容量为从总体中随机抽出容量为n的一切可能样的一切可能样本的平均数的方差,等于总体方差除以本的平均数的方差,等于总体方差除以n样本均值的抽样分布(样本均值的抽样分布(2已知已知)若(若(X1,X2,Xn)是抽自总体)是抽自
31、总体X的一个容量为的一个容量为n的简单随机样本,则依据的简单随机样本,则依据样本的所有可能观察值计算出的样本均样本的所有可能观察值计算出的样本均值的分布,称为样本均值的抽样分布。值的分布,称为样本均值的抽样分布。样本均值的抽样分布样本均值的抽样分布定理定理设(设(X1,X2,Xn)是抽自正态分)是抽自正态分布总体布总体XN(,2)的一个容量为的一个容量为n的简单的简单随机样本,则其样本均值也是一个正态随机样本,则其样本均值也是一个正态分布随机变量,且有分布随机变量,且有样本均值的抽样分布样本均值的抽样分布例题例题某类产品的强度服从正态分布,总体平某类产品的强度服从正态分布,总体平均数为均数为1
32、00,总体标准差为,总体标准差为5。从该总体。从该总体中抽取一个容量为中抽取一个容量为25的简单随机样本,的简单随机样本,求这一样本的样本均值介于求这一样本的样本均值介于99101的概的概率。如果容量为率。如果容量为100呢?呢?样本均值的抽样分布(样本均值的抽样分布(2已知已知)非正态总体、非正态总体、已知时已知时设总体设总体X的均值的均值和和2,当样本容量趋,当样本容量趋向无穷大时,样本均值的抽样分布趋于向无穷大时,样本均值的抽样分布趋于正态分布,且样本均值的数学期望和方正态分布,且样本均值的数学期望和方差分别为差分别为例题例题某类产品的强度不服从正态分布,某类产品的强度不服从正态分布,总
33、体平均数为总体平均数为100,总体标准差为,总体标准差为5。从该总体中抽取一个容量分别为从该总体中抽取一个容量分别为25的简单随机样本,求这一样本的样的简单随机样本,求这一样本的样本均值介于本均值介于99101的概率。如果容的概率。如果容量为量为100呢?呢?参数估计参数估计用样本统计量的来估计相应总体参数,称用样本统计量的来估计相应总体参数,称为为参数估计参数估计判断判断估计量估计量优劣的标准优劣的标准无偏性无偏性有效性有效性一致性一致性充分性充分性参数估计的基本方式参数估计的基本方式点估计点估计用用某某一一样样本本统统计计量量的的值值来来估估计计相相应应总总体体参参数数的值叫总体参数的的值
34、叫总体参数的点估计点估计。区间估计区间估计以样本统计量的抽样分布(概率分布)为理以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参值估计总体参数值的所在范围,称为总体参数的数的区间估计区间估计。区间估计区间估计示意图示意图区间估计的基础抽样分布区间估计的基础抽样分布根据抽样分布的原理,可得到不同条件根据抽样分布的原理,可得到不同条件下总体参数的区间估计的计算方法下总体参数的区间估计的计算方法区间估计涉及置信水平和置信区间。区间估计涉及置信水平和置信区间。例题例题某种零件的长度服从正态分布。已知
35、总某种零件的长度服从正态分布。已知总体标准差体标准差=1.5厘米。从总体中抽取厘米。从总体中抽取100个零件组成样本,测得它们的平均长度个零件组成样本,测得它们的平均长度为为10.00厘米。试估计在厘米。试估计在95%置信水平下,置信水平下,全部零件平均长度的置信区间。全部零件平均长度的置信区间。假设检验假设检验假设检验回答的问题假设检验回答的问题某总体平均水平有无显著变化?某总体平均水平有无显著变化?两总体平均水平有无显著差异?两总体平均水平有无显著差异?多个总体平均水平有无显著差异?多个总体平均水平有无显著差异?两个或多个总体方差有无显著差异?两个或多个总体方差有无显著差异?以上:参数假设
36、检验以上:参数假设检验某总体是否服从正态分布(或其他分布)某总体是否服从正态分布(或其他分布)?某串数据是否随机?某串数据是否随机?以上:非参数假设检验以上:非参数假设检验非参数假设检验举例非参数假设检验举例单样本游程检验单样本游程检验某食堂窗口前排队性别规律性:某食堂窗口前排队性别规律性:F M F M F F F F F M M M F F M MF M F M F M F M F M F M F M F MF F F F F F F F M M M M M M M MM M M M M M M M F F F F F F F FF M F M F F F F F M M M F F M
37、MF M F M F M F M F M F M F M F MF F F F F F F F M M M M M M M MM M M M M M M M F F F F F F F F假设检验假设检验利用样本信息利用样本信息根据一定概率根据一定概率对总体参数或对总体参数或分布的分布的某一假设作出某一假设作出拒绝拒绝或保留的或保留的决断决断称为称为假设检验假设检验假设假设有两个相互对立的假设有两个相互对立的假设即零假设(或称原假设、虚无假设、解消假即零假设(或称原假设、虚无假设、解消假设)设)备择假设(或称研究假设、对立假设)备择假设(或称研究假设、对立假设)假设检验是从零假设出发,视其被拒
38、绝的机会,假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。从而得出决断。假设检验假设检验示意图示意图显著性水平显著性水平拒绝零假设的概率称为显著性水平拒绝零假设的概率称为显著性水平。显著性水平和可靠性程度(置信水平)显著性水平和可靠性程度(置信水平)之间的关系是:两者之和为之间的关系是:两者之和为1。双侧检验与单侧检验双侧检验与单侧检验双侧检验:零假设为无显著差异的情况;双侧检验:零假设为无显著差异的情况;左侧检验:零假设为大于等于的情况;左侧检验:零假设为大于等于的情况;右侧检验:零假设为小于等于的情况。右侧检验:零假设为小于等于的情况。例题例题某小学历届毕业生汉语拼音测验平均分某小
39、学历届毕业生汉语拼音测验平均分数为数为66分,标准差为分,标准差为10分。现以同样的分。现以同样的试题测验应届毕业生(假定应届与历届试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽毕业生条件基本相同),并从中随机抽取取25份试卷,算得平均分为份试卷,算得平均分为69分,问该分,问该校应届与历届毕业生汉语拼音测验成绩校应届与历届毕业生汉语拼音测验成绩是否一样?是否一样?统计决断的两类错误统计决断的两类错误第一类型的错误第一类型的错误错误错误拒绝了属于真实的零假设。这种错误的可能拒绝了属于真实的零假设。这种错误的可能性大小正是显著性水平的大小性大小正是显著性水平的大小水平未变而
40、认为有显著差异水平未变而认为有显著差异第二类型的错误第二类型的错误错误错误保留了属于不真实的零假设保留了属于不真实的零假设水平显著差异而认为无显著差异水平显著差异而认为无显著差异第六章相关第六章相关相关的意义相关的意义积差相关积差相关等级相关等级相关质与量的相关质与量的相关相关的意义相关的意义相关的概念相关的概念两个变量之间不精确、不稳定的变化关系称两个变量之间不精确、不稳定的变化关系称为相关关系。为相关关系。相关系数相关系数用来描述两个变量相互之间变化方向及密切用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。一般用程度的数字特征量称为相关系数。一般用r 表示。表示。正相关
41、正相关负相关负相关零相关零相关相关系数相关系数相关系数的值,仅仅是一个比值,不等相关系数的值,仅仅是一个比值,不等距),也不是百分比,因此,不能直接距),也不是百分比,因此,不能直接作加、减、乘、除。作加、减、乘、除。相关不等于因果:相关系数只能描述两相关不等于因果:相关系数只能描述两个变量之间的变化方向及密切程度,并个变量之间的变化方向及密切程度,并不能揭示二者之间的内在本质联系。不能揭示二者之间的内在本质联系。积差相关积差相关积差相关的概念积差相关的概念当两个变量都是正态连续变量,而且两者之当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关间呈线性关系,表示这两个
42、变量之间的相关称为积差相关。称为积差相关。积差相关系数的定义和计算积差相关系数的定义和计算协方差是积差相关系数的基础,它是两协方差是积差相关系数的基础,它是两个变量离差乘积之和除以个变量离差乘积之和除以n所得之商。其所得之商。其公式为:公式为:积差相关系数的定义和计算积差相关系数的定义和计算积差相关系数是协方差除以两个变量的积差相关系数是协方差除以两个变量的标准差。其公式为:标准差。其公式为:用原始数据直接计算,则用原始数据直接计算,则例题例题为研究某测验的预测效度,在被录取的为研究某测验的预测效度,在被录取的高考考生中随机抽取高考考生中随机抽取10人,测得他们的人,测得他们的能力测验得分(能
43、力测验得分(X),对他们进行跟踪研对他们进行跟踪研究,求得他们大学一、二年级有关科目究,求得他们大学一、二年级有关科目平均分数(平均分数(Y),求该测验的效度。求该测验的效度。X74 71 80 85 76 7777 68 74 74 756Y82 75 81 89 82 8988 84 80 87 837等级相关等级相关等级相关是指以等级次序排列或以等级等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。次序表示的变量之间的相关。斯皮尔曼等级相关斯皮尔曼等级相关肯德尔和谐系数肯德尔和谐系数斯皮尔曼等级相关斯皮尔曼等级相关概念及其适用范围概念及其适用范围当两个变量值以等级次序排列或以等
44、级次序当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于样本容量也不一定大于30,表示这两个变量,表示这两个变量之间的相关,称为斯皮尔曼等级相关。之间的相关,称为斯皮尔曼等级相关。斯皮尔曼等级相关系数的计算斯皮尔曼等级相关系数的计算例题例题为了研究儿童问题行为与母亲耐心程度为了研究儿童问题行为与母亲耐心程度的关系,抽取的关系,抽取10个家庭,让儿童与其母个家庭,让儿童与其母亲一起完成一件需要相互配合才能完成亲一起完成一件需要相互配合才能完成的工作,观测并纪录他们的表现。下表的工作,观测并纪录他们的表现。下表
45、为儿童问题程度分数(为儿童问题程度分数(X)与母亲的不耐)与母亲的不耐心程度分数(心程度分数(Y),分数值越大表明问题),分数值越大表明问题或不耐心程度越大。请计算两者之间相或不耐心程度越大。请计算两者之间相关系数?关系数?X72 40 52 87 39 95 12 64 49 46Y79 62 53 89 81 90 10 82 78 70例题例题相关系数:相关系数:0.72肯德尔和谐系数肯德尔和谐系数当多个(两个以上)变量值以等级次序当多个(两个以上)变量值以等级次序排列或以等级次序表示,这几个变量之排列或以等级次序表示,这几个变量之间的一致性程度(即相关),称为肯德间的一致性程度(即相关
46、),称为肯德尔和谐系数。尔和谐系数。例题例题学生学生n=6评定者评定者1234123456342615431526213645134526肯德尔和谐系数的计算肯德尔和谐系数的计算无相同等级的情况无相同等级的情况肯德尔和谐系数的计算肯德尔和谐系数的计算有相同等级的情况有相同等级的情况质与量的相关质与量的相关质与量的相关是指一个变量为质,另一质与量的相关是指一个变量为质,另一个变量为量,这两个变量之间的相关。个变量为量,这两个变量之间的相关。双列相关双列相关概念及其适用范围概念及其适用范围当当两两个个变变量量都都是是正正态态连连续续变变量量,其其中中一一个个变变量量被被人人为为地地划划分分成成二二
47、分分变变量量,表表示示这这两两个个变变量之间的相关,称为双列相关。量之间的相关,称为双列相关。双列相关的使用条件是:双列相关的使用条件是:(1)两两个个变变量量都都是是连连续续变变量量,且且总总体体呈呈正正态态分分布,或接近正态分布,至少是单峰对称分布。布,或接近正态分布,至少是单峰对称分布。(2)两个变量之间是线性关系)两个变量之间是线性关系(3)二二分分变变量量是是人人为为划划分分的的,其其分分界界点点应应尽尽量量靠近中值。靠近中值。(4)样本容量应大于)样本容量应大于80。双列相关相关系数的计算双列相关相关系数的计算点双列相关点双列相关概念及其适用范围概念及其适用范围当两个变量其中一个是
48、正态连续性变量,另当两个变量其中一个是正态连续性变量,另一个是真正的二分名义变量,这时,表示这一个是真正的二分名义变量,这时,表示这两个变量之间的相关,称为点双列相关。有两个变量之间的相关,称为点双列相关。有时一个变量虽然并非真正的二分变量,而是时一个变量虽然并非真正的二分变量,而是双峰分布的变量,也可以用点双列相关来表双峰分布的变量,也可以用点双列相关来表示。示。点双列相关系数的计算点双列相关系数的计算例题例题根据下表求问答题的区分度根据下表求问答题的区分度考生考生ABCDEFGHIJ问答题得分问答题得分7674744476卷面总分卷面总分755773656756636165 67例题例题根
49、据下表求选择题的区分度根据下表求选择题的区分度考生考生ABCDEFGHIJ选择题得分选择题得分1111001001卷面总分卷面总分755773656756636165 67例题答案例题答案问答题的区分度:问答题的区分度:0.640选择题的区分度:选择题的区分度:0.372多系列相关多系列相关概念及其适用范围概念及其适用范围当两个变量都是正态连续变量,其中一个变当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别(两类以量按不同质被人为地分成多种类别(两类以上)的正态名义变量。表示正态连续变量与上)的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关,称为多系列多类正态名义变量之间的相关,称为多系列相关。相关。