《统计学类型数据检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学类型数据检验幻灯片.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学类型数据检验1第1页,共34页,编辑于2022年,星期二类型数据分析类型数据分析 目的目的:本讲结束后,学生们应能够:本讲结束后,学生们应能够:将类型数据整理为列联表将类型数据整理为列联表 解释卡方分布的性质解释卡方分布的性质 运用卡方分布进行同质性检验运用卡方分布进行同质性检验 运用卡方分布进行独立性检验运用卡方分布进行独立性检验 解释卡方检验的解释卡方检验的SPSS输出结果输出结果 2第2页,共34页,编辑于2022年,星期二类型数据分析类型数据分析 讲课提纲讲课提纲讲课提纲讲课提纲 列联表列联表 交叉列联表所讲述的内容交叉列联表所讲述的内容 总体之间的同质性总体之间的同质性 两个变
2、量之间的独立性两个变量之间的独立性 将统计学运用于具体情形将统计学运用于具体情形 SPSS发挥的作用发挥的作用 3第3页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容 收集抽样单位特征或特点方面的资料收集抽样单位特征或特点方面的资料整理整理 数据以反映每种类型的计数情况数据以反映每种类型的计数情况 与与“类型类型”有联系的观察值被称为有联系的观察值被称为类型数据类型数据 4第4页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容例题例题 1 根据同一特征对两个样本进行分类根据同一特征对两个样本进行分类
3、CF(商业广告片)在电视上播放之前,通常要经过检验和修改。一名商业广告片)在电视上播放之前,通常要经过检验和修改。一名软饮料生产商想在电视上播放一个新的商业广告片。他为这个广告制作软饮料生产商想在电视上播放一个新的商业广告片。他为这个广告制作了两个版本,即了两个版本,即CF-A和和CF-B。这名生产商想对广告片的两个版本进这名生产商想对广告片的两个版本进行初步的检验。为此,他将其中一个版本的广告片播放给一半观众行初步的检验。为此,他将其中一个版本的广告片播放给一半观众看,另一个版本的广告片播放给另一半观众看,然后他对这些观众看,另一个版本的广告片播放给另一半观众看,然后他对这些观众进行电话调查
4、并将他们的反应分为以下几类:进行电话调查并将他们的反应分为以下几类:不记得不记得记得记得只记得只记得广告内容广告内容 观看过的内容观看过的内容 广告中的要点广告中的要点 5第5页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容这两个不同版本的商业广告片这两个不同版本的商业广告片是否在人们头脑中留下了同样的是否在人们头脑中留下了同样的印象?印象?6第6页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容7第7页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容例题
5、例题 2根据两种特征对一个样本进行分类根据两种特征对一个样本进行分类 劳工合同期限与行业类型之间是否具有劳工合同期限与行业类型之间是否具有联系?联系?8第8页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容卡方卡方卡方卡方(2 2)分布分布分布分布 -它由一系列分布组成,其具体形状取决于一个参数,即自由度它由一系列分布组成,其具体形状取决于一个参数,即自由度(df)卡方分布是一种抽样分布卡方分布是一种抽样分布 卡方分布倾向右侧卡方分布倾向右侧随着自由度随着自由度(df)增大,卡方分布将接近正态分布增大,卡方分布将接近正态分布 9第9页,共34页,编
6、辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容df=1df=6df=10df=4 2 20 2 4 6 8 12 14 1610第10页,共34页,编辑于2022年,星期二列联表列联表-交叉列联表所讲述的内容交叉列联表所讲述的内容卡方检验的基本思想卡方检验的基本思想卡方检验的基本思想卡方检验的基本思想 -比较观察频数和期望频数比较观察频数和期望频数 如果观察频数接近期望频数,则可以作为接受原假设如果观察频数接近期望频数,则可以作为接受原假设(H0)的证据的证据 运用卡方检验运用卡方检验运用卡方检验运用卡方检验 -检验同质性检验同质性 检验拟合优度检验拟合优度
7、检验独立性检验独立性 检验总体方差是否相等检验总体方差是否相等 11第11页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 当把从两个样本中抽取的数据根据同一特征进行了分类并表示为列当把从两个样本中抽取的数据根据同一特征进行了分类并表示为列联表之后联表之后目的是检验不同总体的反应类型是否相同目的是检验不同总体的反应类型是否相同 为了回答这个问题,我们利用卡方检验来检验同质性为了回答这个问题,我们利用卡方检验来检验同质性12第12页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 例题例题 1:两个不同版本商业广告片的反应类型两个不同版本商业广告片的反应
8、类型 每种版本的商业广告片代表一个总体每种版本的商业广告片代表一个总体 每一种反应类型代表每一种反应类型代表未知未知的总体比例的总体比例 13第13页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 原假设为具有原假设为具有“同质性同质性”或或“相似的反应类型相似的反应类型”,可以将其写成,可以将其写成 H0:pA1=pB1,pA2=pB2,pA3=pB3 14第14页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 根据根据H0,pi可以被估计为可以被估计为 和和如果原假设为真,两个总体的每种反应类型都应当具有相同的比如果原假设为真,两个总体的每种反应
9、类型都应当具有相同的比例,让我们分别用一些常见的比例符号例,让我们分别用一些常见的比例符号p1,p2,p3来表示来表示 15第15页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 期望频数期望频数-16第16页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 检验统计量检验统计量 如果观察频数与期望频数相差很大,我们就认为原假设为假如果观察频数与期望频数相差很大,我们就认为原假设为假17第17页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 2=0.674+0.502+2.006+0.770+0.573+2.292=6.817 2
10、值是否过大,使得我们不得不拒绝值是否过大,使得我们不得不拒绝H0?将该值与从将该值与从 2表中获得的表中获得的“临界值临界值”进行比较进行比较查表之前需要知道查表之前需要知道 1.自由度自由度d.f.=(r1)(c1)2.右尾上面的面积右尾上面的面积()显著水平显著水平18第18页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 0 19第19页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 自由度自由度 d.f.=(21)(31)=2显著水平显著水平,=0.05=5.99临界值临界值 6.817 5.99数据显示:当显著水平数据显示:当显著水平 =0
11、.05时,检验统计量太大,因此我们应时,检验统计量太大,因此我们应当拒绝当拒绝H0观众在观看完两种不同版本的商业广告片之后,其反应类型会有观众在观看完两种不同版本的商业广告片之后,其反应类型会有明显的差异明显的差异 20第20页,共34页,编辑于2022年,星期二总体之间的同质性总体之间的同质性 进行卡方同质检验的步骤进行卡方同质检验的步骤 1.构造假设构造假设 2.建立列联表并计算期望频数建立列联表并计算期望频数 3.计算检验统计量计算检验统计量 4.计算自由度计算自由度 并查找临界值并查找临界值 5.进行决策并得出结论进行决策并得出结论 21第21页,共34页,编辑于2022年,星期二总体
12、之间的同质性总体之间的同质性 H0:各个总体的反应类型具有相同的概率各个总体的反应类型具有相同的概率 HA:与其他总体相比,有些总体的反应类型有不同的概率与其他总体相比,有些总体的反应类型有不同的概率 检验统计量检验统计量 自由度自由度=(r 1)(c 1)拒绝拒绝 H0 如果如果 2(检验统计量检验统计量检验统计量检验统计量 临界值临界值临界值临界值 )22第22页,共34页,编辑于2022年,星期二两个变量之间的独立性两个变量之间的独立性 当按照两种特征对数据进行了归类并将其表示为双向列联表时当按照两种特征对数据进行了归类并将其表示为双向列联表时 实质性问题是:这两种特征是否在总体中进行了
13、独立分布?实质性问题是:这两种特征是否在总体中进行了独立分布?为了回答这个问题,我们需要利用为了回答这个问题,我们需要利用 2 来进行独立性检验来进行独立性检验 23第23页,共34页,编辑于2022年,星期二两个变量之间的独立性两个变量之间的独立性 思考一下,当显著水平思考一下,当显著水平 =0.05时,劳工合同期限是否与行业类时,劳工合同期限是否与行业类型有联系?型有联系?24第24页,共34页,编辑于2022年,星期二两个变量之间的独立性两个变量之间的独立性 1.构造假设构造假设 H0:合同期限与行业类型相互独立合同期限与行业类型相互独立 HA:合同期限与行业类型相互不独立合同期限与行业
14、类型相互不独立 2.计算期望频数计算期望频数 如果原假设为真,则我们预计可以得到如果原假设为真,则我们预计可以得到 P(期限期限 行业行业)=P(期限期限)P(行业行业)25第25页,共34页,编辑于2022年,星期二两个变量之间的独立性两个变量之间的独立性 因此,可以根据下表计算期望频数因此,可以根据下表计算期望频数 26第26页,共34页,编辑于2022年,星期二两个变量之间的独立性两个变量之间的独立性 3.检验统计量检验统计量=4.157自由度自由度=(2 1)(3 1)=24.临界值临界值=5.995.4.157 5.99 (即检验统计量即检验统计量(即即 检验统计量检验统计量 临界值
15、临界值)28第28页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用于具体情形-SPSS发挥的作用发挥的作用 定义数据定义数据 变量图变量图 有三个变量有待定义有三个变量有待定义:行业、期限、计数行业、期限、计数 29第29页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用于具体情形-SPSS发挥的作用发挥的作用输入数据输入数据 数据图数据图 将将3栏、栏、6排数据按以下方式输入排数据按以下方式输入 根据计数衡量各种情形根据计数衡量各种情形(数据数据 衡量情形衡量情形)30第30页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用
16、于具体情形-SPSS发挥的作用发挥的作用进行分析进行分析 菜单条菜单条 1.在菜单条中单击在菜单条中单击 分析分析 描述统计学描述统计学 交叉列表交叉列表 2.将将行业行业规定为规定为行行,期限期限规定为规定为列列 单击单击小格小格小格小格 并且并且 检查期望数和各行的百分比检查期望数和各行的百分比 单击单击统计统计统计统计并且并且方方检验检验 和和Phi and Cramers V 3.单击单击OKOK31第31页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用于具体情形-SPSS发挥的作用发挥的作用 SPSS 输出结果输出结果 可以用可以用皮尔生卡方皮尔生卡方来表示卡
17、方检验统计值来表示卡方检验统计值 2 =4.157自由度自由度=2p 值值=0.125(0.05)由于由于p 值值 ,因此我们接受,因此我们接受 H0即数据支持原假设:即行业类型与合同期限是相互独立的即数据支持原假设:即行业类型与合同期限是相互独立的 32第32页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用于具体情形-SPSS发挥的作用发挥的作用行业类型与期限交叉列表行业类型与期限交叉列表 101874824514.1180.150.8245.04.1%76.3%19.6%100.0%13107351558.9113.932.2155.08.4%69.0%22.6%1
18、00.0%232948340023.0294.083.0400.05.8%73.5%20.8%100.0%计数每一类行业 的期望数 计数每一类行业 的期望数 计数每一类行业 的期望数 制造型 非制造型 行业类型 总计 少于2年2 4年4年以上期限总计33第33页,共34页,编辑于2022年,星期二将统计学运用于具体情形将统计学运用于具体情形-SPSS发挥的作用发挥的作用卡方检验卡方检验 4.157a2.1254.0582.131.0681.795400皮尔生卡方 可能性比例 线性 关系有效情形数量 数值自由度非对称的显(双侧)小格(.0%)表示期望数小于5 最小期望数为8.91 a.34第34页,共34页,编辑于2022年,星期二