《次数文件分析之检验.docx》由会员分享,可在线阅读,更多相关《次数文件分析之检验.docx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章次数资料分析2检验前面介绍了计量资料的统计分析方法 t检验法与方差分 析法。在畜牧、水产等科学研究中,除了分析计量资料以外,还 常常需要对次数资料、等级资料进行分析。等级资料实际上也是 一种次数资料。次数资料服从二项分布或多项分布,其统计分析 方法不同于服从正态分布的计量资料。本章将分不介绍对次数资 料、等级资料进行统计分析的方法。第一节/统计量与/分布一、/统计量的意义为了便于理解,现结合一实例讲明/(读作卡方)统计量的 意义。依照遗传学理论,动物的性不比例是1。统计某羊场一 年所产的876只羔羊中,有公羔428只,母羔448只。按L1的性不 比例计算,公、母羔均应为438只。以A表示
2、实际观看次数,T表 示理论次数,可将上述情况列成表7-1。表7-1羔羊性不实际观看次数与理论次数性不 实际观看次数力 理论次数7A-7 (小乃7TF 428 (%)438 (.)=400,2283或 71=250-140. 625-46. 875-46. 875=15. 625由表75可知 当8.972,由/3查值表得: 藐=7.815, o.01(3)-11. 345o 因为 - V 2。01 ,故 0.01火0.05, 说明实际观看次数与理论观看次数差异显著,即该资料不符合 9 : 3 : 3 : 1的遗传规律,有必要进一步检验,以具体确定哪样 的表现型的实际观看次数不符合9:3 : 3:
3、 1的比例。这时须采 纳z检验的再分割法。2检验的再分割法的具体作法是:将一张列联表的总2统计 量,分割为数目等于该表总自由度的多个重量。每个重量的2 值对应于由原始数据所产生的一专门列联表,且每个重量独立于 其它重量,如此各重量的“值之和等于总2值。这种可加性只 有在所分割的列联表是相互独立、各重量的2值不作矫正的条 件下成立。下面我们利用z检验的再分割法对例7.3的资料进行进 一步检验。1 .检验AB, A-bb, aaB- 3种表现型是否符合9 : 3 : 3的 比例。分割后z值(记为尤)的计算见表75。表75 %;计算表(理论比例9 : 3 : 3)表现型实际观看次数力理论次数TA-T
4、(A-T) -/TA-B-152146. 4005. 6000.214A-bb3948. 800-9. 8001.968aaB-5348. 8004.2000. 361总和24424402. 543z:=0.214+1. 968+0. 361=2. 543由 必=3-1=2,查 2值表得,o.o52)=5.991, 一 1,05, 分0.05,说明实际观看次数与理论观看次数差异不显著,能够认 为3种表现型符合9 :3: 3的理论比例。因此,我们再分析表现 型函助是否与其它三种表现型的合并组比例不符合1:15的理论 比例。2 .检验aabb表现型与其它三种表现型的合并组是否符合 1:15的比例,
5、分割后z值(记为月)的计算见表7-6。表76公分割表(理论比例1 : 15)表现型实际观看次数力理论次数TA-T(A-T) 2/Taabb615. 625-9.6255. 929其它三种表现型合并组244234.3759. 6250. 395总和250250. 00006. 324月二5. 929+0. 395=6. 324由1=1,查 表得,o.05(i2)=3. 841, V.o5(d=6. 635,由于1.05山 l.oi,故0.01火0.05,说明实际观看次数与理论次数差异显著,即物仍表现型与其它三种表现型组 合不符合1 : 15的比例,如此的结论可为我们进一步研究那个问 题提供线索。
6、2经分割后,宕二2.543,/二6.324, 一 +公=8.867与总J8.922略有差异,这是由于计算的舍入误差所造成;总自由 度/3, df尸2, dfK,因此总止”+小。假如分割后z值或 自由度之和不等于z值或总自由度,讲明所分割的列联表相互 不独立。四、资料分布类型的适合性检验实际观测得来的资料是否服从某种理论分布,亦可应用适合性 检验来推断。在正态分布的适合性检验中,由于理论次数是由样 本总次数、平均数与标准差决定的,用去3个自由度,因此自由 度为k-3 (左为组数);而在二项分布和波松分布的适合性检验中, 由于其理论次数由总次数与均数求得,丧失2个自由度,因此自 由度为4-2。但应
7、注意,当组段内理论次数小于5时,必须与相 邻组段进行合并,直至合并的理论次数大于5时为止。下面分不 举例讲明。(一)实际观测资料服从正态分布的适合性检验【例7.4】检验200头大白猪仔猪一月窝重的资料是否服从 正态分布。表77 200头大白猪仔猪一月龄窝重服从正态分布的适合性检验表组限 (1)组中 值6)(2)实际次数 (/) (3)上限 (7) (4)1-x(5)U=x-x)/S(6)累加概率(H)(7)各组概率 (8)理论次数 (9)Z (10)7A J11246.42. 070. 98080. 9922.40. 02444.88(h2.288卜8. 72 J1.552112-116120
8、54.42.420.01140. 3393120U 0. 0078合计2001.0000200. 008. 73081、先将资料(原始数据略)整理成次数分布表,组限、组中值、各组的次数列于表7-7的(1)、(2)、(3)栏,再将各组上 限列于第(4)栏中。2、计算各组组上限与均数(元=65. 6kg)之差,列于第(5)栏。3、计算校正标准差S.。由于由分组资料求得的标准差较不分组时所得标准差为大,故需作校正。Sc = ZA2-nV296192。一嗽200-1 =22.44()4、依公式求各组上限的正态离差,列入第6栏。如第 Sc一组 =2 =5722.445、设该资料服从正态分布,依值查正态分
9、布表得各组段的 累计概率(a),列入第(7)栏。如当尸-2. 57时,才0.0051,产0.29 时,牛0.6141。6、求出每一组段的概率,列入第(8)栏。由下一组段的累加概率减去本组段的累加概率而得。如8组段的概率为0. 0136-0. 0051=0. 0085 o7、以总数炉200头乘以各组概率便得理论次数,列入第(9) 栏。凡理论值小于5者应加以合并。本例前三组与后三组分不合 并。合并后的实际次数与理论次数分不为10与6. 44、7与8. 72, 见第与第(9)栏。8、求各组z值,列入第(10)栏。9、确定自由度。那个地点是因为求理论次数时用去均数,标 准差与总次数三个统计量,该例经合
10、并共12个组,故d户12-3二9。10、结论。由力三9查,表得:=16.919,而计算所 得的2值为: J8.7808,因为 lo5,处0.05,说明各组 实际次数与由正态分布计算的理论次数差异不显著,能够认为大 白猪仔猪一月窝重服从正态分布。(二)实际观测资料服从二项分布的适合性检验【例7. 5】用800粒牧草种子进行发芽试验,分80行,每行 10粒种子,共有174粒发芽。那么每粒种子发芽的概率约为 174/800=0.2175,不发芽的概率约为0. 7825 (即1-0.2175),每 行发芽种子数见表78,问该资料是否服从二项分布。表78 80行发芽试验资料服从二项分布的适合性检验计算表
11、一行内种子发芽数实际行数力理论概率理论行数TX2=(A-T)2/T060. 08616. 88800. 11451200. 239219. 13600. 03902280. 299223. 93600. 69003120. 221817. 74401.859448、0. 10798. 632(?|560. 03602. 8800600. 00830. 664070 ,140. 00130. 1040,12. 36000.2176800. 00010. 08001910000. 00000. 00000. 00000. 0000总和802. 9205表中理论概率由二项分布概率计算公式:计算,如C
12、mP010 = xO.2175 xO.782510 =0.0861 ; 1010!0!=x0.2175 xO.78259 = 0.2392 ;表中的理论行数由理论概率乘以80行而得,如0.0861 80=6.8880,0.2392 80=19. 1360由于表中后6组的理论次数均小于5,故将后6组与第5组合 并为一组。并组以后,资料分为5组。由表78可知, 当2.9025。由 5-2=3,查”值表得:I/=7.81,因为z0. 05,说明实际行数与由二 项分布计算得来的理论行数差异不显著,能够认为种子发芽试验 的结果服从二项分布。(三)实际观测资料服从波松分布的适合性检验【例7.6 用显微镜检
13、查某样品内结核菌的数目,对某些视 野内各小方格的结核菌数计数,然后按不同的结核菌数目把格子 分类,记录每类的格子数。其结果见表7-9第(1)、(2)栏。 试检验结核菌数是否服从波松分布。1 .计算理论概率设结核菌数服从波松分布(入),其概率 计算公式为:pm =一工0)(75)其中人为平均数,且等于方差。2。现在因入未知,可利用样本平均数上来可能。利用加权法求样本平均数元为:_ = = 5x0 + 19x1 + .+ 1x9=2j983118表7-9结核菌数服从波松分布适合性检验计算表结核菌数X (1)实际格子数(F刁) (2)理论概率(3)理论格子数(。(4)(A-T) -/r(5)050.
14、 05061190. 15115. 97080. 15782260. 225317. 82980. 17683260. 224026. 58540.01294210. 167126. 43200. 00715130. 099719.71780. 0834650. 04965. 85287180. 02112. 4898 19. 58180. 1297810. 00790. 93220. 2611910. 00260. 3068总计1180. 9990117. 88200. 7288将工代入(75)式,求得各项理论概率为P(x = k)= 2-983 62.983,m = 0J2,9女计算结果列
15、于第(3)栏。2 .计算理论次数 将总次数沪118乘以各组的理论概率即得 各组理论次数兀计算结果列于第(4)栏。由于表后4组的理 论次数小于5,故将后4组与第7组合并为一组,合并后的实际 格子数为8,理论格子数为9.5818。3 .计算2值 依照表79第(5)栏的数据可得,值为: 力2 = (221 = 0 7288因为此例经并组后的分组数为7;计算理论次数利用了样本平 均数和总次数,因此自由度为7-2二5。当公5时,查,值表得:1o5(5)=11.O7,因为2lo5,处0.05,说明结核菌的各实际格子数与依照波松分布计算出的理论格子数差异不显著,能够 认为结核菌数服从波松分布。第三节独立性检
16、验一、独立性检验的意义对次数资料,除进行适合性检验外,有时需要分析两类因子 是相互独立依旧彼此相关。如研究两类药物对家畜某种疾病治疗 效果的好坏,先将病畜分为两组,一组用第一种药物治疗,另一 组用第二种药物治疗,然后统计每种药物的治愈头数和未治愈头 数。这时需要分析药物种类与疗效是否相关,假设两者彼此相关, 说明疗效因药物不同而异,即两种药物疗效不相同;假设两者相互 独立,说明两种药物疗效相同。这种依照次数资料推断两类因子 彼此相关或相互独立的假设检验确实是独立性检验。独立性检验 实际上是基于次数资料对子因子间相关性的研究。独立性检验与适合性检验是两种不同的检验方法,除了研究 目的不同外,还有
17、以下区不:(一)独立性检验的次数资料是按两因子属性类不进行归组。 依照两因子属性类不数的不同而构成2X2、2义、丁义。列联表 (r为行因子的属性类不数,。为列因子的属性类不数)。而适合 性检验只按某一因子的属性类不将如性不、表现型等次数资料归 组。(二)适合性检验按的属性分类理论或学讲计算理论次 数。独立性检验在计算理论次数时没有现成的理论或学讲可资利 用,理论次数是在两因子相互独立的假设下进行计算。(三)在适合性检验中确定自由度时,只有一个约束条件: 各理论次数之和等于各实际次数之和,自由度为属性类不数减lo 而在rXc列联表的独立性检验中,共有TC个理论次数,但受到 以下条件的约束:1、r
18、c个理论次数的总和等于TC个实际次数 的总和;2、T个横行中的每一个横行理论次数总和等于该行实 际次数的总和。但由于r个横行实际次数之和的总和应等于rc 个实际次数之和,因而独立的行约束条件只有L1个;3、类似 地,独立的列约束条件有si个。因而在进行独立性检验时,自 由度为47-(广1)-(51)=(广1)(仁1),即等于(横行属性类不 数-1) X (直列属性类不数-1)。二、独立性检验的方法下面结合实例分不介绍2X2、2义以rXc列联表独立性检验 的具体过程。(一)2X2列联表的独立性检验2X2列联表的一般形式如 表 710 所示,其自由度止(CT) (1) = (2-1) (2-1)=
19、1, 在进行z检验时,需作连续性矫正,应计算/值。表7102X2列联表的一般形式12行总合串1仆(%)小(2)一二+包241(7上)422( 722 )72二+42列总合小T-A + A22 二42 + 422T,. =41+42+41+42其中儿为实际观看次数,O为理论次数。【例7. 7】某猪场用80头猪检验某种疫苗是否有预防效果。 结果是注射疫苗的44头中有12头发病,32头未发病;未注射 的36头中有22头发病,14头未发病,问该疫苗是否有预防效 果?1、先将资料整理成列联表(见表711)表7112X2列联表发病未发病行息和T7发病率注射12(18. 7)32(25. 3)7,:4427
20、. 3%未注射22(15. 3)14(20. 7)1. : 3661. 1%列总和T.jT, /: 34T. 2: 46T.ox 802、提出无效假设与备择假设Ho:发病与否和注射疫苗无关,即二因子相互独立。发病与否和注射疫苗有关,即二因子彼此相关。3、计算理论次数依照二因子相互独立的假设,由样本数 据计算出各个理论次数。二因子相互独立,确实是讲注射疫苗与 否不阻碍发病率。也确实是讲注射组与未注射组的理论发病率应 当相同,均应等于总发病率34/80=0.425。依此计算出各个理论母合讣448(4)876438 (t、)876100. 22830. 4566从表7T看到,实际观看次数与理论次数存
21、在一定的差异, 那个地点公、母各相差10只。那个差异是属于抽样误差(把对该 羊场一年所生羔羊的性不统计当作是一次抽样调查)、依旧羔羊 性不比例发生了实质性的变化?要回答那个问题,首先需要确定 一个统计量用以表示实际观看次数与理论次数偏离的程度;然后 推断这一偏离程度是否属于抽样误差,即进行显著性检验。为了 度量实际观看次数与理论次数偏离的程度,最简单的方法是求出 实际观看次数与理论次数的差数。从表77看出:A-T, -10, A-10,由于这两个差数之和为0,显然不能用这两个差数之 和来表示实际观看次数与理论次数的偏离程度。为了幸免正、负 抵消,可将两个差数4-北、E平方后再相加,即计算可(4
22、-7)2, 其值越大,实际观看次数与理论次数相差亦越大,反之那么越小。 但利用E (4-TV表示实际观看次数与理论次数的偏离程度尚有 缺乏。例如某一组实际观看次数为505、理论次数为500,相差5; 而另一组实际观看次数为26、理论次数为21,相差亦为5。显然 这两组实际观看次数与理论次数的偏离程度是不同的。因为前者 是相关于理论次数500相差5,后者是相关于理论次数21相差5。 为了弥补这一缺乏,可先将各差数平方除以相应的理论次数后再 相加,并记之为即也确实是讲/是度量实际观看次数与理论次数偏离程度的 一个统计量,z越小,说明实际观看次数与理论次数越接近;次数如下:注射组的理论发病数:7;尸
23、44X34/80=18. 7注射组的理论未发病数:几二44 X 46/80=25. 3, 或:-=44-18. 7=25.3;未注射组的理论发病数:7L=36 X 34/80=15. 3 ,或M4-18. 7=15.3;未注射组的理论未发病数:&二36 X 46/80=20. 7 ,或&二36-15. 3=20. 7 o从上述各理论次数&的计算能够看到,理论次数的计算利用 了行、列总和,总总和,4个理论次数仅有一个是独立的。表7-11 括号内的数据为相应的理论次数。4、计算/值 将表7-11中的实际次数、理论次数代入74 式得:2 (| 12-18.71-O.5)2 (|32 - 25.31-
24、0.5)2 (| 22-15.31-O.5)2Xc -v+c 18.725.315.3+ (|14-20.7|-0,5)2,79/1420.75、由自由度 止1查临界2值,作出统计推断 因为;01 1,R0.01,否认以 同意以 表 明发病率与是否注射疫苗极显著相关,那个地点表现为注射组发 病率极显著低于未注射组,讲明该疫苗是有预防效果的。在进行2 2列联表独立性检验时,还可利用下述简化公式(76)(7-6)计算/:在(7-6)式中,不需要先计算理论次数,直接利用实际观看次数儿,行、列总和1、7:j和总总和力.进行计算,比利用公 式(7-4)计算简便,且舍入误差小。关于【例7.7,利用(7-6
25、)式可得:on(|12xl4-32x22|-)2x80X: = 7.94434x46x36x44所得结果与前面计算计算的相同。(二)2 X 0列联表的独立性检验2 X c列联表是行因子的属 性类不数为2,列因子的属性类不数为c (c 3)的列联表。其 自由度 止(2-1) (c-1),因为。3,因此自由度大于2,在进 行”检验时,不需作连续性矫正。2X。表的一般形式见表7 12o表7122X。联列表一般形式12C行总和7.1AiA 2 Ac2%42 A2ct2.列总和和T.i 几总总和乙其中&(7=1, 2;户1, 2,,c)为实际观看次数。【例7.8】在甲、乙两地进行水牛体型调查,将体型按优
26、、 良、中、劣四个等级分类,其结果见表713,问两地水牛体型 构成比是否相同。表713两地水牛体型分类统计优良中劣行总和九甲10 (13.3)10(10. 0)60(53. 3)10(13.4)90乙10(6. 7)5(5. 0)20(26. 7)10(6. 6)45列总和T.j20158020135这是一个2X4列联表独立性检验的问题。检验步骤如下:1 .提出无效假设与备择假设4:水牛体型构成比与地区无关,即两地水牛体型构成比相同。 水牛体型构成比与地区有关,即两地水牛体型构成比不同。2 .计算各个理论次数,并填在各观看次数后的括号中计算 方法与2X2表类似,即依照两地水牛体型构成比相同的假
27、设计 算。如优等组中,甲地、乙地的理论次数按理论比率20/135计 算;良等组中甲地、乙地的理论次数按理论比率15/135计算; 中等、劣等组中甲地、乙地的理论次数分不按理论比率80/135 和20/135计算。甲地优等组理论次数:7尸90X20/135=13. 3,乙地优等组理论次数:乃二45 X 20/135=6. 7 ,或 和20-13. 3=6.7;其余各个理论次数的计算类似。3 .计算计算z值2 (1013.3)2 (10-10)2(20-26.7)2 (106.6)27 =1+H1= /.5S213.31026.76.64 .由自由度止3查临界2值,作出统计推断 因为.。5 =7.
28、815,而 =7. 5820.05,不能否认,能够认为 甲、乙两地水牛体型构成比相同。在进行2义。列联表独立性检验时,还可利用下述简化公式(7-7)或(7-8)计算(77)(78)(7-7)或(7-8)式的区不在于:(7-7)式利用第一行中的实际观看次数人和行总和;(7-8)式利用第二行中的实际观 看次数友和行总和”.,计算结果相同。关于例7-7利用(7-8) 式计算z值得:/ =上区+ f +企+处一吟= 7.50290x45 20158020135计算结果与利用(7-1)式计算的结果因舍入误差略有不同。此外,在畜牧、水产科学研究中,有时需将数量性状资料以 等级分类,如剪毛量分为特等、一等、
29、二等,产奶量分为高产与 低产等,这些由数量性状资料转化为质量性状的次数资料检验, 也可用2检验。【例7.9】分不统计了 4 8两个品种各67头经产母猪的产 仔情况,结果见表7-14,问A. 8两品种的产仔构成比是否相 同?表7144 4两个品种产仔数的分类统计9头以下10-12 头13头以上行总和A1744667B5332967列总和J2277351341、提出无效假设与备择假设Ho-. A.夕两个品种产仔数分级构成比相同。M: A, 8两个品种产仔数分级构成比不同。2、计算2值 用简化公式(7-7)计算为:3、由自由度 (2-1) (3-1) =2查临界z值,作出统计推断 因为.05=9.
30、21, o,oi, /K0. 01,因此否认瓜,同意II ,说明A, 8两品种产仔数构成比差异极显著。需要应用2 检验的再分割法来具体确定分级构成比差异在那样的等级。4、2检验的再分割法(1)先对两个品种产仔数在9头以下和1012头进行“检 验,分割后的情况见表715。9头以下10-12 头行总和7LA174461B53338列总和J227799表 7151计算表利用简化公式(7-7)计算:值为:2=工工十生一处61x38 227799由 dfj=2l-l,查一值表得:o,o5 =3. 841,因为 -0.05,0.05,说明这两个品种的产仔数在9头以下和1012头 这两个级不内的比率差异不显
31、著。(2)对产仔数在13头以上组与其他合并组(即9头以下和 1012头两个组的合并)进行z检验,分割后见表716。表7161计算表合并组13头以上总和A61667B382967总和9935134利用简化公式(7-7)计算 彳值为:67x67 99 35- = 20.458134由心2-1 二 1,查 2值表得:1。5=3.846, 0.01 (i)=6. 63, 因为2火0.01,说明这两个品种的产仔数在合并组 与13头以上组的比率差异极显著。其中8品种产仔数在13头以 上的比率为29/67=42.38%,极显著高于力品种产仔数在13头以 上的比率6/67=8. 96%。或者讲8品种产仔数在合
32、并组(12头以 下)的比率为38/67=56. 72%,极显著低于A品种产仔数在合并 组(12头以下)的比率61/67=91. 04%。经分割检验后,止+的2+1=3,邑23.25= V:二2.93+20. 458=23. 388,2略小于1+是由于计算中的舍入误差所致。(三)rXc列联表的独立性检验rXc表是指行因子的属 性类不数为r (r2),列因子的属性类不数为c(c2)的列联表。 其一般形式见表7-17o12 c行总和 T-1仆A 2 AcG2&2 4rA” A,Tr.列总和和t.2 T.表 717rX c列联表的一般形式其中儿(占1,2,r;户1,2,c)为实际观看次数。二义。列联表
33、各个理论次数的计算方法与上述(2X2)、(2Xc) 表适合性检验类似。但一般用简化公式计算2值,其公式为:Z2=T.S-11(79)【例7. 10】对三组奶牛(每组39头)分不喂给不同的饲料, 各组发病次数统计如下表,问发病次数的构成比与所喂饲料是否 有关?表718 三组牛的发病次数资料发病次数 ;一其一b一-一 总 和 JL乙O0123456789(17.3)16(17. 3)17(17. 3)(0. 3)0(0. 3)0(0. 3)(1.3)3(1.3)1(1.3)(5. 7)9(5. 7)1(5. 7)(4. 7)5(4. 7)6(4. 7)(3. 3)1(3.3)5(3. 3)(2.
34、0)10)3(2.0)(1.3)2(1.3)2(1.3)(2. 3)2(2.3)4(2.3)(0. 7)0(0. 7)0(0. 7)9107342012检验步骤如下:1、提出无效假设与备择假设Ho-.发病次数的构成比与饲料种类无关,即二者相互独立。发病次数的构成比与饲料种类有关,即二者彼此独立。2、计算理论次数 关于理论次数小于5者,将相邻几个组加 以合并(见表719),合并后的各组的理论次数均大于5。表719 资料合并结果发病次数饲料123 总和3 5 8 O -14 619(17. 3)16(17. 3)17(17. 3)528(7. 3)12(7. 3)2(7.3)227(8.0)6(8
35、. 0)11(8.0)245(6. 3)5(6. 3)9(6. 3)19总和 3939(注:括号内为理论次数)391173、计算2值利用(7-9)式计算2值,得:Z2=117| 19- 4- 16- +4- 5- -F11=10.6139x52 39x5239x19 39x194、查临界2值,进行统计推断 由自由度止(4-1)(3-1)=6, 查临界2值得:1.05(6)=12.9,因为计算所得的 y 2。5, PQ. 05,不能否认从,能够认为奶牛的发病次数的构成比与饲料 种类相互独立,即用三种不同的饲料饲喂奶牛,各组奶牛发病次 数的构成比相同。1.2检验与检验、尸检验在应用上有什么区不?2
36、 .什么是适合性检验和独立性检验?它们有何区不?3 .什么情况下z检验需作矫正?如何矫正?什么情况下先 将各组合并后再作2检验?合并时应注意什么问题?4 .在什么情况下需应用2检验的再分割法?如何对总2 值进行分割?5 .两对相对性状杂交子二代/一B, Abb, aaB一, aabb 4种表现型的观看次数依次为:315、108、101、32,问是否符 合9 : 3 : 3 : 1的遗传比例? (*=0.475,同意从)6 .某猪场102头仔猪中,公的54头,母的48头,问是否 符合家畜性不1 : 1的理论比例。( 邑0.2450,夕0.05)7 .某生物药品厂研制出一批新的鸡瘟疫苗,为检验其免
37、疫 力,用200只鸡进行试验,某中注射100只(经注射后患病的 10只,不患病的90只),比照组(注射原疫苗组)100只(经注 射后患病的15只,不患病的85只),试问新旧疫苗的免疫力是 否有差异。(邑0.731,同意从)8 .甲、乙、丙三个奶牛场高产奶牛、低产奶牛头数统计如 下,试问三个奶牛场高、低产奶牛的构成比是否有差异。场地高产奶牛低产奶牛甲3218乙2826丙3810(2=8.269, 0.01pQ. 05)z2=0,表示两者完全吻合;/越大,表示两者相差越大。关于表7-1的资料,可计算得说明实际观看次数与理论次数是比拟接近的。二、/分布上面在属于离散型随机变量的次数资料的基础上引入了
38、统 计量它近似地服从统计学中一种连续型随机变量的概率分 布 /分布。下面对统计学中的/分布作一简略介绍。设有一平均数为U、方差为O,的正态总体。现从此总体中独 立随机抽取个随机变量:小、生、刘,并求出其标准正态离 差:记这个相互独立的标准正态离差的平方和为二:宜区-)2f2号六七L(7-2)它服从自由度为的/分布,记为Z(Xf)22(n);假设用样本平均数天代替总体平均数U,那么随机变量(7-3)服从自由度为/71的/分布,记为X(7因此,/分布是由正态总体随机抽样得来的一种连续型随机变量的分布。显然,即/的取值范围是0, +8 ; /分 布密度曲线是随自由度不同而改变的一组曲线。随自由度的增
39、大,曲线由偏斜渐趋于对称;F230时,亚尸接近平均数为j2”-i的正态分布。图7-1给出了几个不同自由度的/概率分布密度曲 线。图7-1 几个自由度的/概三、/的连续性矫正由(7T)式计算的/只是近似地服从连续型随机变量/分 布。在对次数资料进行/检验利用连续型随机变量/分布计算概 率时,常常偏低,特不是当自由度为1时偏差较大 Yates(1934) 提出了一个矫正公式,矫正后的/值记为/:.寸十时(7-4)当自由度大于1时,(7-1)式的/分布与连续型随机变量/分 布相近似,这时,可不作连续性矫正,但要求各组内的理论次数 不小于5。假设某组的理论次数小于5,那么应把它与其相邻的一组或 几组合并,直到理论次数大于5为止。第二节适合性检验一、适合性检验的意义推断实际观看的属性类不分配是否符合属性类不分配 理论或学讲的假设检验称为适合性检验。在适合性检验中,无效 假设为实际观看的属性类不分配符合属性类不分配的理 论或学讲;备择假设为A:实际观看的属性类不分配不符合 属性类不分配的理论或学讲。并在无效假设成立的条件下,按已 知属性类不分配的理论或学讲计算各属性类不的理论次数。因所 计算得的各个属性类不理论次数的总和应等于各个属性类不实 际观看次数的总和,即独立的理论次数的个数等于属性类不分类 数减1。也确实是讲,适合性检验的自由度等于属性