《方差分析(F检验).ppt》由会员分享,可在线阅读,更多相关《方差分析(F检验).ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学统计学医学统计学第六节第六节 方差分析(方差分析(F F检验)检验)12/11/20221医学统计学医学统计学一、方差分析的概念一、方差分析的概念 方方差差分分析析(ANOVA)又又称称变变异异数数分分析析或或F检检验验,其其目目的的是是推推断断两两组组或或多多组组资资料料的的总总体体均均数数是是否否相相同同,检检验验两两个个或或多多个个样样本本均均数数的的差差异异是是否否有有统统计计学意义。学意义。离均差平方和又称为变异数。离均差平方和又称为变异数。方方差差的的概概念念:方方差差即即为为标标准准差差的的平平方方,又又称称为为平均离均差平方和,简称平均离均差平方和,简称“均方均方”。12/
2、11/20222医学统计学医学统计学二、方差分析的用途二、方差分析的用途1 1、对对两两组组或或多多组组计计量量资资料料的的均均数数差差异异进进行行显著性检验。显著性检验。2 2、可可用用于于完完全全随随机机设设计计(单单因因素素)、随随机机区区组组设设计计(双双因因素素)、析析因因设设计计、拉拉丁丁方方设计和正交设计等资料的统计处理。设计和正交设计等资料的统计处理。3 3、可可对对两两因因素素间间交交互互作作用用差差异异进进行行显显著著性性检验。检验。4 4、进行方差齐性检验。、进行方差齐性检验。12/11/20223医学统计学医学统计学三、方差分析的条件三、方差分析的条件1 1、被比较的资
3、料要有可比性。、被比较的资料要有可比性。2 2、被比较的资料要有实际意义。、被比较的资料要有实际意义。3 3、被比较的资料要呈正态分布。、被比较的资料要呈正态分布。4 4、被比较的资料各组方差齐同。、被比较的资料各组方差齐同。12/11/20224医学统计学医学统计学四、方差分析的基本思想四、方差分析的基本思想 例例 1 1 某医院用三种不同疗法治疗同种疾病,以体温降至正某医院用三种不同疗法治疗同种疾病,以体温降至正常所需要的天数为指标,常所需要的天数为指标,1515例患者体温降至正常所需要的天数资例患者体温降至正常所需要的天数资料如下:料如下:15 15例患者体温降至正常所需要的天数例患者体
4、温降至正常所需要的天数 甲法甲法 乙法乙法 丙法丙法 5 5 7 5 5 7 5 5 9 5 5 9 5 7 9 5 7 9 7 7 9 7 7 9 7 7 9 7 7 9 29 33 43 29 33 43 5 5 5 n=15 5 5 5 n=15 5.8 6.6 8.6 x=7 5.8 6.6 8.6 x=7 173.0 229.0 373.0 173.0 229.0 373.0 12/11/20225医学统计学医学统计学15例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 1515例患者体温降至正例患者体温降至正常所需要的天数不
5、尽相常所需要的天数不尽相同,如果把每个患者所同,如果把每个患者所需的天数与总均数的差需的天数与总均数的差异之和称为总变异,总异之和称为总变异,总变异用离均差平方和变异用离均差平方和(SS)来描述。)来描述。12/11/20226医学统计学医学统计学 答案答案 1 1 造成总变异的造成总变异的原因有两种可能:原因有两种可能:1 1、由于个体差异的存在、由于个体差异的存在而引起,即而引起,即组内变异组内变异引起。引起。组内变异,即由于随机组内变异,即由于随机误差的原因使得各组内部患误差的原因使得各组内部患者体温降至正常所需要的天者体温降至正常所需要的天数各不相等。数各不相等。问题问题 1 1造成总
6、变异的造成总变异的原因是什么?原因是什么?15例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 912/11/20227医学统计学医学统计学2 2、由于治疗方法不同而引、由于治疗方法不同而引起,即起,即组间变异组间变异引起。引起。组间变异,即由于各组组间变异,即由于各组治疗方法(处理因素)不同治疗方法(处理因素)不同使得各组均数大小不等。使得各组均数大小不等。15例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 912/11/20228医学统计学医学统计学SS总总=SS组间组间+SS组内
7、组内 v总总=v组间组间+v组内组内总变异与组间变异和组内变异的关系为:总变异与组间变异和组内变异的关系为:总变异总变异=组间变异组间变异 +组内变异组内变异12/11/20229医学统计学医学统计学处理因素治疗方法抽样误差个体差异组 间 变 异组 内 变 异总 变 异总变异来源分析总变异来源分析12/11/202210医学统计学医学统计学 因组间变异数大小与组数(组间自由度因组间变异数大小与组数(组间自由度K-1)有关,故用)有关,故用组间变异数除以自由度所得组间均方来表示组间变异组间变异数除以自由度所得组间均方来表示组间变异。k=组数 因组内变异数大小与各样本含量大小即组内自由度因组内变异
8、数大小与各样本含量大小即组内自由度(ni 1)有关,故用组内变异数除以组内自由度所得组内均方来表示有关,故用组内变异数除以组内自由度所得组内均方来表示组内变异。组内变异。12/11/202211医学统计学医学统计学 问问题题 2 2 当当处处理理因因素素不不起起作作用用时时,从从理理论论上上来说来说 F F 值是多大?值是多大?答答案案 2 2 当当处处理理因因素素不不起起作作用用时时,从从理理论论上上来说来说T=0,T+E=E,MST=0,T+E=E,MS 组间组间=MS=MS组内,组内,F=1 F=1。当当处处理理因因素素起起作作用用时时,从从理理论论上上来来说说T0,T0,T T+E E
9、 E,E,F F 1,1,多多大大的的F F值值才才认认为为均均数数间间的的差差异异在在统统计计学学上上有有显显著著性性意意义义,可可根根据据自自由由度度查查F F值值表表,确定确定P P值后作出推断。值后作出推断。12/11/202212医学统计学医学统计学五、方差分析的方法五、方差分析的方法 根根据据实实验验设设计计方方法法不不同同,完完全全随随机机设设计计(单单因因素素)、随随机机区区组组设设计计(双双因因素素)、析析因因设设计计、拉拉丁丁方方设设计计和和正正交交设设计计等等资资料料应应选选用用不不同同的的方方差分析方法。差分析方法。12/11/202213医学统计学医学统计学 问题问题
10、 1 1 右边右边 资料是用何种实验设资料是用何种实验设计方法进行实验所得计方法进行实验所得资料?资料?答案答案 1 1 用用完全随机设计(单因完全随机设计(单因素)方法进行实验所素)方法进行实验所得资料。得资料。15例患者体温降至正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 912/11/202214医学统计学医学统计学1、完全随机设计(单因素)资料的方差分析H0:H1:15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 29 31 43 29 31 43 5 5 5 n=15 5
11、5 5 n=15 5.8 6.6 8.6 x=7 5.8 6.6 8.6 x=7 173.0 229.0 373 173.0 229.0 37312/11/202215医学统计学医学统计学完全随机设计多个样本均数比较的方差分析公式 变异来源 SS MS F总 N1组间 k1 组内 Nk 12/11/202216医学统计学医学统计学 方差分析表变异来源 SS v MS F组 间 20.8 2 10.4 6.5组 内 19.2 12 1.6 确定P值:查F值表,F0.05(2,12)=3.88,F0.01(2,12)=6.93,本例F=6.5,3.886.5P0.01。12/11/202217医学
12、统计学医学统计学 放置不同时间的血糖浓度 受试者号 放置时间(分)(区组)0 45 90 135 1 5.27 5.27 4.94 4.61 2 5.27 5.22 4.88 4.66 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 5 5.66 5.44 5.38 4.88 6 6.22 6.22 5.61 5.22 7 5.83 5.72 5.38 4.88 8 5.27 5.11 5.00 4.44 随机区组设计资料随机区组设计资料 方差分析方差分析 研究酵解作用对血糖浓度的影响,从8名健康人中抽取了血液并制备成血滤液,每个受试者的血滤液分成四份,
13、再随机把4份血液分别放置0、45、90、135分钟后测定其血糖浓度,试分析放置不同时间的血糖浓度有无变化。12/11/202218医学统计学医学统计学 放置不同时间的血糖浓度 受试者号 放置时间(分)(区组)0 45 90 135 1 5.27 5.27 4.94 4.61 2 5.27 5.22 4.88 4.66 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 5 5.66 5.44 5.38 4.88 6 6.22 6.22 5.61 5.22 7 5.83 5.72 5.38 4.88 8 5.27 5.11 5.00 4.44随机区组设计资料的
14、类型随机区组设计资料的类型 1、单因素多水平多组配对设计、单因素多水平多组配对设计资料。资料。2、多因素单水平多组配对设计、多因素单水平多组配对设计资料资料 3、双因素多水平设计资料。、双因素多水平设计资料。配对配对的方法:的方法:1、同体配对研究、同体配对研究 (1)处理前后配对研究)处理前后配对研究 (2)同体左右配对研究)同体左右配对研究 2、异体配对研究、异体配对研究 (1)动物)动物:种系、性别、胎:种系、性别、胎次相同,体重次相同,体重10%。(2)人群:种族、性别、病种)人群:种族、性别、病种相同,病情或并发症相似,年龄相同,病情或并发症相似,年龄5岁。岁。12/11/20221
15、9医学统计学医学统计学随机区组设计资料变异来源分析随机区组设计资料变异来源分析总变异=处理组间变异+区组间变异+误差变异SS总=SS处理组间+SS区组间+SS误差12/11/202220医学统计学医学统计学 不同治疗方法大鼠体重增重变化不同治疗方法大鼠体重增重变化 常规疗法 甲 法 乙 法区组号 治疗前 治疗后 治疗前 治疗后 治疗前 治疗后 1 160 240 160 264 165 290 2 178 253 176 306 172 317 3 156 262 158 258 158 288 4 164 272 164 284 164 298 5 172 265 172 290 174 3
16、20 6 168 277 168 286 170 305 7 165 282 168 290 168 310 8 170 290 172 300 168 312 9 164 276 162 280 162 290 10 174 268 176 296 174 30012/11/202221医学统计学医学统计学 四种大鼠注射不同剂量雌激素(mg/Kg)后子宫重量如下表,试进行分析。鼠 种 剂 量 0.1 0.2 0.4 0.8 A 98 106 116 145 B 40 42 68 115 C 56 70 111 133 D 38 42 63 8712/11/202222医学统计学医学统计学 案
17、例案例 2 2 现有8 名贫血患儿治疗前后血红蛋白含量资料如下:8 名贫血患儿治疗前后血红蛋白含量(g/L)患者编号 治疗前 1个月 3个月 b 1 115 104 120 339 2 107 110 130 347 3 98 109 125 332 4 110 115 130 355 5 90 109 125 324 6 117 115 115 347 7 115 120 135 370 8 115 123 127 365 ni 8 8 8 N=24 867.0 905.0 1007.0 x 108.4 113.1 125.9 94617.0 102657.0 127029.0 12/11/
18、202223医学统计学医学统计学1515例患者体温降至正常例患者体温降至正常 所需要的天数所需要的天数 甲法甲法 乙法乙法 丙法丙法 5 5 7 5 5 7 5 5 9 5 5 9 5 7 9 5 7 9 7 7 9 7 7 9 7 7 9 7 7 9 现有现有8 8 名贫血患儿治疗前后血红蛋白含量资料如下:名贫血患儿治疗前后血红蛋白含量资料如下:8 8 名贫血患儿治疗前后血红蛋白含量(名贫血患儿治疗前后血红蛋白含量(g/Lg/L)患者编号患者编号 治疗前治疗前 1 1个月个月 3 3个月个月 b b 1 115 104 120 339 1 115 104 120 339 2 107 110
19、130 347 2 107 110 130 347 3 98 109 125 332 3 98 109 125 332 4 110 115 130 355 4 110 115 130 355 5 90 109 125 324 5 90 109 125 324 6 117 115 115 347 6 117 115 115 347 7 115 120 135 370 7 115 120 135 370 8 115 123 127 3658 115 123 127 365 问问题题 2 2 例例2 2的的总总变变异异来来源源与与例例1 1有有何何异异同同点点?答答案案 2 2 共共同同点点是是其其
20、总总变变异异来来源源都都是是来来自自于于处处理理因因素素变变异异和和抽抽样样误误差差变变异异,这这不不仅仅是是它它们们的的共共同同点点,而而且且是是所所有有方方差差分分析析资资料料总总变变异异来来源的共同点。源的共同点。不同点是例不同点是例1 1只有一只有一个处理因素,例个处理因素,例2 2有两有两个处理因素,因此总的个处理因素,因此总的变异来源可分解为:变异来源可分解为:SSSS总总=SS=SS因素因素1 1+SS+SS因素因素2 2+SS+SS误差误差例1例212/11/202224医学统计学医学统计学随机区组设计(双因素)资料的方差分析方法为:随机区组设计(双因素)资料的方差分析方法为:
21、HoHo:不同时间:不同时间HBHB含量相同,含量相同,H H1 1:不同时间:不同时间HBHB含量不同或部分不同。含量不同或部分不同。H H0 0:不同的受试者:不同的受试者HBHB含量相同,含量相同,H H1 1:不同的受试者:不同的受试者HBHB含量不同或部分不同。含量不同或部分不同。12/11/202225医学统计学医学统计学 例例 2 2 现有现有8 8 名贫血患儿治疗名贫血患儿治疗前后血红蛋白含量资料如下:前后血红蛋白含量资料如下:8 8 名贫血患儿治疗前后血红蛋白含量名贫血患儿治疗前后血红蛋白含量(g/Lg/L)编号编号 治疗前治疗前 1 1个月个月 3 3个月个月 b b 1
22、115 104 120 339 1 115 104 120 339 2 107 110 130 347 2 107 110 130 347 3 98 109 125 332 3 98 109 125 332 4 110 115 130 355 4 110 115 130 355 5 90 109 125 324 5 90 109 125 324 6 117 115 115 347 6 117 115 115 347 7 115 120 135 370 7 115 120 135 370 8 115 123 127 365 8 115 123 127 365 n ni i 8 8 8 N=24
23、8 8 8 N=24 867.0 905.0 1007.0 867.0 905.0 1007.0 x 108.4 113.1 125.9 x 108.4 113.1 125.9 94617 102657 127029 94617 102657 127029 12/11/202226医学统计学医学统计学配伍组方差分析的计算公式 变异来源 SS MS F总 N1 处理间 k1 配伍间 b1 误差 SS总SS处理SS配伍 总-处理-配伍 12/11/202227医学统计学医学统计学 方差分析用表变异来源 SS V MS F处理组 1310 2 650.0 19.19区 组 578 7 82.6 1.68误 差 690 14 49.3查F值表,处理组:区 组 确定P值:处理组 F=19.196.51,故P0.01;区 组 F=1.680.05。统计推断:8 名贫血患儿治疗前后血红蛋白含量差异有极显著性意义,而同一时间患者之间血红蛋白含量差异无显著性意义。12/11/202228