《子女身高对父母身高的再回归分析.docx》由会员分享,可在线阅读,更多相关《子女身高对父母身高的再回归分析.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、子女身高对父母身高的再回归分析摘要: 本文通过抽样调查及统计分析,建立了父母身高与子女身高的两个回归方程,揭示 了父母身高与子女身高之间显著的线性关系.从分析的结果可以看出,不同家庭的子女身高 有回归其群体平均身高的倾向.关键词:父母身高;子女身高;回归分析1 引 言早在19世纪后期,英国生物学家Galton在研究父母身高与子女身高的关系时,观察了 1078个家庭中父亲、母亲身高的平均值x和其中一个成年儿子身高乂建立了一个线性方 程y = 33.73 + 0.516x通过这个方程分析出,子女身高有回归平均身高的倾向,首次提出了 “回归” 一词.多少 年来,人们利用“回归”的思想和方法在自然科学
2、和社会科学的许多领域通过建立回归模型, 揭示了一个又一个问题的内在规律,并使其得到了深入广泛的应用,从而也推动了科学和社 会的进步.既然回归问题追溯到源头是研究关于父母身高与子女身高的关系问题,那么,时 隔一百多年后的今天,人类的物质生活和精神生活都发生了巨大的变化,父母身高与子女身 高之间将呈现出一种什么样的关系呢?在现实生活中,人们都知道父母身高对子女身高是有 影响的,但是父亲与母亲的影响分别有多大?对儿子或对女儿的影响程度是否一样?我们 能否以定量的形式回答这个问题呢?具体地讲,我们是否也可以利用回归的思想和方法,进 一步揭示出父亲身高、母亲身高与子女身高之间量化关系的秘密,帮助那些关注
3、自己后代身 高的年轻父母们进行早期的预测;对那些未婚青年男女在选择理想配偶时提供一种科学的 参考依据.因此,今天我们重新回味并研究“回归一一父母身高和子女身高的关系”问题,仍 具有一定的研究价值.2数据采集最近,我们就父母身高对子女身高影响问题进行了抽样调查.我们对所调查的家庭提出了 明确要求: 该家庭有一个或多个子女; 每个家庭成员身体健康,发育正常,无先天性 和遗传性疾病,无残疾; 子女的年龄均在23岁(含23岁)以上,23岁以下者剔除.我们 注意到调查的范围尽可能广泛,有机关干部、职员、工人、农民、城市居民、军人、大学生 等,并特意选择了一所面向全国招生的军队院校的应届毕业生进行抽样,他
4、们来自全国各地, 家庭背景也相对复杂一些,这使得样本更具有代表性.在发放的460张调查表中,收回410张.按照事先的规定,经数据筛选,有290个家庭 符合要求,其中在对“子” “女”的统计中,“儿子”有405人,“女儿”有270人,利用二元 回归分析的方法,通过建立父母身高与子女身高的线性回归方程了定量的分析.3方 法1)回归平面方程的建立设XI为父亲身高,X 2为母亲身高,Y为儿子(或女儿)身高.单位:厘米个家庭的数据中,设第i个家庭中父亲身高为X li,母亲身高为X2i,儿子Yi,该家庭中父亲、母亲、儿子(或女儿)身高有以下关系式:Yi= B0+ B IX li+ B 2X 2i + Ei
5、, i=l,2,3,n利用最小二乘法得到正规方程组AB=B(1)nX liX2i YiX BO2其中 A = X liX liX liX 2i,B = X li,= 1X X B B 22X2iX liX 2i X 2i X 2i Z S E S B-1当系数矩阵A可逆时,B=AB.为了使正规方程组求解简单些,将(1)进行初等行变换得到 1 X 1 X 2 BO ?Y0111 112 Bl =lly0121 122 B2 12y 1 1其中 X k = X ki, Y = Yi, Ikt = X kiX ti - nX k X t, Iky = X kiYi - nX k Yi, k E ?
6、E S E n n=1, 2, t = 1,2.Ill 112 1 lly-1 当1=可逆时,得以二=L,0=y-1 X 1-2X2.从而得到经 121 122 B8 BB882 12y B5 0 B8 B8 验回归平面方程Y8= B80 + B81X 1 + B62X 2 (2) 这里B 8 1, B 82称为回归系数. B BBEBB B B BB B ?B B9 B 6 BB88 B8 9 B8 B8 5 B8 B8 B5B 8 B82)线性回归方程的显著性检验采用方差分析的方法,对所得线性回归方程显著性进行检验.计算F值,否定域为F FA(2, n- 3).3)回归系数的显著性检验 H
7、O :Bj = 0,j = 1,2 2EB3j = Bj,DB3j = cjjP,j = l,2 剩-1Q其中cjj为矩阵C=L对角线上的元素.P5 3 = n-3是标准误差P的无偏估计.选用统计*J量 Tj= B 6 t(n- 3)J=1,2,否定域为 Tt2 A (n- 3).cjj P53B 8 B686 888回归方程特别显著且回归系数B 8 1, B 82均显著地不为零,女儿身高和父母身高 关系.因此,女儿身高对父母身高的回归方程也是有意义的.同样当某一家庭中父亲身高xlO、母亲身高x20已知时,其女儿身高的点估yb= 47. 140 + 0. 249x10 + 0. 455x20得
8、到,并且由此可以得到儿子身高期望值的置信概率分别为95?及99?的预(y 5 0 - 7. 792d, y 5 0 + 7. 792d) &(y 5 0 - 11. 643d, y 5 0+ 11. 643d其中d由(5)得到.3)举例表1给出了部分家庭由父亲、母亲身高而得到子女身高的预测值和预测表1部分家庭子女身高的预测值和预测区间儿子身高女儿身高父亲母亲身高身高点估计95%的预测区间99%的预测区间 点估计95%的预测区间99%的预测区间160 155 166. 57 (165. 32, 167. 83)(164. 90, 168. 25) 157. 50 (155. 99, 159. 0
9、2)(155. 48, 159.52)160 160 168. 32 (167. 16, 169. 48)(166. 77, 169. 87) 159. 78 (158. 43, 161. 13)(157. 98, 161.58)165 160 170. 15 (169. 41, 170. 91)(169. 16, 171. 16) 161. 02 (160. 14, 161. 90)(159. 84, 162.20)165 165 171. 90 (171. 01, 172. 91) (170. 71, 173. 10) 163. 30 (162. 26, 164. 33) (161. 91
10、, 164.69)170 160 172. 00 (171. 53, 172. 46)(171. 37, 172. 62) 162. 27 (161. 74, 162. 79)(161. 57, 162.97)170 165 173. 74 (173. 12, 174. 36) (172. 91, 174. 57) 164. 54 (163. 77, 165. 30)(163. 52, 165.56)175 160 173. 83 (173. 27,174. 40)(173. 08, 174. 64) 163. 51 (162. 94, 164. 07)(162. 75, 164.27)175
11、 165 175. 58 (174. 93, 176. 22) (174. 72, 176. 44) 165. 78 (164. 98, 166. 59) (164. 71, 166.85)180 160 175. 67 (174. 73, 176. 60)(174. 43, 176. 92) 164. 75 (163. 79, 165. 71)(163. 48, 166.03)180 165 177. 42 (176. 47, 178. 36)(176. 15, 178. 68) 167. 03 (165. 91, 168. 14)(165. 54, 168.52)180 170 177.
12、41 (176. 47, 178. 36)(176. 15, 178. 68) 169. 30 (167. 76, 170. 83)(167. 26, 171.34)B 5 B889 9 5 8855分析与讨论由本次抽样统计所建立的回归方程(6)、(7)以及上述的定量分析我们可以看出以下几占八、1)当年Galton把父亲身高与母亲身高的平均值作为变量得到的回归方程是一元的,今天我们把父亲身高与母亲身高分别作为两个独立的变量来研究,分别建立的儿子身高 对父母身高及女儿身高对父母亲身调换两个回归平面方程是两个二元的,无疑将父母身高 对儿子(或女儿)身高的影响表示的更加直接和清晰.2)父亲身高与子女
13、身高有显著的线性关系.在一定程度上可以说,父母身高对子女身高有着重要的影响,而且在不同的历史时期,子女身高同样有回归平均身高的倾向,即个 子矮的父母亲,其子女身高未必低于自己;个子高的父母亲,其子女身高未必高于自己,这 一点从表1也不难看出.今天,明确地揭示出这一统计规律性,无疑有它的现实意义和社 会意义.3)由两个回归方程的回归系数还可以看出,母亲身高对子女身高的影响比父亲的影响大些,特别是母亲身高对女儿身高的影响更为明显一些.这一统计规律与现实生活中的普 遍现象是基本吻合的.4)本文所给出的回归方程及结论具有一般统计规律性.当然,并不排除一个人在其成长 过程中所处的特殊环境和生活条件等因素对其身高也可能会产生某种影响.