《推断统计参数估计.pptx》由会员分享,可在线阅读,更多相关《推断统计参数估计.pptx(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、推断统计的主要内容 参数估计 假设检验 推断统计的基础是抽样分布理论 二、参数估计 1、参数估计的内涵 在研究中,根据样本数据的信息来对总体 的分布特征行估计,该过程即参数估计。第1页/共71页2、两种类型参数估计 点估计 区间估计第2页/共71页三、点估计 1、点估计内涵(Point estimation)是用样本统计量来估计总体参数。例:点估计优点 能给出总体参数的估计值第3页/共71页2、良好点估计的标准 无偏性(unbiased estimate)即用样本统计量估计总体参数时,样本 统计量抽样分布的中心等于总体参数。具体说明 第4页/共71页 是 的无偏估计 设有一总体为X(或随机
2、变量X),其均值 为 ,从其中随机抽取一个容量为n的样本 ,其平均数为 ,则有上述结论。证:由已知条件,则有:第5页/共71页注:第6页/共71页 是 有偏估计,而 是 的无偏估计 证:设总体X的方差为 ,在总体X中抽取样 本 ,则有第7页/共71页第8页/共71页记:则有:由上:结论:才是总体方差 的无偏估计第9页/共71页有效性 指当总体参数的无偏估计不止一个时,统计 量变异(方差)越小,则越有效。例:估计总体 的平均数 ,常用样本平 均数 结论:当然,n越大对应的平均数越有效第10页/共71页例:估计总体 的平均数 ,也可以用Mo、Md,它们也无偏估计量,但在样本容量相 等的情况下,有
3、第11页/共71页一致性 指的是样本容量n时,样本估计值越来越 接近它所估计的总体参数。例 样本容量n时,样本容量n时,第12页/共71页充分性 指一个容量为n的样本统计量,是否反映了全 部n个数据的信息。例 估计总体X的平均数 ,可以用 、Md、Mo第13页/共71页例 从某地区16岁的男中学生中随机抽取10人,测 得其身高和体重数据如下:(160.5,43.75)、(157.40,40.25)、(153.0,42.50)(158.0,49.75)、(157.5,45.50)、(154.0,42.75)(154.0,41.00)、(163.0,46.75)、(156.5,45.50)(157
4、.0,45.00)试分别求出身高与体重的总体均值与方差的点 估计。第14页/共71页四、区间估计(interval estimation)相关术语 区间估计内涵 就是根据样本统计量以一定可靠程度推断 总体参数所在的区间范围,它以区间界定总 体参数可能出现的范围,它不具体指出总体 参数等于多少,但能指出总体参数落入该区 间的概率有多大。与点估计有明显的差异 第15页/共71页置信区间、与显著性水平 显著性水平(significance level)指断定总体参数落在某一区间时,可能犯 错误的概率,常以符号 表示。置信度 表示置信度或置信水平。第16页/共71页置信区间(confidence in
5、terval)也称置信距,是指在某一置信度时,总体参 数所在的区间(区域)。概念的解读 0.95置信区间是什么?0.05显著性水平的置信区间是什么?第17页/共71页4、区间估计原理与标准误 区间估计存在的二难问题 在估计总体参数时,我们总喜欢估计值离 总体参数近一点,成功的概率大一点,但在 样本容量一定的情况下,这二者相互矛盾。例:总体平均数的估计第18页/共71页区间估计原理 区间估计的理论基础是样本分布理论,在 保证一定置信度的前提下,对总体参数的可 能出现的区间作出估计。标准误 即在通过样本统计量对总体参数进行估计 时样本统计量分布的标准差。标准误决定参数区间估计的长度第19页/共71
6、页五、总体参数区间估计 1、总体平均数 的估计 总体方差 已知 总体 i、样本平均数 的分布 由抽样分布理论知:第20页/共71页ii、区间估计过程(示意图)设定显著性水平为(置信度1-),则有:第21页/共71页iii、结论(示意图)在置信水平为1-时,总体均值 的置 信区间为 。或在显著性水 平为,总体均值 的置信区间为:练习:请写出=.05及.01时的置信区间第22页/共71页示意图第23页/共71页例已知某校在某次考试中,全体考生成绩总体方 差为100,从中抽取5位考生的成绩为65、83、94、70、88,试求全体考生成绩均值的置信 系数为95%和99%的置信区间。(假设考生的 总体成
7、绩呈正态分布)第24页/共71页总体 i、样本容量n30时,无法进行总体均值 的区间估计;ii、样本容量n30时,总体均值 的区间 估计与前一样。第25页/共71页总体方差 未知,总体 的区间估计 若总体 、区间估计原理 设在总体X中抽取样本 ,其中 样本平均数为 ,由抽样分布理论有:注:第26页/共71页ii、区间估计过程结论:在显著性水平为时,的置信区 间为:第27页/共71页课堂练习:请写出=.05及.01时的置信区间假设在上例中,总体方差未知,其他情况不变,试求全体考生成绩均值的置信系数为95%和99%的置信区间。第28页/共71页 、小样本情况(n30时,有:(近似分布)第36页/共
8、71页标准差区间估计过程 结论:在置信度为1-时,的置信区间是:第37页/共71页方差区间估计 方差区间估计原理 设总体 ,在总体中抽取容量为n的 样本 ,则有:第38页/共71页方差区间估计过程(示意图)结论:在置信度为1-时,总体方差 的 置信区间为:第39页/共71页第40页/共71页例子 某校高中语文毕业考试中,随机抽取15份,其 成绩如下:75、68、72、89、86、78、91、92、79、83、88、90、85、77、82 试 确 定语文成绩的标准差的范围(置信度为 1-0.01)。第41页/共71页两总体方差之比的区间估计 两总体方差之比的区间估计原理 从二正态总体 、中,分别
9、随 机抽取容量为 、两样本,设其样本方差分 别为 、,则据抽样分布理论有:第42页/共71页示意图第43页/共71页区间估计过程第44页/共71页注:F分布的一个特性 与 具有以下关系:结论:在置信度为1-时,置信区间为:第45页/共71页例子 已知 ,。问二总体方差 之比 在0.99置信区间,能否说二总体方差相等?第46页/共71页3、相关系数的区间估计 积差相关系数的区间估计 积差相关系数的抽样分布 、总体相关系数=0时,样本相关系数 的分布第47页/共71页总体相关系数0时,样本相关系数的分布 、样本容量n500时,样本相关系数 才渐 近正态分布;(不常用-大样本限制)第48页/共71页
10、、样本相关系数 Fisher转化 的分布 首先:对样本相关系数 进行Fisher转化 转化后 分布渐近正态分布-费舍Z 分布第49页/共71页积差相关系数区间估计过程 总体相关系数为0时(过程略讲)置信度设为 ,则总体相关系数 的置信 区间为:即:问题:若置信区间未包括0,则说明了什么 问题?第50页/共71页总体相关系数 不为0,且样本容量n500 在置信度为 时,总体相关系数 的置 信区间为:即:第51页/共71页总体相关系数 不为0,利用FisherZ函数分 布进行估计(设置信度为 )总体相关系数 的Fisher转化 的置信区 间为:即:第52页/共71页例(P215)某校120名学生通
11、过甲乙二测验,计算得到这二 种测验的相关系数为 ,问这二种测验总 体相关系数 的置信度为0.95的置信区间?第53页/共71页研究 吴念阳等:青少年亲子关系与心理健康的相关研究 研究目的 运用相关分析的方法探讨亲子关系对学生心 理健康的影响 被试(随机抽取)、1所上海市普通高中高一至高三共184名学 生及其家长 、1所上海市普通中学初一至初三165名学生 及其家长第54页/共71页工具 、家庭亲子关系测验(亲子关系诊断测验 周步成等修订)结构:A 消极拒绝型 B 积极拒绝型 C 严格型 D 期待型 E 干涉型 F 不安型 G 溺爱型 H 盲从型 I 矛盾型 J 不一致型 注:每一类型10题,满
12、分100,得分少于50 被认为可能有不良好的亲子关系 第55页/共71页 、心理健康测验 SCL-90(90项目症状自评量表,10个分量表)测试结果相关分析 10类亲子关系与10种主要心理问题的相关系数躯体化 强迫症 人际关系 抑郁 焦虑 敌对 恐怖 偏执 精神病 其他 消极拒绝 0.16 0.17 0.67*0.63*0.22 0.67*0.14 0.15 0.29 0.25 积极拒绝 0.24 0.32 0.24 0.29 0.64*0.30 0.22 0.39 0.16 0.40 严格 0.27 0.64*0.12 0.24 0.78*0.32 0.25 0.18 0.21 0.44 期
13、待 0.11 0.23 0.19 0.69*0.30 0.28 0.16 0.19 0.23 0.28 干涉 0.16 0.19 0.23 0.21 0.64*0.22 0.30 0.16 0.37 0.33 不安 0.29 0.22 0.26 0.19 0.66*0.35 0.19 0.21 0.39 0.44 盲从 0.20 0.26 0.78*0.54*0.33 0.57*0.25 0.18 0.39 0.33 溺爱 0.19 0.31 0.77*0.54*0.36 0.56*0.11 0.19 0.29 0.34 矛盾 0.24 0.64*0.31 0.21 0.80*0.31 0.1
14、2 0.15 0.19 0.47 不一致 0.19 0.66*0.11 0.19 0.78*0.21 0.23 0.22 0.33 0.41 第56页/共71页结论分析 第57页/共71页斯皮尔曼等级相关系数的区间估计 区间估计原理 、样本容量9n20第60页/共71页区间估计过程(过程略提)设置信度为 ,则总体斯氏等级相关系数 的置信区间为:第61页/共71页例 N=15,问其总体相关系数的0.95 置信区间。第62页/共71页4、比率及比率差异的区间估计 比率的区间估计 比率的抽样分布 设p:个体具有某种性质的概率 q:个体不具有这种性质的概率 (显然有:p+q=1 p即总体比率)从这种总
15、体中抽取容量为n的样本,则 具有这种性质个体占总抽取人数n的比率 (即样本比率,记作 ),当np5时,第63页/共71页则有样本比率近似服从正态分布,即:其中:注:是在容量为n的样本中,具有某种属性的 个体的次数第64页/共71页比率的区间估计过程(略讲)在置信度为 时,比率p的置信区间为:第65页/共71页例 从四年级学生中随机抽取50人,施测某测验,结果通过者30人,请估计整个四年级在该测验 上的通过率。若四年级有500人,问通过的人数 为多少?第66页/共71页比率差异区间估计 抽样分布原理 设从总体比率分别为 与 的两总体中随机 抽取样本容量为 与 的样本,得到样本比 率 与 。当 且 时,统 计 量 近似服从正态分布:第67页/共71页注-比率差异分布特例 如果 ,则该两样本来自同一总体,则两样本的比率 与 ,都可以作为p的点 估计,但实际上用的是两样本的平均比率 第68页/共71页比率差异区间估计过程(略提)、若 ,置信区间为:、若 ,置信区间为:第69页/共71页例(P219)某校从初三学生中随机抽取男生100人、女生150 人,进行身体检查:发育正常且无任何疾病者男 生62人,女生74人,问该校初三男生与女生发育 正常且无任何疾病者的比率差异情况如何?第70页/共71页谢谢您的观看!第71页/共71页