《高中必修三统计知识点.docx》由会员分享,可在线阅读,更多相关《高中必修三统计知识点.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高中数学必修3学问点总结第二章 统计简洁随机抽样.简洁随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完 全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性一样(概率相等),样 本的每个单位完全独立,彼此间无肯定的关联性和排挤性。简洁随机抽样是其它各种 抽样形式的根底。通常只是在总体单位之间差异程度较小和数目较少时,才采纳这种 方法。1 .简洁随机抽样常用的方法:(1)抽签法;随机数表法;计算机模拟法;运用统计软件干脆抽取。在简洁随机抽样的样本容量设计中,主要考虑:总体变异状况;允许误差 范围;概率保证程度。2 .抽签法:(1)给调查对象群体中的每一个对象编号;(2)打
2、算抽签的工具,施行抽签(3)对样本中的每一个个体进展测量或调查例:请调查你所在的学校的学生做喜爱的体育活动状况。3 .随机数表法:例:利用随机数表在所在的班级中抽取1。位同学参与某项活动。4 .1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进展排序,再计算出抽样间隔,然后依据这一固定的抽样间隔抽取样本。第一个样本采纳简洁随机抽样的方法抽取。K (抽样间隔)=N (总体规模)/n (样本规模)前提条件:总体中个体的排列对于探讨的变量来说,应是随机的,即不存在某种 及探讨变量相关的规则分布。可以在调查允许的条件下,从不同的样本开场抽样,比 照几次样本的特点。假如有明显差异,说明样本
3、在总体中的分布承某种循环性规律, 且这种循环和抽样间隔重合。分层抽样.分层抽样(类型抽样):先将总体中的全部单位依据某种特征或标记(性别、年龄等)划分成若干类型或层 次,然后再在各个类型或层次中采纳简洁随机抽样或系用抽样的方法抽取一个子样本, 最终,将这些子样本合起来构成总体的样本。两种方法:1 .先以分层变量将总体划分为若干层,再依据各层在总体中的比例从各层中抽取。2 .先以分层变量将总体划分为若干层,再将各层中的元素按分层的依次整齐排列, 最终用系统抽样的方法抽取样本。2 .分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子 总体中的样本分别代表该子总体,全部的样本进
4、而代表总体。分层标准:(1)以调查所要分析和探讨的主要变量或相关的变量作为分层的标准。(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在构造的变量作 为分层变量。(3)以那些有明显分层区分的变量作为分层变量。3 .分层的比例问题:(1)按比例分层抽样:依据各种类型或层次中的单位数目占总体单位数目的比重来 抽取子样本的方法。(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会特别少,此 时采纳该方法,主要是便于对不同层次的子总体进展特地探讨或进展互相比拟。假如 要用样本资料推断总体时,则须要先对各层的数据资料进展加权处理,调整样本中各 层的比例,使数据复原到总体中各层实际的
5、比例构造。用样本的数字特征估计总体的数字特征1、本均值: u+n2、.样本标准差:S = 77、叵%+区- 丁 + (%)2Vn.用样本估计总体时,假如抽样的方法比拟合理,则样本可以反映总体的信息,但从 样本得到的信息会有偏向。在随机抽样中,这种偏向是不行避开的。虽然我们用样本 数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一 个估计,但这种估计是合理的,特殊是当样本量很大时,它们的确反映了总体的信息。3 . (1)假如把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变.(2)假如把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k 倍.(3
6、) 一组数据中的最大值和最小值对标准差的影响,区间丘-3s,+ 3s)的应用;“去 掉一个最高分,去掉一个最低分”中的科学道理.2 .3.2两个变量的线性相关1、概念:(1)回来直线方程 (2)回来系数.最小二乘法3 .直线回来方程的应用.应用直线回来的留意事项(1)做回来分析要有实际意义;(2)回来分析前,最好先作出散点图;(3)回来直线不要外延。4 .回来直线方程的推导设x及y是具有线性相关关系的两个变量,且相应于样本的一组观测值的n个点 的坐标分别是:卬(%2,%),(%3,%),,,笫),下面给出回来方程的推导。设所求的回来方程为=区+。,其中“涉是待确定的参数,贝样本中各个点的偏向是
7、样本中各个点的偏向是y = y +。),(,= 1,2,3,)a = y-hx b = K. _Z xt2 - nx /=!a = y-hxZ (%-x)(y-y) 人:上匕z(七一%)2 /=1.相关系数r统计中常用相关系数不来衡量两个变量之间的线性相关的强弱,当看不全为零,万 也不全为零时,则两个变量的相关系数的计算公式是:不就叫做变量尸及x的相关系数(简称相关系数).说明:(1)对于相关系数和首先值得留意的是它的符号,当r为正数时,表示变量x,尸正相关;当厂为负数时,表示两个变量x, y负相关;(2)另外留意厂的大小,假如、0.75,1,则正相关很强;假如八卜1, 0,75,则负 相关很强;假如广0.75,-0.30或r 0.30,0.75),则相关性一般;假如r e-0.25,0,25,则相 关性较弱.