《统计知识点总结.doc》由会员分享,可在线阅读,更多相关《统计知识点总结.doc(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date统计知识点总结统计知识点总结统计:一、 抽样方法类别步骤特点相互联系适用范围简单随机抽样抽签法(1)编号(2)均匀搅拌(3)抽出样本从总体中逐个抽取最基本的抽样方法总体容量较少随机数表法(1)编号(2)查表(3)读数(4)抽出样本系统抽样(1)编号(2)分组(3)确定间隔长度 (4)第一组中随机抽(5)成等差数列在其他组中抽。将总体均匀分成几部分,按预先确定出的规则在
2、各部分抽取每一部分进行抽样时,采用的是简单随机抽样总体容量较多分层抽样(1)分层(2)计算比例(3)按比例确定各层应抽取的样本数目(4)在每一层抽样 (可用简单随机抽样或系统抽样)将总体分成几部分,每一部分按比例抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成二、频率分布直方图1、作频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。2、直方图的优点:任何情况都能用;直方图的缺点:有信息丢失3、在频率直方图中计算众数、平均数、中位数众数 在样本数据的频率分布直方图中,就
3、是最高矩形的中点的横坐标。中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等平均数 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和三、茎叶图1、作图步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分.(2)将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;(3)将各个数据的叶按大小次序写在其右(左)侧.2、茎叶图的优点是:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。茎叶图的缺点是:当样本数据较多时,茎叶图就显得不方便了.四、标准差和方差:描述了数据的波动范围,离散
4、程度;标准差越小,波动越小,越稳定。标准差方差五、回归直线方程:六、独立性检验精题精练:例1、(2013年高考江西卷(理)总体有编号为01,02,19,20的20个个体组成。利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481()A08B07C02D01例2、某工厂生产的产品,用速度恒定的传送带将产品送入包装车间之前,质检员每隔3分钟从传送带上的特定位置
5、取一件产品进行检测,这种抽样方法是 ( ).A.简单随机抽样 B.系统抽样 C.分层抽样 D.其它抽样方法练习1:某小礼堂有25排座位,每排有20个座位。一次励志讲座时礼堂中坐满了学生,会后为了解有关情况,留下座位号是12的25名学生,这里运用的抽样方法是( ) A 抽签法 B随机数法 C系统抽样 D分层抽样练习2:某中学采用系统抽样方法,从该校全体800名学生中抽50名学生做牙齿健康检查。现将800名学生从1到800进行编号,求得间隔数k=16,即每16人抽取一个人。在116中随机抽取一个数,如果抽到的是7,则从33 48中应取的数是( )A40 B39 C38 D37例3、(2010重庆高
6、考)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本若样本中的青年职工为7人,则样本容量为()A7B15 C25 D35练习:(2013年高考湖南卷(理)某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A抽签法B随机数法C系统抽样法D分层抽样法 例4、(2013年普通高等学校招生统一考试福建数学(理)试题)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:40,50), 50,60), 6
7、0,70), 70,80), 80,90), 90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588B480C450D120例5、某校高一某班共有64名学生,下图是该班某次数学考试成绩的频率分布直方图,根据该图,该班同学数学成绩的众数_,中位数_,平均数_。练习1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在的汽车大约有 ( )A30辆 B60辆 C300辆 D600辆练习2:(2013年普通高等学校招生统一考试辽宁数学(理)试题)某学校组织学生参加英语测试,成绩的频率分布直方
8、图如图,数据的分组一次为,若低于60分的人数是15人,则该班的学生人数是ABCD例6、(2010福建高考)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B91.5和92 C91和91.5 D92和92练习:(2013重庆)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).甲组乙组90921587424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则、的值分别为A2、5 B.5、5 C.5,8 D.8,8例7、名工人某天生产同一零件,生产的件数是设其平均数为,中位数为,众数为,则有( )A B
9、C D 例8、某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是=415,方差是=794,=958,那么这两个水稻品种中产量比较稳定的是 ( )A.甲 B.乙 C.甲、乙一样稳定 D.无法确定例9、某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90, 85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.例10、高三年级有500名学生,为了
10、了解数学学科的学习情况,现从中随机抽取若干名学生在一次测试中的数学成绩,制成如下频率分布表:分组频数频率85,95)95,105)0.050105,115)0.200115,125)120.300125,135)0.275135,145)4145,1550.050合计(1)根据上面图表,处的数值分别为_、_、_、_;(2)在所给的坐标系中画出85,155的频率分布直方图;(3)根据题中信息估计总体平均数和中位数,并估计总体落在129,155中的频率例11从某居民区随机抽取10个家庭,获得第个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得,.()求家庭的月储蓄对月收入的线性回归
11、方程;()判断变量与之间是正相关还是负相关;()若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程中, ,。其中,为样本平均值,线性回归方程也可写为.练习:1、 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据. x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5+4
12、3+54+64.5=66.5)解 (1)散点图如下图: (2)=4.5,=3.5=32.5+43+45+64.5=66.5.=32+42+52+62=86=0.7 =-=3.5-0.74.5=0.35.所求的线性回归方程为=0.7x+0.35.(3)现在生产100吨甲产品用煤y=0.7100+0.35=70.35,降低90-70.35=19.65(吨)标准煤.2、.测得某国家10对父子身高(单位:英寸)如下:父亲身高(x)60626465666768707274儿子身高(y)63.665.26665.566.967.167.468.370.170(1)对变量y与x进行相关性检验;(2)如果y与
13、x之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高.解 (1)=66.8,=67.01,=44 794,=44 941.93,=4 476.268,=4 462.24,4 490.34, =44 842.4.所以r=0.980 4.因为rr0.05,所以y与x之间具有线性相关关系.(2)设回归直线方程为.由=0.464 6.=67.01-0.464 666.835.974 7.故所求的回归直线方程为=0.464 6x+35.974 7.(3)当x=73英寸时,=0.464 673+35.974 769.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.
14、9英寸.例12.调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关?(2)用假设检验的思想给予证明.(1)解 根据列联表的数据,得到2=2分=7.4696.6356分所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A=26.6350.01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.练习:1.某班主任对全班50名学生学习积极性和对待班级工作
15、的态度进行了调查,统计数据如下表所示: 积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P1=,又因为不太主动 参加班
16、级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P2=.(2)由统计量的计算公式得=11.538,由于11.53810.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.作业:1、(2013年高考陕西卷(理)某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间481, 720的人数为()A11B12C13D142、(2013年普通高等学校招生统一考试安徽数学(理)试题)某班级有50名学生,其中有30名男生和20名女生
17、,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A这种抽样方法是一种分层抽样B这种抽样方法是一种系统抽样C这五名男生成绩的方差大于这五名女生成绩的方差D该班级男生成绩的平均数小于该班女生成绩的平均数 3、(2013年普通高等学校招生统一考试福建数学(理)试题)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:40,50), 50,60), 60,70), 70,80), 80,90), 90,100)加以统计,得到如图所示的频率分布直方图,已知
18、高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588B480C450D1204、(2013年高考新课标1(理)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学.初中.高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样【答案】C 5、(2013年普通高等学校招生全国统一招生考试江苏卷(数学)抽样统计甲、乙两位设计运动员的5此训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_6.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表: 理科文科男1310女720已知P(3.841)0.05,P(5.024)0.025.根据表中数据,得到=4.844.则认为选修文科与性别有关系出错的可能性为 .7.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归直线方程;=6.5x+17.5.(3)试预测广告费支出为10百万元时,销售额多大?82.5-