《数据分析复习.ppt》由会员分享,可在线阅读,更多相关《数据分析复习.ppt(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本章主本章主要内容要内容1.举例说明平均数、中位数、众数的意义举例说明平均数、中位数、众数的意义.2.举例说明平均数和加权平均数之间有举例说明平均数和加权平均数之间有什么联系与区别什么联系与区别.3.举例说明方差是如何刻画数据的离散举例说明方差是如何刻画数据的离散程度或波动大小的程度或波动大小的.本章知本章知识结构识结构数据的分析数据的分析(分析数据的分析数据的特征性质特征性质)数据的一般水数据的一般水平或集中趋势平或集中趋势数据的离散程数据的离散程度或波动大小度或波动大小平均数、平均数、加权平均数加权平均数中位数中位数众数众数方差方差计计算算公公式式对于一组数据对于一组数据x1,x2,x3,
2、xn,并且他们的权数分别是并且他们的权数分别是f1,f2,f3,fn,则有,则有x=(x1+x2+x3+xn)1n(算术平均数)(算术平均数)x=(x1f1+x2f2+x3f3+xnfn)1n(加权平均数,加权平均数,其中其中f1+f2+f3+fn=n)将一组数据按将一组数据按从小到大从小到大的顺序排列起来,处于最中间位置的顺序排列起来,处于最中间位置的一个数(或的一个数(或中间中间两个数的平均数);两个数的平均数);众数:众数:数据数据组中组中出现出现次次数数最多的数最多的数,它可能是其中的,它可能是其中的一个数或多个数;一个数或多个数;反映一组数据的波动大小,计算公式:s2=(x1-x)2
3、+(x2-x)2+(x3-x)2+(xn-x)21n平均数、中位数、众数都是一组数据的代表,它们从平均数、中位数、众数都是一组数据的代表,它们从不同侧面反映了数据的一般水平或集中趋势不同侧面反映了数据的一般水平或集中趋势.注意注意1.平均数与加权平均数的意义不同平均数与加权平均数的意义不同.当一组数据中不同的数重复出现时,我当一组数据中不同的数重复出现时,我们用权数的大小来反映重复次数的多少;们用权数的大小来反映重复次数的多少;通常也用权数来反映一组数据中不同成通常也用权数来反映一组数据中不同成分的比例或重要性分的比例或重要性.对于不同的实际问题,权数常有不同的含义对于不同的实际问题,权数常有
4、不同的含义2.平均数、中位数、众数都是一组数据的代表,它们从不平均数、中位数、众数都是一组数据的代表,它们从不同侧面反映了数据的一般水平或集中趋势同侧面反映了数据的一般水平或集中趋势.值得注意的是:值得注意的是:平均数相同的数据组在性质上仍可能有很大平均数相同的数据组在性质上仍可能有很大的区别,这是因为它们相对于平均数的分布情况不同,即数的区别,这是因为它们相对于平均数的分布情况不同,即数据组中的数相对于平均数的偏差不同据组中的数相对于平均数的偏差不同.方差方差是一组数据中各数与其平均数之差的平方的平均值,它是一组数据中各数与其平均数之差的平方的平均值,它反映了一组数据在其平均数周围的离散程度
5、反映了一组数据在其平均数周围的离散程度.数据数据2 2x1 1-3-3,2 2x2 2-3-3,2 2x3 3-3-3,2 2xn-3-3的平均数为的平均数为 ,方差为方差为 ,把一组数据每个数都加上一个数把一组数据每个数都加上一个数a,那么平均,那么平均数增加数增加a,方差不变。,方差不变。每个数据扩大为原来的每个数据扩大为原来的n倍,那么平均数为原倍,那么平均数为原来的来的n倍,方差是原来的倍,方差是原来的n2倍。倍。已知数据已知数据x1,x,x,xn的平均数为的平均数为a,方差为方差为b,则则数据数据x1+,x+,x+,,xn+的平均数为的平均数为 ,方差为方差为 ,数据数据x1-,x-
6、,x-,xn-的平均数为的平均数为 ,方差为方差为 ,数据数据4x1,4x2,4x3,,4xn的平均数为的平均数为 ,方差为方差为 ,a+3a-34a2a-3bb16b4b1.1.设有甲、乙、丙三种可混合包装的食品,它们的单价设有甲、乙、丙三种可混合包装的食品,它们的单价分别是分别是1.81.8元,元,2.52.5元,元,3.23.2元,现取甲种食品元,现取甲种食品5050公斤,公斤,乙种食品乙种食品4040公斤,丙种食品公斤,丙种食品1010公斤,把这三种食品混合公斤,把这三种食品混合后每公斤的单价是多少?后每公斤的单价是多少?求加权平均数的问题,甲、乙、丙的权数分别是:求加权平均数的问题,
7、甲、乙、丙的权数分别是:50、40、102.2.在一次中学生田径运动会上,参加男子跳高的在一次中学生田径运动会上,参加男子跳高的1717名名运动员的成绩如下表所示:运动员的成绩如下表所示:成成绩绩米米1.501.601.651.701.751.801.851.90人数人数23234111 分别求这些运动员成绩的众数,中位数与平均数(计分别求这些运动员成绩的众数,中位数与平均数(计算结果保留到小数点后第算结果保留到小数点后第2 2位)。位)。3 3.中考后,老师对试卷中第中考后,老师对试卷中第3636题(注:满分题(注:满分4 4分)进行分)进行了统计,并根据统计结果绘出如图所示的得分情况统计表
8、。了统计,并根据统计结果绘出如图所示的得分情况统计表。求该题得分的众数、中位数和平均数。求该题得分的众数、中位数和平均数。0 01 12 23 34 434.8%10%25.8%9.8%19.6%分数分数(分分)得分得分率率分析:分析:(1)“比较好比较好”的占的占55.2%即可求出总人数。即可求出总人数。(2)众数、中位数众数、中位数可由所占比例得出,可由所占比例得出,平均平均得分即求加权平均数得分即求加权平均数5.某公司计划从两家皮具生产能力相近的制造厂选择一家来承某公司计划从两家皮具生产能力相近的制造厂选择一家来承担外销业务,这两家厂生产的皮具款式和材料都符合要求,因担外销业务,这两家厂
9、生产的皮具款式和材料都符合要求,因此只需要检测皮具质量的克数是否稳定。现从两家提供的样品此只需要检测皮具质量的克数是否稳定。现从两家提供的样品中各抽查中各抽查10件,测得它们得质量如下(单位:件,测得它们得质量如下(单位:g)甲:甲:500,499,500,500,503,498,497,502,500,501;乙:乙:499,500,498,501,500,501,500,499,500,502。你认为应该选择哪一家制造厂承担外销业务?你认为应该选择哪一家制造厂承担外销业务?S2甲甲=2.8S2乙乙=1.2,所以选乙,所以选乙解:解:x甲甲=500(g)x乙乙6.6.某校要从甲、乙两名跳高运
10、动员中挑选一人参加一项校际比赛,某校要从甲、乙两名跳高运动员中挑选一人参加一项校际比赛,在最近的在最近的8 8次选拔赛中,他们的成绩(单位:次选拔赛中,他们的成绩(单位:m m)如下:)如下:甲:甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67乙:乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75(1 1)他们的平均成绩分别是多少?)他们的平均成绩分别是多少?(2 2)哪个人的成绩更为稳定?)哪个人的成绩更为稳定?(3 3)经预测,跳高)经预测,跳高1.65m m就很可能获得冠军,该校为了获取跳高比赛就很可能获得冠军,该校为了获
11、取跳高比赛冠军,可能选哪位运动员参赛?若预测跳高冠军,可能选哪位运动员参赛?若预测跳高1.70m m方可获得冠军呢?方可获得冠军呢?x甲甲=1.69x乙乙=1.68S2甲甲=0.0006S2乙乙=0.00315 1.近年来,我市民用汽车拥有量持续增长,近年来,我市民用汽车拥有量持续增长,2007年至年至2011年年我市民用汽车拥有量依次约我市民用汽车拥有量依次约11,13,15,19,x(单位:万辆单位:万辆),这,这五个数的平均数为五个数的平均数为16,则,则x的值为的值为_.222.在一组数据在一组数据 1,0,4,5,8中插入一个数据中插入一个数据x,使该组数据,使该组数据的中位数为的中
12、位数为3,则插入数据,则插入数据x 是是 。24.已知数据已知数据x1,x,x,xn的平均数为的平均数为3,方差为方差为4,则数据则数据5x1+,5x+,5x+,5xn+的平均数为的平均数为 ,方差为,方差为_.181003.3.已知一组数据已知一组数据2 2,1 1,1 1,0 0,3 3,则这组数据的方差是则这组数据的方差是_.2填空题填空题5 5.某同学进行社会调查,随机抽查某地区某同学进行社会调查,随机抽查某地区2020个家庭的收入情况,个家庭的收入情况,并绘制了统计图请根据统计图给出的信息回答:并绘制了统计图请根据统计图给出的信息回答:年收入(万元)所占户数比年收入年收入0.60.9
13、1.0 1.11.21.31.49.7户数户数(1)填写下表)填写下表11233451(2)这这20个家庭的年平均收入为个家庭的年平均收入为万元。万元。关于年收入关于年收入数据中的中位数是数据中的中位数是万元,众数是万元,众数是万元。万元。1.61.21.36.在某城市在某城市,80%的家庭收入不少于的家庭收入不少于2.5万元万元,下面一定不少下面一定不少于于2.5万元的是万元的是()A.年收入的平均数年收入的平均数 B.年收入的众数年收入的众数C.年收入的中位数年收入的中位数 D.年收入的平均数和众数年收入的平均数和众数C7.某人旅行某人旅行100千米千米,前前50千米的速度为千米的速度为1
14、00千米千米/时时,后后50千千米的速度为米的速度为120千米千米/时时,则此人的平均速度估计为则此人的平均速度估计为()A.100千米千米/时时 B.109千米千米/时时 C.110千米千米/时时 D.115千米千米/时时B8.8.甲、乙两人在相同的条件下,各射靶甲、乙两人在相同的条件下,各射靶1010次,经过计算:次,经过计算:甲、乙射击成绩的平均数都是甲、乙射击成绩的平均数都是8 8环,甲的方差是环,甲的方差是1.2,1.2,乙的方差乙的方差是是1.81.8下列说法中正确的是(下列说法中正确的是()A A甲、乙射中的总环数不相同甲、乙射中的总环数不相同 B B甲的成绩较稳定甲的成绩较稳定
15、 C C乙的成绩波动较小乙的成绩波动较小 D D甲、乙的众数相同甲、乙的众数相同B9.数学老师布置数学老师布置10道选择题,课代表将全班同学的答题情道选择题,课代表将全班同学的答题情况绘制成条形统计图,根据况绘制成条形统计图,根据图表,全班每位同学答对的图表,全班每位同学答对的题数的中位数和众数分别为题数的中位数和众数分别为()学生数学生数答对答对题数题数420188A 8,8 B 8,9 C 9,9 D 9,8D 10.某公司欲招聘一名公关人员,对甲、乙两名候选人进某公司欲招聘一名公关人员,对甲、乙两名候选人进行了面试和笔试,他们的成绩如下表所示:行了面试和笔试,他们的成绩如下表所示:候选人
16、 测试成绩面试笔试甲甲乙乙()如果公司认为面试和()如果公司认为面试和笔试同等重要,从他们的成笔试同等重要,从他们的成绩看,谁将被录取?绩看,谁将被录取?()如果公司认为,作为公关人员面试的成绩比笔试的成()如果公司认为,作为公关人员面试的成绩比笔试的成绩更重要,并分别赋予它们绩更重要,并分别赋予它们和的权和的权,计算甲、乙两人各,计算甲、乙两人各自的平均成绩,看看谁被录取?自的平均成绩,看看谁被录取?甲将被录取甲将被录取乙将被录取乙将被录取11.11.某某商商场场销销售售了了一一批批女女鞋鞋3030双双,其其中中各各种种尺尺码码的的销销售售量量如如下表所示:下表所示:鞋的尺鞋的尺(cm)22
17、22.52323.52424.525销售量(双)销售量(双)12511731(1)计算计算30双女鞋尺寸的平均数、中位数、众数双女鞋尺寸的平均数、中位数、众数(2)请请问问此此商商场场的的经经理理关关注注的的是是这这组组数数据据的的平平均均数数吗吗?他他关关注注的是什么?为什么?的是什么?为什么?若若你是经理,你将如何调整进货数量呢?你是经理,你将如何调整进货数量呢?12.12.八年级要举行篮球投篮比赛,每班各派一名代表参加,根据在八年级要举行篮球投篮比赛,每班各派一名代表参加,根据在3 3分钟时间内投中个数决定出胜负。某班先预选出甲、乙两两位同学,分钟时间内投中个数决定出胜负。某班先预选出甲
18、、乙两两位同学,在相同的条件下各投篮在相同的条件下各投篮1010次,每次投篮的成绩情况如下表所示:次,每次投篮的成绩情况如下表所示:次数次数12345678910甲(个)甲(个)24687789910乙(个)乙(个)9578768677(1 1)请填写下表:)请填写下表:平均数平均数方差方差中位数中位数中中9 9个以上的个数个以上的个数甲甲71乙乙(2)(2)请从不同的角度对这次测试结果进行分析;请从不同的角度对这次测试结果进行分析;(3 3)你将选谁参加比赛?说说你的理由。)你将选谁参加比赛?说说你的理由。77.5705.41.213.工厂有工厂有15名工人,某一天他们生产的机器零件个数统名
19、工人,某一天他们生产的机器零件个数统计如下:计如下:为了提高工作效率和工人的积极性,管理者准备实行每天为了提高工作效率和工人的积极性,管理者准备实行每天生产定额,超产有奖的措施。如果你是管理者,你将如何生产定额,超产有奖的措施。如果你是管理者,你将如何确定这个确定这个“定额定额”?生产零件的个数生产零件的个数(个)(个)67891011131516工人人数工人人数124121121平均数是:平均数是:约约10.1个个中位数是:中位数是:9个个众数是:众数是:8个个注意!注意!在实际情景中,车间管理者在决策时可在实际情景中,车间管理者在决策时可能还需要考虑其他一些因素,如技术的更新、工能还需要考虑其他一些因素,如技术的更新、工人素质的提高等。人素质的提高等。