《数据分析初步复习材料讲义.doc》由会员分享,可在线阅读,更多相关《数据分析初步复习材料讲义.doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 数据分析初步项目一 知识概要1. 平均数、中位数、众数的概念及举例一般地,对于n个数x1,x2,xn,我们把 ,叫做这n个数的算术平均数,简称平均数。一般地,n个数据按大小顺序排列,处于 的一个数据(或 )叫做这组数据的中位数。一组数据中出现次数 的那个数据叫做这组数据的众数。2. 平均数、中位数、众数的特征(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。 (2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。 (3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。当一组数据中个别数据变动较大时,可选择中位数来
2、表示这组数据的“集中趋势”。(4)众数的可靠性较差,它不受极端数据的影响,求法简便。当一组数据中某些数据多次重复出现时,众数是我们关心的一种统计量。3. 加权平均数 例1:统计一名射击运动员在某次训练中15次射击的中靶环数,获得如下数据: 6,7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运动员射击的平均成绩。4、 方差与标准差在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是标准差公式是项目二 例题精讲【例1】为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参
3、加体育活动的时间是多少?”,共有4个选项: A1.5小时以上 B11.5小时 C0.51小时 D0.5小时以下图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:(1)本次一共调查了多少名学生? (2)在图1中将选项B的部分补充完整;(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下. 图1 图2【例2】:某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示鞋的尺码(cm)23.52424.52526销售量(双)13462这组数据的众数和中位数各是多少?【例3】我市部分学生参加了2004年全国初中
4、数学竞赛决赛,并取得优异成绩. 已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:分数段0192039405960798099100119120140人 数0376895563212请根据以上信息解答下列问题:(1) 全市共有多少人参加本次数学竞赛决赛?最低分和最高分在什么分数范围?(2) 经竞赛组委会评定,竞赛成绩在60分以上 (含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;(3) 决赛成绩分数的中位数落在哪个分数段内?(4) 上表还提供了其他信息,例如:“没获奖的人数为105人”等等. 请你再写出两条此表提供的信息.【例4】:某班
5、甲小组有6人,数学平均成绩为80分,乙小组有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?【例5】:求数据1,3,8,4,9,7,5的中位数。【例6】:某次数学测验满分100分,某班的平均成绩为75分,方差为10,若把每位同学的成绩按满分120分进行换算,则换算后的平均成绩与方差分别为( )和( )。项目三 冲刺必练一、判断题1、若一组数据的众数是5,则这组数据中出现次数最多的是5。 ( )2、一组数据的平均数、众数、中位数有可能相同。 ( )3、一组数据的平均数一定大于其中的每一个数据。 ( )4、一组数据中处于最中间位置的一个数据,叫做这组数据的中位数。( ) 5、某产品的销量占
6、某城市同类产品销量的40%,由此可判断该产品在国内同类产品的销量占40%。 ( )二、填空题1、某班45名学生中,14岁的15人,15岁的18人,16岁的11人,17岁的1人,则这个班学生的平均年龄是 岁(保留两个有效数字)。2、一组数据1、3、6、a 、b的平均数是4,则a与b的和是 。3、某公司招聘推销人员,小亮的成绩是:形象84分,语言能力78分,应变能力88分,这三种成绩平均分是 ,若三种成绩依次按3:4:3的比例来计算,那么这三种测试的平均分是 。4、样本数据10、10、x、8的众数与平均数相同,那么这组数据的中位数是 。5、已知某次测验的最高分、最低分、平均分、中位数,同学甲要知道
7、自己的成绩,属于班级中较高的一半还是较低的一半,应利用上述数据中的_。6、如果样本方差s2(x12)2(x22)2(x32)2(x42)2,那么这个样本的平均数为_,样本容量为_三、选择题1、若一组数据x1、x2 、x3 、x4 、 x5的平均数是a,则另一组数据x1、x2+1、x3+2、x4+3、x5+4的平均数是( )(A) a (B) a+2 (C) a+5/2 (D) a +102、当五个整数从小到大排列,其中位数为4,若这组数中的惟一众数为6,则这5个整数可能的最大和为( )(A) 21 (B) 22 (C)23 (D) 243、在共有15人参加的“讲诚信”演讲比赛中,参赛选手的成绩
8、各不相同,因此选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的( )(A) 平均数 (B) 中位数 (C) 众数 (D) 以上答案都不正确4、某校在预防“非典型肺炎”过程中,坚持每日检查体温,下表是该校八年级四班同学一天的体温数据统计表,则该班40名学生体温的中位数是( )体 温(t)36.036.136.236.336.436.536.636.736.836.937.0人 数02057563831(A) 36.8 (B) 36.5 (C) 36.6 (D) 36.45、 A、B、C、D、E五名射击运动员在一次比赛中的平均成绩是80环,而A、B、C三人的平均成绩是78环,那么
9、下列说法中一定正确的是( )A. D、E的成绩比其他三人好 B.B、E两人的平均成绩是83环C. 最高分得主不是A、B、C D. D、E中至少有1人的成绩不少于83环。6、 如果a、b、c的中位数与众数都是5,平均数是4,那么a可能是( ) A. 2 B. 3 C. 4 D. 67、 由小到大排列一组数据a1、a2、a3、a4、a5,其中每个数据都小于0,则对于样本a1、a2、a3、a4、a5、0的中位数可表示为( ) A. B. C. D. 8、下列说法中正确的有( )(1)描述一组数据的平均数只有一个;(2)描述一组数据的中位数只有一个;(3)描述一组数据的众数只有一个;(4)描述一组数据
10、的平均数,中位数,众数都一定是这组数据里的数;(5)一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数,众数,中 位数。 A. 1个B. 2个C. 3个D. 4个9、一城市准备选购一千株高度大约为2 m的某种风景树来进行街道绿化,有四个苗圃生产基地投标(单株树的价格都一样)采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下:树苗平均高度(单位:m)标准差甲苗圃1.80.2乙苗圃1.80.6丙苗圃2.00.6丁苗圃2.00.2请你帮采购小组出谋划策,应选购()A甲苗圃的树苗 B乙苗圃的树苗C丙苗圃的树苗 D丁苗圃的树苗10、衡量样本和总体的波动大小的特征数是()A平均数
11、B方差 C众数 D中位数四、解答题1. 已知两组数x1,x2xn和y1,y2yn;它们的平均数分别是和。分别求下列各组新数据的平均数:(1)5x1,5x2,5xn;(2) x1y1,x2y2,xnyn;(3)x1,y1,x2,y2,xn,yn。2. 某商厦在“十一长假期间”平均每天的营业额为20万元,由此推断10月份该商厦的总营业额约为2030=620(万元)。根据你所学的数理统计知识,你认为这样的推断是否合理?为什么?3.右图是某班学生某次英语考试成绩分析图,其中纵轴表示学生数,横轴表示分数,观察图形填空或回答下列问题。(1)全班共有人_;(2)如果80分以上的成绩算优良,那么该班学生此次英
12、语考试成绩的优良率为_;(3)请估算该班此次考试的平均成绩。 度数(度)9093102113114120天数(天)1123124. 某中学为了了解全校的耗电情况,抽查了10天中每天的耗电量数据如下表(1) 写出上表中数据的众数和平均数;(2) 由上题获得的数据,估计该校一个月的耗电量(按30天计算);(3) 若当地每度电的价格是0.5元,写出该校应付电费y(元)与天数x(x取正数,单位:天)之间的函数关系式。5、汶川地震牵动着全国亿万人民的心,某校为地震灾区开展了“献出我们的爱”赈灾捐款活动。八年级(1)班50名同学积极参加,班长统计了全班捐款情况如下表,因不慎有两处被墨水污染,已无法看清。但知全班平均每人捐款38元,根据以上信息,请你求出捐款40元,50元的学生人数,并写出解答过程; 6、在某旅游景区上山的一条小路上,有一些断断续续的台阶,下图是其中的甲、乙两段台阶的示意图(图中的数字表示每一级台阶的高度(单位: cm)并且数据15,16,16,14,14,15的方差,数据11,15,18,17,10,19的方差)。请你用所学过的有关统计的知识(平均数、中位数、方差和极差)回答下列问题:(1)两段台阶路有哪些相同点和不同点?(2)哪段台阶路走起来更舒服?为什么?(3)为方便游客行走,需要重新整修上山的小路对于这两段台阶路,在台阶数不变的情况下,请提出合理的整修建议.