《统计学第2章数据的描述幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第2章数据的描述幻灯片.ppt(97页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第2章数据的描述第1页,共97页,编辑于2022年,星期二2.1数据的整理是统计调查的继续,统计分析的前提和基础是统计调查的继续,统计分析的前提和基础 将统计调查得到的数据进行加工将统计调查得到的数据进行加工整理,使其系统化、条理化,符合整理,使其系统化、条理化,符合分析的需要。分析的需要。第2页,共97页,编辑于2022年,星期二统计数据的预处统计数据的预处 理理统计分组统计分组制作统计表或统计制作统计表或统计 图图统计整理的步骤统计整理的步骤第3页,共97页,编辑于2022年,星期二2.1.1统计数据的分组统计数据的分组o1 1、统计分组含义、统计分组含义n按某个标志把总体划分为若干
2、组,称为统计分组。按某个标志把总体划分为若干组,称为统计分组。分组标志是划分数据的标准或依据分组标志是划分数据的标准或依据n分组的性质来:兼有分和合双重含义。分组的性质来:兼有分和合双重含义。o2 2、统计分组的原则、统计分组的原则 穷尽原则穷尽原则 互斥原则互斥原则第4页,共97页,编辑于2022年,星期二o3 3、统计分组方法、统计分组方法 品质标志分组品质标志分组 数量标志分组数量标志分组第5页,共97页,编辑于2022年,星期二o品质分组品质分组品质标志:性别、职业、所有制等。n分组标志一经确定,组名和组数也随之确定分组标志一经确定,组名和组数也随之确定 n品质分组所形成的数列称为品质
3、数列品质分组所形成的数列称为品质数列第6页,共97页,编辑于2022年,星期二如不同品牌饮料市场占有率如不同品牌饮料市场占有率饮料品牌饮料品牌人数人数百分比百分比(%)(%)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐汇源果汁汇源果汁露露露露15151111 9 9 6 6 9 930302222181812121818合计合计5050100100第7页,共97页,编辑于2022年,星期二o数量标志分组数量标志分组 首先,各组数量界限的确定必须能反映事物质的差首先,各组数量界限的确定必须能反映事物质的差别。别。其次,应根据总体的数量特征,采用适当的分组形式。其次,应根据总体的数量特征,
4、采用适当的分组形式。数量标志:年龄、产量、利润等。第8页,共97页,编辑于2022年,星期二第9页,共97页,编辑于2022年,星期二单变量值分组(要点)o1.将一个变量值作为一组将一个变量值作为一组o2.2.适合于变量值较少的适合于变量值较少的 离散变量离散变量第10页,共97页,编辑于2022年,星期二组距分组(要点)1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.适适合合于于连连续续变变量量和和变变量量值值较较多多的的离散变量。离散变量。3.需要遵循需要遵循“不重不漏不重不漏”的原则的原则4.有等距分组和不等距分组有等距分组和不等距分组 第11页,共97页,编辑于2022年,
5、星期二组距分组组距分组(几个概念几个概念)1.1.下限下限(low limit)(low limit):2.2.上限上限(upper limit)(upper limit):3.3.组距组距(class width)(class width):4.4.组中值组中值(class midpoint)(class midpoint):n开口组的组距:以相邻组的组距代替。开口组的组距:以相邻组的组距代替。n常以组中值来代表各组平均水平。常以组中值来代表各组平均水平。第12页,共97页,编辑于2022年,星期二组距分组(步骤)1.确定组数:确定组数:o斯特杰斯经验公式:斯特杰斯经验公式:组数组数=1+3
6、.3 Lg N=1+3.3 Lg N 2.2.确定组距:确定组距:确定组距:确定组距:(Class Width)组距组距组距组距(最大值最大值最大值最大值 -最小值最小值最小值最小值)组数组数 3.3.3.3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 第13页,共97页,编辑于2022年,星期二2.1.2 次数分配次数分配 P17o在分组的基础上,将所有单位归类并列出每一在分组的基础上,将所有单位归类并列出每一组组的次数的次数,称为次数分布或频数分布。,称为次数分布或频数分布。o次数分布数列的两个要
7、素次数分布数列的两个要素n1 1)按某标志所分的组。)按某标志所分的组。n2 2)各组所出现的单位数,即频数,亦称次数。)各组所出现的单位数,即频数,亦称次数。n一般用一般用x x表示变量;用表示变量;用f f表示频数(次数)。表示频数(次数)。第14页,共97页,编辑于2022年,星期二2.1.3 次数分配图次数分配图Excel分组数据分组数据直方图和折线图直方图和折线图第15页,共97页,编辑于2022年,星期二o用直方形的宽度和高度来表示次数分布用直方形的宽度和高度来表示次数分布的图形。的图形。o绘制直方图时,横轴表示各组组限,纵轴绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左
8、方)和比率(或频表示次数(一般标在左方)和比率(或频率,一般标在右方)。率,一般标在右方)。第16页,共97页,编辑于2022年,星期二分组数据的图示140140 150150210210直方图下的面直方图下的面积之和等于积之和等于1 1某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间间的的天天数数最最多多!190190 200200180180160160 170170频频频频数数数数(天天天天天天)25252020151510105 53030
9、220220 230230 240240第17页,共97页,编辑于2022年,星期二o折线图:折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成第18页,共97页,编辑于2022年,星期二分组数据的图示(折线图的绘制)折线图与直方图折线图与直方图下的面积相等!下的面积相等!140140150150210210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190190200200180180160160170170220220230230240240频频频频频频数数数数数数(天天天
10、天天天)25252020151510105 53030第19页,共97页,编辑于2022年,星期二o曲线图:用平滑曲线连接各组次数坐标点即曲线图:用平滑曲线连接各组次数坐标点即得分布曲线。得分布曲线。第20页,共97页,编辑于2022年,星期二频数分布的类型频数分布的类型对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布第21页,共97页,编辑于2022年,星期二2.1.4 洛伦茨曲线与基尼系数洛伦茨曲线与基
11、尼系数第22页,共97页,编辑于2022年,星期二洛伦茨曲线洛伦茨曲线1.1.2020世世 纪纪 初初 美美 国国 经经 济济 学学 家家、统统 计计 学学 家家 洛洛 伦伦 茨茨(M.E.(M.E.Lorentz)Lorentz)根根据据意意大大利利经经济济学学家家巴巴雷雷特特(V.(V.Pareto)Pareto)提提出的收入分配公式绘制而成出的收入分配公式绘制而成2.2.描述收入和财富分配性质的曲线描述收入和财富分配性质的曲线3.3.分析该国家或地区分配的平均程度分析该国家或地区分配的平均程度 AB累积的人口百分比累积的人口百分比累积的人口百分比累积的人口百分比 累累积积的的收收入入百百
12、分分比比 绝对公平线绝对公平线绝对公平线绝对公平线 第23页,共97页,编辑于2022年,星期二基尼系数基尼系数1.1.2020世世纪纪初初意意大大利利经经济济学学家家基基尼尼(G.(G.Gini)Gini)根根据据洛洛伦伦茨茨曲曲线给出了衡收入分配平均程度的指标线给出了衡收入分配平均程度的指标2.A A表示实际收入曲线与绝对平均线之间的面积表示实际收入曲线与绝对平均线之间的面积3.3.B B表示实际收入曲线与绝对不平均线之间的面积表示实际收入曲线与绝对不平均线之间的面积AB第24页,共97页,编辑于2022年,星期二如果如果A=0A=0,则基尼系数,则基尼系数=0=0,表示收入绝对平均,表示
13、收入绝对平均如如果果B=0B=0,则则基基尼尼系系数数=1=1,表表示示收收入入绝绝对对不不平平均均基尼系数在基尼系数在0 0 和和1 1之间取值之间取值一一般般认认为为,基基尼尼系系数数若若小小于于0.20.2,表表明明分分配配平平均均;基基尼尼系系数数在在0.20.2至至0.40.4之之间间是是比比较较适适当当的的,即即一一个个社社会会既既有有效效率率又又没没有有造造成成极极大大的的分分配配不不公公;基基尼尼系系数数在在0.40.4被被认认为为是是收收入入分分配配不不公公平平的的警警戒戒线线,超超过了过了0.40.4应该采取措施缩小这一差距。应该采取措施缩小这一差距。第25页,共97页,编
14、辑于2022年,星期二2.2 2.2 集中趋势的测度集中趋势的测度一一.众数众数二二.中位数和分位数中位数和分位数三三.均值均值四四.众数、中位数和均值的比较众数、中位数和均值的比较第26页,共97页,编辑于2022年,星期二集中趋势集中趋势(central tendency)(central tendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值第27页,共97页,编辑于2022年,星期二2.2.1 众数 (mode)1.集中趋势的测度值之一集中趋势的测度值之一2.出现次数最多的变量值出现次数最多的变量
15、值3.不受极端值的影响不受极端值的影响4.可能没有众数或有几个众数可能没有众数或有几个众数第28页,共97页,编辑于2022年,星期二众数(不唯一性)o无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 5 9 8 5 55 5多于一个众数多于一个众数原始数据原始数据:25 28 28 36 42 42第29页,共97页,编辑于2022年,星期二1 1、由单项数列求众数、由单项数列求众数 某某 车车 间间 工工 人人 日日 产产 情情日产量(件)日产量(件)人数(人)人数(人)11501260139014251515合计合计240第30页,共97页,编辑于2022
16、年,星期二2.2.由组距数列计算由组距数列计算首先确定次数最多的组,即众数组,然后,首先确定次数最多的组,即众数组,然后,用公式计算。用公式计算。下限公式:下限公式:上限公式:上限公式:第31页,共97页,编辑于2022年,星期二2.2.2 2.2.2 中位数中位数 (median)(median)1.排序后处于中间位置上的值Me50%50%2.不受极端值的影响第32页,共97页,编辑于2022年,星期二1 1、由未分组资料计算中位数、由未分组资料计算中位数第33页,共97页,编辑于2022年,星期二 设有六个工人的日产量设有六个工人的日产量(件件)依次排列为依次排列为10、11、12,13、
17、14、15、则:、则:中位数位次(中位数位次(n+1)2 6+123.5第34页,共97页,编辑于2022年,星期二(1 1)由由单项数列单项数列求中位数求中位数2 2、由分组资料计算中位数、由分组资料计算中位数:第35页,共97页,编辑于2022年,星期二例例10:某生产车间:某生产车间120名工人生产某种零件的日产名工人生产某种零件的日产量如下表所示,计算该车间工人日产量的中位数。量如下表所示,计算该车间工人日产量的中位数。按日产量分组(件)按日产量分组(件)工人数(人)工人数(人)累计次数(向上)累计次数(向上)20202222242426263030323233331010121225
18、25303018181515101010102222474777779595110110120120合计合计120120第36页,共97页,编辑于2022年,星期二2.2.由组距数列求中位数,由组距数列求中位数,下限公式:下限公式:L为中位数所在组下限为中位数所在组下限为中位数所在组以前各组的累计次数为中位数所在组以前各组的累计次数为中位数所在组的次数为中位数所在组的次数第37页,共97页,编辑于2022年,星期二从某单位抽查从某单位抽查800户,取得人均收入资料如下表,户,取得人均收入资料如下表,计算该单位人均收入的中位数。计算该单位人均收入的中位数。人均收入(元)人均收入(元)户数(户)户
19、数(户)累计次数累计次数400-500500-600600-700700-800800-900900-10001000以上以上5451004301684210550150580748790800合计合计800第38页,共97页,编辑于2022年,星期二中位数位次中位数位次f28002400,中位数组,中位数组在在700-800这一组中。由下限公式这一组中。由下限公式第39页,共97页,编辑于2022年,星期二o中位数的性质中位数的性质:数据值与中位数之差的绝对值最小数据值与中位数之差的绝对值最小.第40页,共97页,编辑于2022年,星期二2.2.3 四分位数 (quartile)1.排序后处
20、于25%和75%位置上的值QLQMQU25%25%25%25%第41页,共97页,编辑于2022年,星期二四分位数未分组数据:未分组数据:第42页,共97页,编辑于2022年,星期二2.2.4 2.2.4 均值均值 (mean)(mean)1.集中趋势的最常用的测度值第43页,共97页,编辑于2022年,星期二简单算术平均数简单算术平均数(simple mean)(simple mean)第44页,共97页,编辑于2022年,星期二加权算术平均数加权算术平均数(weighted mean)(weighted mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n相应的频
21、数为:相应的频数为:f f1 1,f f2 2,f fk k第45页,共97页,编辑于2022年,星期二(例题分析)o第46页,共97页,编辑于2022年,星期二第47页,共97页,编辑于2022年,星期二(权数对均值的影响权数对均值的影响)P34o甲组:甲组:考试成绩(考试成绩(x):0 20 100o 人数分布(人数分布(f):):1 1 8o乙组:乙组:考试成绩(考试成绩(x):0 20 100o 人数分布(人数分布(f):):8 1 1第48页,共97页,编辑于2022年,星期二算术平均数算术平均数(数学性质数学性质)o1.1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于
22、零 2.各变量值与均值的离差平方和最小第49页,共97页,编辑于2022年,星期二调和平均数(harmonic mean)1.1.均值的另一种表现形式均值的另一种表现形式原来只是计算时使用了不同的数据!第50页,共97页,编辑于2022年,星期二调和平均数某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)X X成交额成交额(元元)X X f f成交量成交量(公公斤斤)f f甲甲乙乙丙丙1.201.200.500.500.800.8018000180001250012500640064001500015000250002500080008000合计合计3
23、6900369004800048000【例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表,计算三种蔬菜该日的平均批发价格表,计算三种蔬菜该日的平均批发价格第51页,共97页,编辑于2022年,星期二第52页,共97页,编辑于2022年,星期二几何平均数(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率第53页,共97页,编辑于2022年,星期二【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均
24、收益率。平均收益率103.84%-1=3.84%第54页,共97页,编辑于2022年,星期二众数、中位数和均值的比较众数、中位数和均值的比较o众数是分布最高峰的位置众数是分布最高峰的位置o中位数从面积上将分布分成两等份中位数从面积上将分布分成两等份o均值由于受极端值的影响,偏向极端值。均值由于受极端值的影响,偏向极端值。第55页,共97页,编辑于2022年,星期二众数、中位数和均值的关系众数、中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布
25、均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值第56页,共97页,编辑于2022年,星期二众数、中位数和均值的特点和应用众数、中位数和均值的特点和应用1.众数众数n不受极端值影响不受极端值影响n具有不唯一性具有不唯一性n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.中位数中位数n不受极端值影响不受极端值影响n数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.平均数平均数n易受极端值影响易受极端值影响n数学
26、性质优良数学性质优良n数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用第57页,共97页,编辑于2022年,星期二2.3 分布离散程度的测度分布离散程度的测度一、极差一、极差二、内距二、内距三、方差和标准差三、方差和标准差四、离散系数四、离散系数第58页,共97页,编辑于2022年,星期二极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7 8 9 107 8 9 10 R=max(xi)-min(xi)第59页,共97页,编辑于2022年,星期二内距内距(Inter-Quartile Range,IQR)(Int
27、er-Quartile Range,IQR)1.1.也称四分位差也称四分位差2.2.上四分位数与下四分位数之差上四分位数与下四分位数之差o 内内 距距=Q Q3 3 Q Q1 13.3.反映了中间反映了中间50%50%数据的离散程度数据的离散程度4.4.不受极端值的影响不受极端值的影响5.5.可用于衡量中位数的代表性可用于衡量中位数的代表性第60页,共97页,编辑于2022年,星期二方差和标准差方差和标准差第61页,共97页,编辑于2022年,星期二方差和标准差(Variance and Standard deviation)1.离散程度最常用的测度值2.反映了各变量值与均值的平均差异第62页
28、,共97页,编辑于2022年,星期二总体方差和标准差(Population variance and Standard deviation)未分组数据:未分组数据:组距分组数据:第63页,共97页,编辑于2022年,星期二样本方差和标准差样本方差和标准差 (simple variance and standard deviation)(simple variance and standard deviation)未分组数据:未分组数据:组距分组数据:组距分组数据:第64页,共97页,编辑于2022年,星期二样本方差P34 自由度(degree of freedom)1.一组数据中可以自由取值的
29、数据的个数2.当样本数据的个数为 n n 时,若样本均值x x 确定后,只有n n-1-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则 x x=5 5。当 x x =5 5 确定后,x x1 1,x x2 2和x x3 3有两个数据可以自由取值,另一个则不能自由取值,比如x x1 1=6=6,x x2 2=7=7,那么x x3 3则必然取2 2,而不能取其他第65页,共97页,编辑于2022年,星期二离散系数第66页,共97页,编辑于2022年,星期二离散系数(coefficient of v
30、ariation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较第67页,共97页,编辑于2022年,星期二某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度第68页,共97页,编辑于
31、2022年,星期二结结论论:计算结果表明,v v1 1 v v2 2,说明产品销售额的离散程度小于销售利润的离散程度 v v1 1=536.25536.25309.19309.19=0.5770.577v v2 2=32.521532.521523.0923.09=0.7100.710第69页,共97页,编辑于2022年,星期二2.5 2.5 统计表与统计图统计表与统计图2.5.1 2.5.1 统计表统计表把统计数据按一定的顺序排列在表格上,就把统计数据按一定的顺序排列在表格上,就形成了统计表。形成了统计表。第70页,共97页,编辑于2022年,星期二统计表的结构19992000年城镇居民家庭
32、抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1999年年 2000年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一就业者负担人数平均一就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元元元元元 400443.141.7756.431.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00资料来源:中国统计年鉴2001,中国统计出
33、版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料表头表头表头表头附附附附加加加加第71页,共97页,编辑于2022年,星期二统计表的设计(比较与选用)第72页,共97页,编辑于2022年,星期二2.5.2 2.5.2 统计图统计图第73页,共97页,编辑于2022年,星期二数值型数据的图示STATISTICASTATISTICA未未分组数据分组数据茎叶图和箱线图茎叶图和箱线图 第74页,共97页,编辑于2022年,星期二第75页,共97页,编辑于2022年,星期二未分组数据茎叶图(ste
34、m-and-leaf display)1.显示显示未分组未分组的原始数据的分布的原始数据的分布2.由由“茎茎”和和“叶叶”两部分数字组成两部分数字组成.3.以高位数作树茎,低位数作树叶以高位数作树茎,低位数作树叶4.树叶上只保留一位数字树叶上只保留一位数字第76页,共97页,编辑于2022年,星期二5.5.茎叶图类似于横置的直方图,但又茎叶图类似于横置的直方图,但又有区别有区别n直直方方图图可可观观察察一一组组数数据据的的分分布布状状况况,但但没有给出具体的数值没有给出具体的数值n茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数数值值,保保留留了
35、了原原始始数数据据的信息的信息第77页,共97页,编辑于2022年,星期二未分组数据茎叶图(例题分析)第78页,共97页,编辑于2022年,星期二未分组数据茎叶图(扩展的茎叶图)第79页,共97页,编辑于2022年,星期二未分组数据箱线图(box plot)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.箱箱线线图图由由一一组组数数据据的的5 5个个特特征征值值绘绘制制而而成成,它由一个箱子和两条线段组成它由一个箱子和两条线段组成3.3.其绘制方法是:其绘制方法是:n首首先先找找出出一一组组数数据据的的5 5个个特特征征值值,即即最最大大值值、最最小小值值、中中位位
36、数数M Me e 和和两两个个四四分分位位数数(下下四四分分位数位数Q QL L和上四分位数和上四分位数Q QU U)n连连接接两两个个四四分分(位位)数数画画出出箱箱子子,再再将将两个极值点与箱子相连接两个极值点与箱子相连接 第80页,共97页,编辑于2022年,星期二未分组数据单批数据箱线图(箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值简单箱线图简单箱线图第81页,共97页,编辑于2022年,星期二未分组数据单批数据箱线图(例题分析)最小值最小值最小值141141141最大值最大值最大值23723723
37、7中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图第82页,共97页,编辑于2022年,星期二分布的形状与箱线图 对称分布对称分
38、布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图第83页,共97页,编辑于2022年,星期二未分组数据多批数据箱线图(例题分析)P43【例例】从某大学管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各
39、科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征第84页,共97页,编辑于2022年,星期二频数分布的类型第85页,共97页,编辑于2022年,星期二计算分析题1.1.某厂某厂400400名职工工资如下名职工工资如下按月工资分组(元)按月工资分组(元)职工人数(人)职工人数(人)450-550550-650650-750750-850850-950601001406040合计合计400根据上述资料计算该厂职工平均工资和标准差。第86页,共97页,编辑于2022年,星期二解:职工人数职工人数f组中值组中值xxf6010014060405006007008009003000060000980
40、0048000360001944000640005600086400019360004002720005440000第87页,共97页,编辑于2022年,星期二2.某县去年年粮食产量资料如下:按单位面积产量分组(千克公顷)播种面积比重3000以下3000-37503750-60006000以上0.050.350.400.20根据上表资料计算该县粮食作物平均单位面积产量。第88页,共97页,编辑于2022年,星期二解:x26253375487571250.050.350.40.2131.251181.251950.001425.001.004687.5第89页,共97页,编辑于2022年,星期二
41、3.某地甲、乙两个农贸市场三种主要蔬菜价格及销售资料如下:品种价格(元千克)甲销售额(万元)乙销售额(万元)ABC0.300.320.3675.040.045.037.580.045.0比较该地区哪个农贸市场蔬菜平均价格高?并说明原因。第90页,共97页,编辑于2022年,星期二解:第91页,共97页,编辑于2022年,星期二4.某工厂生产一批零件共某工厂生产一批零件共1010万件,为了解这批产品的质量,万件,为了解这批产品的质量,采取不重复抽样的方法抽取采取不重复抽样的方法抽取10001000件进行检查,其结果如下,件进行检查,其结果如下,根据质量标准,使用寿命根据质量标准,使用寿命8008
42、00小时及以上者为合格品。计算小时及以上者为合格品。计算平均合格率、标准差及标准差系数。平均合格率、标准差及标准差系数。使用寿命(小时)使用寿命(小时)零件数(件)零件数(件)700以下以下700-800800-900900-10001000-12001200-1400106023045019060合计合计1000第92页,共97页,编辑于2022年,星期二第93页,共97页,编辑于2022年,星期二5 5、甲、乙两单位工人的生产资料如下:、甲、乙两单位工人的生产资料如下:日产量(件日产量(件人人甲单位工人数甲单位工人数(人)(人)乙单位总产量乙单位总产量(件)(件)1 1 120120 30
43、30 2 2 6060 120120合计合计 180180 150150(1 1)哪个单位工人的生产水平高?)哪个单位工人的生产水平高?(2 2)哪个单位工人的生产水平整齐?)哪个单位工人的生产水平整齐?第94页,共97页,编辑于2022年,星期二6.6.甲、乙两班同时对甲、乙两班同时对统计学统计学课程进行测试,甲课程进行测试,甲班平均成绩为班平均成绩为7070分,标准差为分,标准差为9.09.0分;分;乙班的成绩分组资料如下:乙班的成绩分组资料如下:计算乙班学生的平均成绩,并比较甲、乙两班哪计算乙班学生的平均成绩,并比较甲、乙两班哪个班的平均成绩更有代表性?个班的平均成绩更有代表性?第95页
44、,共97页,编辑于2022年,星期二7.7.有甲、乙两个品种的粮食作物,经播种实验后有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为得知甲品种的平均产量为998998斤,标准差为斤,标准差为162.7162.7斤;乙品种实验的资料如下斤;乙品种实验的资料如下:试研究两个品种的平均亩产量,以确定试研究两个品种的平均亩产量,以确定哪一品种具有较大稳定性,更有推广价值?哪一品种具有较大稳定性,更有推广价值?第96页,共97页,编辑于2022年,星期二8 8、下属三个企业销售利润率资料如表、下属三个企业销售利润率资料如表企业 销售利润率%销售利润额(万元)甲乙丙71012506080要求计算三个企业的平均利润率。第97页,共97页,编辑于2022年,星期二