数值变量资料的统计描述.ppt

上传人:wuy****n92 文档编号:64355703 上传时间:2022-11-29 格式:PPT 页数:112 大小:1.03MB
返回 下载 相关 举报
数值变量资料的统计描述.ppt_第1页
第1页 / 共112页
数值变量资料的统计描述.ppt_第2页
第2页 / 共112页
点击查看更多>>
资源描述

《数值变量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计描述.ppt(112页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第八章第八章 数值变量资料的统计描述数值变量资料的统计描述2022/11/292022/11/291 1回顾回顾:根据是否定量划分根据是否定量划分根据是否定量划分根据是否定量划分,资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型资料被分作不同的类型:n n数值资料数值资料数值资料数值资料(measurement data):(measurement data):(measurement data):(measurement data):用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测

2、量得到的资料,亦称作亦称作亦称作亦称作计量资料计量资料计量资料计量资料。n n分类变量资料分类变量资料分类变量资料分类变量资料(enumeration data):(enumeration data):(enumeration data):(enumeration data):用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料用定性的方法得到的资料,亦称亦称亦称亦称计数资料。计数资料。计数资料。计数资料。n n等级资料等级资料等级资料等级资料(ranked data):(ranked data):(ranked data):(ranked data):不能精确测量不能精确测量不

3、能精确测量不能精确测量,仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。2022/11/292022/11/292 2第一节 数值变量资料频数分布 数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。数分布表或分布图

4、了解资料的分布特征。数分布表或分布图了解资料的分布特征。数分布表或分布图了解资料的分布特征。一、频数分布表及其制作一、频数分布表及其制作 2022/11/292022/11/293 3例例8.1 8.1 某地区某地区20022002年年55555858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测定值如下,试编制频数表和观察频数分布情况。测定值如下,试编制频数表和观察频数分布情况。5.175.175.565.564.864.864.874.874.744.745.245.245.515.514.464.464.964.964.824.824.904.905.305.

5、305.225.225.585.584.484.484.804.804.64.64.024.025.165.165.365.364.344.344.244.244.644.644.274.274.254.254.444.444.464.464.624.624.874.874.344.344.904.905.255.254.774.774.854.855.075.074.164.164.664.664.704.704.204.203.953.954.094.094.644.644.334.335.215.214.614.614.984.985.245.244.604.604.254.254.78

6、4.785.005.003.603.603.603.604.114.114.614.614.084.084.784.784.264.264.444.444.384.384.44.44.794.794.764.764.924.924.604.604.784.785.035.034.354.354.184.184.684.684.654.654.574.574.274.274.994.994.214.214.894.894.714.714.724.724.414.414.384.384.064.064.794.794.964.964.834.834.454.454.514.514.274.274.

7、504.504.314.315.055.055.595.595.595.595.085.085.165.163.743.744.364.365.365.364.644.645.095.094.574.574.464.464.564.564.394.395.245.244.614.614.214.214.964.964.344.344.454.454.864.864.504.504.904.904.454.454.494.494.424.424.684.684.564.565.385.384.344.344.464.464.164.164.984.984.294.294.834.834.274.

8、273.683.683.853.853.863.864.564.564.564.564.554.555.165.165.155.155.165.162022/11/292022/11/294 4编制频数分布表的步骤编制频数分布表的步骤计计算算极极差差编制频数分编制频数分布表的步骤布表的步骤确确定定组组数数组组距距计计算算频频数数编编制制表表格格2022/11/292022/11/295 5频数表的编制步骤频数表的编制步骤:(1 1)求极差求极差(rangerange):即最大值与最小值之差,又称):即最大值与最小值之差,又称为全距。为全距。R R5.593.60=1.99(mol/L)5.59

9、3.60=1.99(mol/L)(2 2)决定组数、组段和组距:决定组数、组段和组距:根据研究目的和样本含量根据研究目的和样本含量n n确定分组组数。相邻两组段下限值之差称组距,组距确定分组组数。相邻两组段下限值之差称组距,组距=极极差差/组数,为方便计,组距为极差的十分之一组数,为方便计,组距为极差的十分之一,再略加调再略加调整。整。1.99/10 =0.199 0.2(mol/L)1.99/10 =0.199 0.2(mol/L)(3 3)列出组段列出组段:第一组段的下限必须包含最小值,最:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。后一个组段上限必须大于或等于最大

10、值。3.63.6 3.8 3.8 5.2 5.2 5.4 5.4 5.6 5.6(4 4)划记计数划记计数:用划记法将所有数据归纳到各组段,:用划记法将所有数据归纳到各组段,得到各组段的频数。得到各组段的频数。2022/11/292022/11/296 62022/11/292022/11/297 7表8-1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3

11、3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 2

12、0 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132132100.00 100.00 2022/11/292022/11/298 8血糖血糖(mol/L)人人数数图图图图8-18-18-18-1某地区某地区某地区某地区200

13、2200220022002年年年年55555555 58585858岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)(mmol/L)(mmol/L)测定值的频数分布图测定值的频数分布图测定值的频数分布图测定值的频数分布图二、频数分布图二、频数分布图2022/11/292022/11/299 9 同一组资料,不同的人编制的同一组资料,不同的人编制的频数表,结果不尽相同,允许几个频数表,结果不尽相同,允许几个合理的结果并存。合理的结果并存。2022/11/292022/11/291010三、频数表和频数分布图用途三、频数表和频数分布图

14、用途1 1描述频数分布的类型描述频数分布的类型描述频数分布的类型描述频数分布的类型(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)(对称分布、偏态分布)2 2描述频数分布的特征描述频数分布的特征描述频数分布的特征描述频数分布的特征(集中趋势集中趋势集中趋势集中趋势 离散趋势)离散趋势)离散趋势)离散趋势)3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值4 4便于便于便于便于进一步做统计分析进一步做统计分析进一步做统计分析进一步做统计分析和处理(加权)和处理(加权)和处理(加权)和处理(加权)2022

15、/11/292022/11/291111(1 1 1 1)对称分布)对称分布)对称分布)对称分布 :若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布1描述频数分布的类型(对称分布、偏态分布)描述频数分布的类型(对称分布、偏态分布)2022/11/292022/11/291212(2)偏态分布)偏态分布:n n1 1)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段

16、)右偏态分布(正偏态分布):右侧的组段)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。数多于左侧的组段数,频数向右侧拖尾。n n2 2)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布)左偏态分布(负偏态分布):左侧的组段左侧的组段左侧的组段左侧的组段数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。数多于右侧的组段数,频数向左侧拖尾。2022/11/292022/11/291313正偏态(右偏态)正偏态(右偏态)负偏

17、态(左偏态)负偏态(左偏态)返回2022/11/292022/11/291414频数分布的类型频数分布的类型对称分布对称分布对称分布正偏态分布正偏态分布正偏态分布负偏态分布负偏态分布负偏态分布2022/11/292022/11/2915152 2描述频数分布的特征描述频数分布的特征图图图图8-18-1(P P154154)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:)数据的频数分布特征:数据数据数据数据变异(离散)变异(离散)变异(离散)变异(离散)的范围在的范围在的范围在的范围在3.605.60(mol/L3.605.60(mol/L)数据数据数据数据集中(平均)集中(平

18、均)集中(平均)集中(平均)的组段的组段的组段的组段在在在在4.205.00(mol/L4.205.00(mol/L)之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数之间,尤以组段的人数4.604.804.604.80(mol/L(mol/L)最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频最多。且上下组段的频数分布基本对称。数分布基本对称。数分布基本对称。数分布基本对称。返回2022/11/292022/11/2916163便于发现一些特大或特小的可疑值返回2022/11/292022/11/291717第二节 集中趋势指标n n统计上使用统计上使用统计上使用统计上使

19、用平均数(平均数(平均数(平均数(averageaverageaverageaverage)这一指标体系来描这一指标体系来描这一指标体系来描这一指标体系来描述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。n n常用的平均数有常用的平均数有常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(算术均数(均数)(算术均数(均数)(meanmeanmeanmean)几何均数(几何均数(几何均数(几何均数(geometric meangeometric meangeometric meangeometr

20、ic mean)中位数中位数中位数中位数 (medianmedianmedianmedian)百分位数(百分位数(百分位数(百分位数(percentilepercentilepercentilepercentile)2022/11/292022/11/291818一、算术均数算术均数:简称均数(算术均数:简称均数(meanmean)n n定定义义:是是一一组组变变量量值值之之和和除除以以变变量量值值个个数数所所得得的的商商。均均数数适适用用于于资资料料呈呈正正态态分分布布(或近似正态或对称分布)资料(或近似正态或对称分布)资料。n n总体均数总体均数:样本均数样本均数:x2022/11/292

21、022/11/2919191、计算方法(1 1)直接计算法)直接计算法)直接计算法)直接计算法 公式公式:例例例例8.28.28.28.2有有有有9 9 9 9名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值名健康成人的空腹胆固醇测定值(mol/L)(mol/L)(mol/L)(mol/L)为为为为:5.61:5.61:5.61:5.61,3.963.963.963.96,3.673.673.673.67,4.994.994.994.99,4.244.244.244.24,5.065.065.065.06,5.205.205.205.20,4.794.794

22、.794.79,5.935.935.935.93求算术平均数。求算术平均数。求算术平均数。求算术平均数。x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9 =4.83(mol/L)=4.83(mol/L)2022/11/292022/11/292020例例8.1 8.1 某地区某地区20022002年年5555 5858岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测测定值如下,试编制频数表和观察频数分布情况。定值如下,试编制频数表和观察频

23、数分布情况。5.175.175.175.175.565.565.565.564.864.864.864.864.874.874.874.874.744.744.744.745.245.245.245.245.515.515.515.514.464.464.464.464.964.964.964.964.824.824.824.824.904.904.904.905.305.305.305.305.225.225.225.225.585.585.585.584.484.484.484.484.804.804.804.804.64.64.64.64.024.024.024.025.165.165.

24、165.165.365.365.365.364.344.344.344.344.244.244.244.244.644.644.644.644.274.274.274.274.254.254.254.254.444.444.444.444.464.464.464.464.624.624.624.624.874.874.874.874.344.344.344.344.904.904.904.905.255.255.255.254.774.774.774.774.854.854.854.855.075.075.075.074.164.164.164.164.664.664.664.664.704.

25、704.704.704.24.24.24.23.953.953.953.954.094.094.094.094.644.644.644.644.334.334.334.335.215.215.215.214.614.614.614.614.984.984.984.985.245.245.245.244.604.604.604.604.254.254.254.254.784.784.784.785.005.005.005.003.603.603.603.604.114.114.114.114.614.614.614.614.084.084.084.084.784.784.784.784.264.

26、264.264.264.444.444.444.444.384.384.384.384.44.44.44.44.794.794.794.794.764.764.764.764.924.924.924.924.604.604.604.604.784.784.784.785.035.035.035.034.354.354.354.354.184.184.184.184.684.684.684.684.654.654.654.654.574.574.574.574.274.274.274.274.994.994.994.994.214.214.214.214.894.894.894.894.714.

27、714.714.714.724.724.724.724.414.414.414.414.384.384.384.384.064.064.064.064.794.794.794.794.964.964.964.964.834.834.834.834.454.454.454.454.514.514.514.514.274.274.274.274.504.504.504.504.314.314.314.315.055.055.055.055.595.595.595.595.085.085.085.085.165.165.165.163.743.743.743.744.364.364.364.365.

28、365.365.365.364.644.644.644.645.095.095.095.094.574.574.574.574.464.464.464.464.564.564.564.564.394.394.394.395.245.245.245.244.614.614.614.614.214.214.214.214.964.964.964.964.344.344.344.344.454.454.454.454.864.864.864.864.504.504.504.504.904.904.904.904.454.454.454.454.494.494.494.494.424.424.424.

29、424.684.684.684.684.564.564.564.565.385.385.385.384.344.344.344.344.464.464.464.464.164.164.164.164.984.984.984.984.294.294.294.294.834.834.834.834.274.274.274.273.683.683.683.683.853.853.853.853.863.863.863.864.564.564.564.564.564.564.564.564.554.554.554.555.165.165.165.165.155.155.155.155.165.165.

30、165.16x=(5.17+5.56+5.15+5.16)/132=4.648(mol/L)x=(5.17+5.56+5.15+5.16)/132=4.648(mol/L)2022/11/292022/11/292121(2)加权法(利用频数表)公式公式公式公式:k:频数表的组段数:频数表的组段数 f:频数:频数 :组中值,其中:组中值,其中i=1,2,k。2022/11/292022/11/292222表表8-1 某地区某地区2002年年5558岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)测定值的频数分布表测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段频数频数()

31、()组中值组中值()3.603.603 3 3.70 3.70 11.10 11.10 41.07 41.07 3.803.803 3 3.90 3.90 11.70 11.70 45.63 45.63 4.004.008 8 4.10 4.10 32.80 32.80 134.48 134.48 4.204.2023 23 4.30 4.30 98.90 98.90 425.27 425.27 4.404.4024 24 4.50 4.50 108.00 108.00 486.00 486.00 4.604.6025 25 4.70 4.70 117.50 117.50 552.25 552

32、.25 4.804.8020 20 4.90 4.90 98.00 98.00 480.20 480.20 5.005.0012 12 5.10 5.10 61.20 61.20 312.12 312.12 5.205.2010 10 5.30 5.30 53.00 53.00 280.90 280.90 5.405.405.605.604 4 5.50 5.50 22.00 22.00 121.00 121.00 合计合计132132614.20614.202878.922878.92 x=614.2/132=4.653(mol/L)x=614.2/132=4.653(mol/L)2022/

33、11/292022/11/292323二、几何均数(geometric mean)n n定义:用定义:用定义:用定义:用G G表示,是将表示,是将表示,是将表示,是将n n个观察值个观察值个观察值个观察值x x的乘积再开的乘积再开的乘积再开的乘积再开n n次方次方次方次方的方根(或各观察值的方根(或各观察值的方根(或各观察值的方根(或各观察值x x对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。其适用条件是:其适用条件是:其适用条件是:其适用条件是:当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分

34、布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。似倍数关系。似倍数关系。似倍数关系。2022/11/292022/11/292424几何均数计算公式:几何均数:几何均数:变量对数值的变量对数值的算术均数的反对数。算术均数的

35、反对数。n n计算几何均数的观察值应大于零 2022/11/292022/11/292525例8.3 有有7 7份血清的抗体效价分份血清的抗体效价分别为别为1:2,1:4,1:8,1:16,1:32,1:2,1:4,1:8,1:16,1:32,1:64,1:128,1:64,1:128,求平均抗体效价。求平均抗体效价。2022/11/292022/11/292626(2)加权法(当观察例数多时采用)(当观察例数多时采用)公式:公式:2022/11/292022/11/292727例8.4 有有6060人的血清抗体效价,分别为人的血清抗体效价,分别为:7:7人人1:51:5,1111人人1:10

36、1:10,2222人人1:201:20,1212人人1:401:40,8 8人人1:801:80,求平均抗体效价。,求平均抗体效价。n n50人的血清平均抗体效价为1:20.705。2022/11/292022/11/292828例例8.4 8.4 有有6060人的血清抗体效价,求其平均抗体效价人的血清抗体效价,求其平均抗体效价2022/11/292022/11/292929计算几何均数应该注意的事项v变变量量值值中中不不能能有有0 0或或负负数数,因因为为0 0和和负负数数不不能取对数。能取对数。v不不能能同同时时有有正正有有负负。若若全全部部是是负负值值,计计算算时时可可先先把把负负号号去

37、去掉掉,得得出出结结果果后后,再再加加上上负负号。号。2022/11/292022/11/293030三、三、中位数与百分位数中位数与百分位数(一)中位数(一)中位数(一)中位数(一)中位数(medianmedian)qq定义:用符号定义:用符号定义:用符号定义:用符号M M M M表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,按大小顺序按大小顺序按大小顺序按大小顺序排列排列排列排列,位置居中的数值(位置居中的数值(位置居中的数值(位置居中的数值(n n n n为奇数)或位置居中的两个数值为奇数)或位置居中的两个数值为奇数)或位

38、置居中的两个数值为奇数)或位置居中的两个数值的均值(的均值(的均值(的均值(n n n n为偶数)。为偶数)。为偶数)。为偶数)。qq其适用情况有:其适用情况有:其适用情况有:其适用情况有:当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料一端或两端无确定数值(如大于或小于某数值);资料的分布情况不清楚资料的分布情况不清楚资料的分布情况不清楚资料的分布情况不清楚。MMe e50%50%2022/11/2

39、92022/11/293131计算公式计算公式:n为奇数时为奇数时n为偶数时为偶数时 2022/11/292022/11/293232例8.5 7 7名正常人的血压名正常人的血压(舒张压舒张压)测定测定值值(mmHg)为为:72,75,76,77,81,82,86,求求中位数中位数。n n从小到大排列:72,75,76,77,81,82,86n n若又观察了一个人的血压,为87(mmHg),此时(77+81)/2=79(mmHg)2022/11/292022/11/293333n n例:1,3,7,5,100n 中位数为多少?2022/11/292022/11/293434频数表资料的中位数频

40、数表资料的中位数(P157公式8.5)下限值下限值L L上限值上限值U Ui;fm中位数中位数M M2022/11/292022/11/293535例例例例8.18.18.18.1频数表中位数的计算频数表中位数的计算频数表中位数的计算频数表中位数的计算血糖血糖(mol/L)(mol/L)组段组段组中值组中值()频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.

41、004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.604.604.70 4.70 4.70 4.70 25 25 25 25 86 86 86 86 18.94 18.94 18.94 18.94 65.15 65.15 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15

42、.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132(fi)132(fi)100.00 100.00 n n4.60+(0.20/25)*132/2-61=4.644.60+(0.20/25)*132/2-61=4.642022/11/292022/11/29363

43、6 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile)n n把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。n n中位数是第50百分位数,用P5050表示。2022/11/292022/11/2937372022/11/292022/11/293838Trunc()取整函数取整函数 设有设有X个原始数据从小到大排列,第个原始数据从小到大排列,第X百分位数的计算公式为:百分位数的计算公式为:1 1直接计算法直接计算法当当 为带有小数位时:为带有小数位时:当当 为为 整数时:整数时:2022/11/292022/11/293

44、939例例对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,对某医院细菌性痢疾治愈者的住院天数统计,120120名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第5 5百百百百分位数和第分位数和第分位数和第分位数和第9999百分位数。百分位数。百分位数。百分位数。,为整数为整数为整数为整数:患者编号患者编号:住院天数住院天数:(1)n=120,2022/11/292022/11/294040带有小数带有小数(2)故取

45、整故取整 trunc(118.8)=1182022/11/292022/11/2941412 2频数表法频数表法公式:公式:2022/11/292022/11/294242n n 当 时,公式(8.5)即为中位数的计算公式:2022/11/292022/11/294343例例例例8.18.1试分别求例试分别求例试分别求例试分别求例8.18.1频数表的第频数表的第频数表的第频数表的第2525、第、第、第、第7575百分位数。百分位数。百分位数。百分位数。P P25254.20+0.204.20+0.20(132(13225%25%14)/2314)/234.3654.365P P75754.80

46、+0.204.80+0.20(132(13275%75%86)/2086)/204.9304.930血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(xi)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.603.603.70 3.70 3.70 3.70 3 3 3 3 3 3 3 32.27 2.27 2.27 2.27 2.27 2.27 2.27 2.27 3.803.803.803.803.90 3.90 3.90 3.90 3 3 3 3 6 6 6 6 2.27 2.27 2.27 2.27 4.55

47、 4.55 4.55 4.55 4.004.004.004.004.10 4.10 4.10 4.10 8 8 8 8 14 14 14 14 6.06 6.06 6.06 6.06 10.61 10.61 10.61 10.61 4.204.204.204.204.30 4.30 4.30 4.30 23 23 23 23 37 37 37 37 17.42 17.42 17.42 17.42 28.03 28.03 28.03 28.03 4.404.404.404.404.50 4.50 4.50 4.50 24 24 24 24 61 61 61 61 18.18 18.18 18.1

48、8 18.18 46.21 46.21 46.21 46.21 4.604.604.604.604.70 4.70 4.70 4.70 25 25 25 25 86 86 86 86 18.94 18.94 18.94 18.94 65.15 65.15 65.15 65.15 4.804.804.804.804.90 4.90 4.90 4.90 20 20 20 20 106 106 106 106 15.15 15.15 15.15 15.15 80.30 80.30 80.30 80.30 5.005.005.005.005.10 5.10 5.10 5.10 12 12 12 12

49、118 118 118 118 9.09 9.09 9.09 9.09 89.39 89.39 89.39 89.39 5.205.205.205.205.30 5.30 5.30 5.30 10 10 10 10 128 128 128 128 7.58 7.58 7.58 7.58 96.97 96.97 96.97 96.97 5.405.405.405.405.605.605.605.605.50 5.50 5.50 5.50 4 4 4 4 132 132 132 132 3.03 3.03 3.03 3.03 100.00 100.00 100.00 100.00 合计合计合计合计

50、132(fi)132(fi)132(fi)132(fi)100.00 100.00 100.00 100.00 2022/11/292022/11/294444三种平均数的特点vv算术均数:算术均数:算术均数:算术均数:通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不或特小值)或资料呈偏态分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁