《建模-数据统计与描述分解优秀PPT.ppt》由会员分享,可在线阅读,更多相关《建模-数据统计与描述分解优秀PPT.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 数据统计与描述1 1 统计数据的来源统计数据的来源统计数据的来源统计数据的来源2 2 统计数据的整理统计数据的整理统计数据的整理统计数据的整理3 3 分布集中趋势的测度分布集中趋势的测度分布集中趋势的测度分布集中趋势的测度4 4 分布离散程度的测度分布离散程度的测度分布离散程度的测度分布离散程度的测度5 5 分布偏度与峰度的测度分布偏度与峰度的测度分布偏度与峰度的测度分布偏度与峰度的测度1.统计数据的来源一、间接获得的数据一、间接获得的数据 二、干脆获得的数据二、干脆获得的数据 间接取得的数据InternetInternethttp/http/WWW.WWW.中国统计年中国统计年中国统计年中
2、国统计年鉴鉴鉴鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如各类统计年鉴如各类统计年鉴2.各各类类经经济济信信息息中中心心、信信息息询询问问机机构构、专专业调查机构等供应的数据业调查机构等供应的数据3.各各类类专专业业期期刊刊、报报纸纸、书书籍籍所所供供应应的的资资料料
3、4.各各种种会会议议,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性性、学学术术性性研研讨讨会会上上沟沟通通的的有有关关资料资料5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料 供应统计数据的部分政府网站供应统计数据的部分政府网站 干脆取得的数据普查抽样调查重点调查典型调查普查1.为特定目的特地组织的特别常性全面调查2.通常是一次性或周期性的3.一般须要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄抽样调查1.从总体中随机抽取一部分单位作为样本进行调查,并依据样本调查结果来推断总体特征的数据收集方法 2.具有经济性、时 效性强、适应面广、精确
4、性高等特点 重点调查重点调查:是指在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:着眼于现象量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所探讨现象的标记总量中却占有绝大的比重,在总体中具有举足轻重的作用。典型调查 典型调查是一种特地组织的非全面调查。依据调查的目的,在对所探讨的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和探讨,借以相识事物发展变更的规律。有人也认为它是“目的抽样”,以若干具有代表性的单位为样本。2.统计数据的整理一、次数安排一、次数安排二、次数安排直方图二、次数安排直方图次数安排直方图1.用矩形的宽度和高度来表示频数分布的图形
5、,事实上是用矩形的面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.直方图下的总面积等于1分组数据的图示(直方图的绘制)某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图 折线图1.折线图也称频数多边形图折线图也称频数多边形图2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,
6、具体的做法是4.第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最终终一一个个矩矩形形顶顶部部中点与其竖边中点连接到横轴中点与其竖边中点连接到横轴5.折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者所表示的频数分布是一样的者所表示的频数分布是一样的分组数据的图示(折线图的绘制)折线图与直方图折线图与直方图下的面积相等!下的面积相等!某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图 次数安排的类型对称分布对称分布对称分布右
7、偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布3.分布集中趋势的测度一、众数一、众数二、中位数二、中位数三、均值三、均值四、众数、中位数和均值的比较四、众数、中位数和均值的比较 众数(mode)定义:众数是指社会现象总体中最普遍出现的标定义:众数是指社会现象总体中最普遍出现的标记值。记值。一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值适合于数据量较多时运用适合于数据量较多时运用不受极端值的影响不受极端值的影响一组数据
8、可能没有众数或有几个众数一组数据可能没有众数或有几个众数主要用于分类数据,也可用于依次数据和数值型主要用于分类数据,也可用于依次数据和数值型数据数据 众数(不惟一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42 中位数 定义:中位数是将总体各个单位按其标记值的大小依次排列,处于数列中点的那个单位的标记值,在总体中,标记值小于中位数的单位占一半;标记值大于中位数的单位也占一半。中位数(median)1.1.排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%2
9、.不受极端值的影响不受极端值的影响 中位数的确定 将总体各单位的标记值依据大小依次排列,当总体单位数n为奇数时:当总体单位数n为偶数时,:均值一、算术平均数一、算术平均数二、调和平均数二、调和平均数三、几何平均数三、几何平均数 均值(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必定性特征4.易受极端值的影响 算术平均数算术平均数的基本公式计算平均数的要求:总体标记总量必需是总体各单位标记值的总和,标记值和单位之间一一对应。算术平均数的计算方法(1)简洁算术平均数。简洁算术平均数主要用于未分组资料,用总体各单位标记值简洁加总得到的标记总量除以单位总量而得。计算公式
10、:算术平均数的计算方法l l(2)加权算术平均数。l l A.加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:l l fi 为各组标记值出现的次数。l l B.权数的意义和作用:权数:各组次数(频数)的大小所对应的标记值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn时,加权算术平均数就等于简洁算术平均数。算术平均数的数学性质(1)算术平均数与标记值个数的乘积等于各标记值的总和。简洁算术平均数:加权算术平均数:(2)各个标记值与其算术平均数的离差之和等于零。简洁算术平均数:调和平均数1.简洁调和平均数:标记值的倒数的算术平均数的倒数。几
11、何平均数1.n n 个变量值乘积的个变量值乘积的 n n 次方根次方根2.适用于对比率数据的平均适用于对比率数据的平均3.主要用于计算平均增长率主要用于计算平均增长率4.计算公式为计算公式为众数、中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均
12、值均值均值均值均值均值l l在对称的正态分布条件下:算术平均数等于众数等于在对称的正态分布条件下:算术平均数等于众数等于中位数;中位数;l l在非对称正态分布的状况下,众数、中位数和平均数在非对称正态分布的状况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大;们之间的差别越大;l l当次数安排呈右偏当次数安排呈右偏(正偏正偏)时,算术平均数受极大值的时,算术平均数受极大值的影响;影响;l l当次数安排呈左偏当次数安排呈左偏(负偏负偏)时,算术平均数受微小值的时,算术平均数受微小值的影响;影响;l l中位数则总是
13、介于众数和平均数之间。中位数则总是介于众数和平均数之间。皮尔生阅历法则分布在稍微偏斜的状况下,众数、中位数和算术平均数数量关系的阅历公式为:众数、中位数、均值的特点和应用1.众数众数 不受极端值影响不受极端值影响 具有不惟一性具有不惟一性 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.中位数中位数 不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.均值均值 易受极端值影响易受极端值影响 数学性质优良数学性质优良 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用4.分布离散程度的测度一、极差一、极差二、方差和标准差二、方差和标准差三、
14、离散系数三、离散系数极差1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.离散程度的最简洁测度值离散程度的最简洁测度值3.易受极端值影响易受极端值影响4.未考虑数据的分布未考虑数据的分布 R=max(xi)-min(xi)5.计算公式为计算公式为方差和标准差1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.依据总体数据计算的,称为总体方差或标准差;依据样本数据计算的,称为样本方差或标准差总体方差和标准差 方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式样本方差和标准差 方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式离散系数 1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消退了数据水平凹凸和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为5.分布偏度与峰度的测度一、偏度一、偏度二、峰度二、峰度偏度1、偏度:衡量频数安排不对称程度,或偏斜程度的指标。2、计算公式:(用距法测定)当 =0时,左右完全对称,为正态分布;当 0时为正偏斜;当 0)(0时,表示频数分布比正态分布更集中,分布呈尖峰状态,0)(=0)(0)