1、LOGO第第3 章章描述性统计学描述性统计学 Descriptive Statistics:Tabular and Graphical MethodsAdd your company Summarizing Qualitative DataSummarizing Qualitative Data Summarizing Quantitative DataSummarizing Quantitative DataExploratory Data AnalysisExploratory Data Analysis CrosstabulationsCrosstabulations and Scatt
2、er Diagrams and Scatter DiagramsC举重重 射射击 射射击 跳水体操体操跳水体操体操乒乓球球举重重乒乓球羽毛球球羽毛球举重重乒乓球羽毛球球羽毛球举重重举重跳水跳水跳水重跳水跳水跳水乒乓球球跳水射跳水射击体操羽毛球柔道柔道体操羽毛球柔道柔道举重田径羽毛球跆拳道重田径羽毛球跆拳道中国体育代表中国体育代表团在悉尼在悉尼奥运会上奥运会上获金牌的金牌的项目目STATSTAT统计学统计学第二章第二章 统计数据统计数据获金牌金牌项目目金牌数金牌数 占占总数比数比例例跳水枚跳水枚 0.1786举重枚重枚 0.1786乒乓球枚球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体
3、操枚 0.1071射射击枚枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357品品质数列数列STATSTAT统计学统计学第二章第二章 统计数据统计数据获金牌金牌项目目金牌数金牌数 占占总数比数比例例跳水枚跳水枚 0.1786举重枚重枚 0.1786乒乓球枚球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体操枚 0.1071射射击枚枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357变量量值x次数次数 f频率率f/fSTATSTAT统计学统计学第二章第二章 统计数据统计数据圆形形图(饼图 Pie)S
4、TATSTAT统计学统计学第二章第二章 统计数据统计数据STATSTAT统计学统计学第二章第二章 统计数据统计数据圆形形图(饼图 Pie)STATSTAT统计学统计学第二章第二章 统计数据统计数据圆形形图(饼图 Pie)vBar Charts条状图条状图Bar charts provide an alternative to pie charts.The frequency(or relative frequency)of each category is represented by a vertical bar.vExample 2.3-continued(Excel representa
5、tion)STATSTAT统计学统计学第二章第二章 统计数据统计数据条形条形图(Bar)田径跆拳道柔道体操射击羽毛球乒乓球跳水举重Count302826242220181614121086420Percent10090807060504030201002334455帕累托帕累托图Pareto0-80%A类因素因素80-90%B类因素因素90-100%C类因素因素3.3数值型数据的整理与展示数值型数据的整理与展示vFrequency Distribution频数分布vRelative Frequency and Percent Frequency Distributions相对频数和百分数vDo
6、t Plot打点图vHistogram直方图vCumulative Distributions累计分布图vOgive穹形图某年某年级83名女生身高名女生身高资料料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83 变量量值x次数次数f单值(项)数列)数列 身高身高 人数人数 比重比重 (CM)(人)(人)(%
7、)150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上以上 11 13.25 总计 83 100某年某年级83名女生身高名女生身高资料料组距数列距数列次数次数f频率率f/某年某年级83名女生身高名女生身高资料料 身高身高 人数人数 (CM)(人)(人)150-155 3 155-160 11 160-165 34 165-170 24 170以上以上 11 总计 83组距数列距数列上上组限限U下下组限限L组距距dd=U-L如:如:160-155=5组中中值xx=(U+L)/2如如:(165+170)/2=
8、167.5开口开口组d=邻组d估估计上上组限限为175估估计组中中值为单值数列数列组距距为2.5的的组距数列距数列组距距为4的的组距数列距数列组距距为6的的组距数列距数列组数数Sturges 经验公式经验公式最小最小K值法法组距、距、组上限、上限、组下限下限频数表数表(用(用SPSS制作)制作)有效有效数据数据频数数频率率有效有效频率率累累计频率率约2/3的人身高不超的人身高不超过vRelative Frequency and Percent Frequency Distributions Relative Percent Cost($)Frequency Frequency 50-59.04
9、 4 60-69 .2626 70-79.3232 80-89 .1414 90-99.1414 100-109 .1010 Total 1.00 100Example:Hudson Auto RDot PlotvOne of the simplest graphical summaries of data is a dot plot.vA horizontal axis shows the range of data values.vThen each data value is represented by a dot placed above the Example:Hudson Aut
10、o RepairvDot Plot .505050 606060 707070 808080 909090 100100100 110110110 .Cost($)Cost($)直方直方图(Histogram)直方直方图条形条形图直方图直方图研究研究贫富差富差别的基本方法:将人口按的基本方法:将人口按收入水平等分收入水平等分为 5 组,观察收入差察收入差别。20%20%20%20%20%中国九十年代:中国九十年代:最富的最富的20家庭家庭拥有全部有全部财富的富的48,最最穷的的20家家庭庭拥有全部有全部财富的富的4。Lorentz CurveLorentz CurveGA/(AB)ABCumu
11、lative relative percent of populationCumulative relative percent of income累计次数分布图Exploratory Data AnalysisvThe techniques of exploratory data analysis consist of simple arithmetic and easy-to-draw pictures that can be used to summarize data quickly.vOne such technique is the stem-and-leaf Stem-and-L
12、eaf DisplayvA stem-and-leaf display shows both the rank order and shape of the distribution of the data.vIt is similar to a histogram on its side,but it has the advantage of showing the actual data values.vThe first digits of each data item are arranged to the left of a vertical line.vTo the right o
13、f the vertical line we record the last digit for each item in rank order.vEach line in the display is referred to as a stem.vEach digit on a stem is a Example:Hudson Auto RepairvStem-and-Leaf Display 5 2 7 6 2 2 2 2 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 8 0 0 2 3 5 8 9 9 1 3 7 7 7 8 9
14、10 1 4 5 5 Stretched Stem-and-Leaf DisplayvIf we believe the original stem-and-leaf display has condensed the data too much,we can stretch the display by using two more stems for each leading digit(s).vWhenever a stem value is stated twice,the first value corresponds to leaf values of 0-4,and the second values corresponds to values of 5-Example:Hudson Auto RepairvStretched Stem-and-Leaf Display 5 2 5 7 6 2 2 2 2 6 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 7 5 5 5 6 7 8 9 9 9 8 0 0 2 3 8 5 8 9 9 1 3 9 7 7 7 8 9 10 1 4 10 5 5 其它统计图表介绍其它统计图表介绍:象形图象形图LOGOThe end of chapter