《多元描述统计讲稿.ppt》由会员分享,可在线阅读,更多相关《多元描述统计讲稿.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元描述统计多元描述统计1第一页,讲稿共五十八页哦多元数据的表格形式多元数据的表格形式n n设设p p个变量来记录事物的特征,对于每个个体或单位,记录下这个变量来记录事物的特征,对于每个个体或单位,记录下这些变量的测量值。我们用记号表示第些变量的测量值。我们用记号表示第i i个样本上第个样本上第j j个变量的测量值,个变量的测量值,即即 x xij ij=第第j j个变量的第个变量的第i i项测量值项测量值 第二页,讲稿共五十八页哦多元数据的矩阵形式多元数据的矩阵形式n nX=(xij)np第三页,讲稿共五十八页哦例题分析例题分析n n消费者物价指数消费者物价指数(CPI)是反映与居民生活有关
2、的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。商品零售价格指数是反映一定时期内商品零售价格变动趋势和程度的相对数。两者都能为研究市场流通、进行国民经济核算提供依据。第四页,讲稿共五十八页哦n n样本数据的矩阵形式为:第五页,讲稿共五十八页哦多元描述统计量多元描述统计量n n样本均值n n样本协方差n n样本相关系数第六页,讲稿共五十八页哦样本均值样本均值n n矩阵形式n n其中第七页,讲稿共五十八页哦样本协方差样本协方差n n矩阵形式n n其中其中n n事实上,事实上,事实上,事实上,s sjkjk是变量是变量是变量是变量j j和和和和k k的协方差的协方差的协方
3、差的协方差n n当当当当j j=k k时,时,时,时,s sjj jj是变量是变量是变量是变量j j的方差,也常记为的方差,也常记为的方差,也常记为的方差,也常记为n nsjk=skj,即,即S是对称矩阵。是对称矩阵。第八页,讲稿共五十八页哦样本相关系数样本相关系数n n矩阵形式n n其中其中n nR也为对称矩阵也为对称矩阵第九页,讲稿共五十八页哦数据的标准化处理数据的标准化处理n n公式公式n n其中其中其中其中n n此时,此时,第十页,讲稿共五十八页哦SPSS应用应用-样本均值和方差样本均值和方差n nAnalyze Descriptive Statistics Frequencies 统
4、计量统计量第十一页,讲稿共五十八页哦n n单击“Statistics”按钮,弹出按钮,弹出“FrequenciesFrequencies:StatisticsStatistics”对话框分位数分位数离散离散程度程度集中集中趋势趋势第十二页,讲稿共五十八页哦n n输出结果 X1X2NValid4 4 Missing00Mean104.4500103.5000Variance3.536673.44667n n结果解释n n两个变量的均值分别为两个变量的均值分别为104.45104.45和和103.5103.5n n两个变量的方差分别为两个变量的方差分别为3.536673.53667和和3.4466
5、73.44667Statistics第十三页,讲稿共五十八页哦SPSS应用应用-样本协方差样本协方差n nAnalyze Scale Reliability Analysis 第十四页,讲稿共五十八页哦n n单击“Statistics”按钮,弹出“Reliability Analysis:Statistics”对话框 第十五页,讲稿共五十八页哦n n输出结果 R E L I A B I L I T Y A N A L Y S I S -S C A L E (A L P H A)Covariance Matrix X1 X2X1 3.5367X2 3.3933 3.4467 N of Cases
6、=4.0Reliability Coefficients 2 itemsAlpha=.9857 Standardized item alpha=.9858第十六页,讲稿共五十八页哦SPSS应用应用-样本相关系数样本相关系数n nAnalyze Correlate Bivariate 第十七页,讲稿共五十八页哦n n输出结果 X1X2X1Pearson Correlation1.972(*)Sig.(2-tailed).028 N44X2Pearson Correlation.972(*)1 Sig.(2-tailed).028.N44n n结果解释n n 两个变量之间的相关系数为0.972,P
7、值为0.028(小于显著性水平0.05),所以相关性显著。第十八页,讲稿共五十八页哦SPSS应用应用-数据的标准化变换数据的标准化变换n nAnalyze Descriptive Statistics Descriptives第十九页,讲稿共五十八页哦n n输出结果(1)NMinimumMaximumMeanStd.DeviationX14102.50106.30104.45001.88060X24101.40105.30103.50001.85652Valid N(listwise)4 第二十页,讲稿共五十八页哦n n输出结果(2)n n结果解释n n表中的表中的“zx1zx1”和“zx2z
8、x2”为标准化后的值,可以进行后为标准化后的值,可以进行后续的统计分析续的统计分析第二十一页,讲稿共五十八页哦常用的统计图常用的统计图n n散点图n n条形图n n线图n n第二十二页,讲稿共五十八页哦注意问题注意问题n n利用图表表示数据时,首先要确定数据所属类型是定性利用图表表示数据时,首先要确定数据所属类型是定性数据还是定量数据数据还是定量数据n n定性数据常用的图形表示:定性数据常用的图形表示:n n条形图条形图n n饼图饼图n n环形图环形图n n定性数据常用的图形表示:定性数据常用的图形表示:n n直方图直方图n n茎叶图茎叶图n n箱线图箱线图n n散点图散点图n n气泡图气泡图
9、n n雷达图雷达图第二十三页,讲稿共五十八页哦定性数据的图示定性数据的图示条形图条形图1.1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.2.有单式条形图、复式条形图等形式3.3.主要用于反映分类数据的频数分布4.4.绘制时,各类别可以放在纵轴,称为条条形图形图,也可以放在横轴,称为柱形图柱形图第二十四页,讲稿共五十八页哦用用Excel生成频数分布表生成频数分布表(例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同类类类类型型型型饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对
10、对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的类类类类型型型型进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一类类类类型型型型的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一类类类类型型型型的的的的饮饮饮饮料料料料记记记记录录录录一一一一次次次次。右右右右边边边边就是就是就是就是记录记录记录记录的原始数据的原始数据的原始数据
11、的原始数据绿色绿色绿色绿色健康饮品健康饮品第二十五页,讲稿共五十八页哦定性数据的图示定性数据的图示条形图条形图(例题分析例题分析)第二十六页,讲稿共五十八页哦使用使用Excel数据透视表数计数数据透视表数计数(pivot table)n n第第第第1 1步:步:步:步:选择选择【数据数据】菜单中的菜单中的【数据透视表和数据透视图数据透视表和数据透视图】n n第第第第2 2步:步:步:步:确定数据源区域确定数据源区域n n第第第第3 3步步步步:在在【向向导导3 3步步骤骤之之3 3】中中选选择择数数据据透透视视表表的的输输出出位位置置。然后选择然后选择【布局布局】n n第第第第4 4步步步步:
12、在在【向向导导布布局局】对对话话框框中中,依依次次将将“分分类类变变量量“(这这里里是是饮饮料料品品牌牌)连连续续拖拖拖拖放放放放两两两两次次次次:一一次次拖拖至至左左边边的的“行行”区区域域,一一次次拖拖至至 “数据数据”区域区域n n第第第第5 5步步步步:然然后后单单击击【确确定定】,自自动动返返回回【向向导导3 3步步骤骤之之3 3】对对话话框。然后单击框。然后单击【完成完成】,即可输出数据透视表,即可输出数据透视表 用数据透视表产生分类数据的频数分布用数据透视表产生分类数据的频数分布用数据透视表产生分类数据的频数分布用数据透视表产生分类数据的频数分布第二十七页,讲稿共五十八页哦使用使
13、用Excel中中“直方图直方图”生成频数(率)分布表生成频数(率)分布表?【数据分析数据分析】工具的安装【工具工具】【加载宏加载宏】【分析工具库分析工具库】?【直方图直方图】命令的使用命令的使用n n【数据分析数据分析】【直方图直方图】第二十八页,讲稿共五十八页哦定性数据的图示定性数据的图示饼图饼图1.1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600 0确定确定第二十九页,讲稿共五十八
14、页哦定性数据的图示定性数据的图示饼图饼图(例题分析例题分析)第三十页,讲稿共五十八页哦定性数据的图示定性数据的图示环形图环形图1.1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.2.与饼图类似,但又有区别n n饼图只能显示一个总体各部分所占的比例n n环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.3.用于结构比较研究 第三十一页,讲稿共五十八页哦定性数据的图示定性数据的图示环形图环形图(例题分析例题分析)【例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研
15、究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否否否否满满满满意意意意?”1 1非非非非常常常常不不不不满满满满意意意意;2 2不不不不满满满满意意意意;3 3一一一一般般般般;4 4满满满满意意意意;5 5非非非非常常常常满意。满意。满意。满意。第三十二页,讲稿共五十八页哦定性数据的图示定性数据的图示环形图环形图(例题分析例题分
16、析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价第三十三页,讲稿共五十八页哦生成频数分布表生成频数分布表(分组分组)1.1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5 5K 152.2.确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距组距(最大值最大值最大值最大值 -最小值最小值最小值最小值)组数组数组数组数3.3.统计出各组的频数统计出各组的频数 第三十四页,讲稿共五十八页哦生成频数分布
17、表生成频数分布表(例题分析例题分析)【例例例例】某某电电脑脑公公司司20082008年年前前4 4个个月月每每天天的的销销售售额额数数据据。用用ExcelExcel生生成成频频数数分布表分布表 用用Excel制作频数分布表制作频数分布表 第三十五页,讲稿共五十八页哦使用使用Excel中中“直方图直方图”生产频数分布表生产频数分布表1.1.用于展示分组数据分布的一种图形2.2.用矩形的宽度和高度来表示频数分布3.3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图第三十六页,讲稿共五十八页哦用用SPSS绘制直方图绘制直方图 n n第第1步:步:选择
18、【Graphs】下拉菜单,并选择 【histogram】选项进入主对话框n n第第2步:步:在主对话框中将变量选入【Variables】,点击【OK】用用用用SPSSSPSS绘制直方图绘制直方图绘制直方图绘制直方图 第三十七页,讲稿共五十八页哦分组数据分组数据直方图直方图(SPSS绘制的直方图绘制的直方图)第三十八页,讲稿共五十八页哦分组数据分组数据直方图直方图(直方图与条形图的区别直方图与条形图的区别)1.1.条形图是用条形的长度(横置时)表表示示各各类类别别频频数数的的多多少,其宽度少,其宽度(表示类别)则是固定的则是固定的2.2.直直方方图图是是用用面面积积表表示示各各组组频频数数的的多
19、多少少,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,宽宽度度则则表表示示各各组组的的组组距距,其其高高度与宽度均有意义度与宽度均有意义3.3.直直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,条条形形图图则则是是分分开开排排列列4.4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据第三十九页,讲稿共五十八页哦原始数据原始数据茎叶图茎叶图1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由“茎茎”和“叶”两部分构成,其图形是由数字组成的3.3.以该组数据的高位数值作树茎,低位数字作树叶4.4.树叶上只保留最后一位数字树叶上只
20、保留最后一位数字5.5.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别 直直方方图图可可观观察察一一组组数数据据的的分分布布状状况况,但但没没有有给给出出具具体体的的数值数值 茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数数值值,保留了原始数据的信息保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据直方图适用于大批量数据,茎叶图适用于小批量数据第四十页,讲稿共五十八页哦用用SPSS绘制茎叶图和箱线图绘制茎叶图和箱线图(包括直方图包括直方图)n n第第第第1 1步:步:选择选择【Analyze】下拉菜单
21、,并选择 【Descriptive statistics-Explore】选项进入主对话框n n第第第第2步:步:在主对话框中将变量选入在主对话框中将变量选入【Dependent List】,点击【Plots】,在对话框中选择【Stem-and-Stem-and-leafleaf】(根据需要可选根据需要可选【Histogram】以给出直方图以给出直方图)。点。点击击【ContinueContinue】回到主对话框。点击回到主对话框。点击【OK】用用用用SPSSSPSS绘制茎叶图绘制茎叶图绘制茎叶图绘制茎叶图第四十一页,讲稿共五十八页哦原始数据原始数据茎叶图茎叶图(例题分析例题分析)某电脑公司销
22、售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图第四十二页,讲稿共五十八页哦原始数据原始数据箱线图箱线图1.1.用于显示未分组的原始数据的分布2.2.由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.3.绘制方法n n首首先先找找出出一一组组数数据据的的5 5个个特特征征值值,即即最最最最大大大大值值值值、最最最最小小小小值值值值、中中中中位位位位数数数数MMe e和和两两个个四四四四分分分分位位位位数数数数(下下四四分分位位数数QQL L和和上上四四分分位位数数QQUU)n n连连接接两两个个四四分分位位数数画画出出箱箱子子,再
23、再将将两两个个极极值值点点与与箱箱子子相相连接连接n n该箱线图也称为该箱线图也称为该箱线图也称为该箱线图也称为Median/QuartMedian/Quart./Range/Range箱线图箱线图箱线图箱线图 第四十三页,讲稿共五十八页哦原始数据原始数据简单箱线图简单箱线图(箱线图的构成箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL L LX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图第四十四页,讲稿共五十八页哦原始数据原始数据简单箱线图简单箱线图(例题分析例
24、题分析)最小值最小值最小值最小值141141最大值最大值最大值最大值237237中位数中位数中位数中位数182182下四分位数下四分位数下四分位数下四分位数170.25170.25上四分位数上四分位数上四分位数上四分位数197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的Median/Quar
25、t./RangMedian/Quart./Rang箱线图箱线图箱线图箱线图第四十五页,讲稿共五十八页哦原始数据原始数据多批数据箱线图多批数据箱线图(例题分析例题分析)【例例例例】从从从从某某某某大大大大学学学学经经经经济济济济管管管管理理理理专专专专业业业业二二二二年年年年级级级级学学学学生生生生中中中中随随随随机机机机抽抽抽抽取取取取1111人人人人,对对对对8 8门门门门 主主主主 要要要要 课课课课 程程程程的的的的考考考考试试试试成成成成绩绩绩绩进进进进行行行行调调调调查查查查,所所所所得得得得结结结结果果果果如如如如表表表表。试试试试绘绘绘绘制制制制各各各各科科科科考考考考试试试试成
26、成成成绩绩绩绩的的的的批批批批比比比比较较较较箱箱箱箱线线线线图图图图,并并并并分分分分析析析析各各各各科科科科考考考考试试试试成成成成绩的分布特征绩的分布特征绩的分布特征绩的分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698
27、46573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第四十六页,讲稿共五十八页哦用用SPSS绘制多批数据箱线图绘制多批数据箱线图 n n第第第第1 1步:步:步:步:选择选择【GraphsGraphs】下拉菜单,并选择下拉菜单,并选择【BoxplotBoxplot】n n第第第第2 2步:步:步:步:在出现的对话框中选择在出现的对话框中选择【SimpleSimple】,在,在 【Data in Data in
28、Chat AreChat Are】中选择中选择【Summaries of separate variablesSummaries of separate variables】,点击,点击【DefineDefine】返回主对话框返回主对话框n n第第第第3 3步:步:步:步:在主对话框将所有变量在主对话框将所有变量(这里是这里是8 8门课程门课程)选入选入 【BoxesBoxes RepresentRepresent】。点击。点击【OKOK】用用SPSS绘制箱线图绘制箱线图第四十七页,讲稿共五十八页哦原始数据原始数据多批数据箱线图多批数据箱线图8 8门课程考试成绩的门课程考试成绩的门课程考试成绩
29、的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图第四十八页,讲稿共五十八页哦1111名学生考试成绩的名学生考试成绩的名学生考试成绩的名学生考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图原始数据原始数据多批数据箱线图多批数据箱线图第四十九页,讲稿共五十八页哦两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatter plots)1.1.展示两个变量之间的关系展示两个变量之间的关系2.2.用用横横轴轴代代表表变变量量x x,纵纵轴轴代代表表变变量量y
30、 y,每每组组数数据据(x xi i ,y yi i)在在坐坐标标系系中中用用一一个个点点表表示示,n n组组数数据据在在坐坐标标系系中中形形成成的的n n个个点点称称为为散散点点,由由坐坐标标及其散点形成的二维数据图及其散点形成的二维数据图温度温度/0C降雨量降雨量/mm产量产量/kg/hm262522508403450105845001368575014110580016987500211208250第五十页,讲稿共五十八页哦两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatter plots)第五十一页,讲稿共五十八页哦用用SPSS绘制散点图矩阵绘制散点图矩阵(Matr
31、ix Scatter)n n第第1步:步:选择【Graphs】下拉菜单,并选择 【Scatter/Dot】n n第第2步:步:在出现的对话框中选择【Matrix Scatter】(要绘制三维散点图,点击 【3D Scatter】,并定义各坐标轴),点击 【Define】,中将所有变量选【Matrix variables】,点击【OK】用用SPSS绘制散点图绘制散点图第五十二页,讲稿共五十八页哦两个变量间的关系两个变量间的关系散点图矩阵散点图矩阵(Matrix ScatterSPSS)温度温度降雨量降雨量产量产量第五十三页,讲稿共五十八页哦三个变量间的关系三个变量间的关系三维散点图三维散点图(3
32、D Scatter plotsSPSS)第五十四页,讲稿共五十八页哦三个变量间的关系三个变量间的关系气泡图气泡图1.1.显 示 三个 变 量之 间 的关系2.2.图 中 数据 点 的大 小 依赖 于 第三 个 变量第五十五页,讲稿共五十八页哦1.1.也称为蜘蛛图(spider chart)2.2.显示多个变量的图示方法3.3.在显示或对比各变量的数值总和时十分有用3.3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.4.可用于研究多个样本之间的相似程度比较多个样本的相似性比较多个样本的相似性 雷达图雷达图第五十六页,讲稿共五十八页哦比较多个样本的相似性比较多个样本的相
33、似性 雷达图雷达图(例题分析例题分析)【例例例例】20032003年年年年我我我我国国国国城城城城乡乡乡乡居居居居民民民民家家家家庭庭庭庭平平平平均均均均每每每每人人人人各各各各项项项项生生生生活活活活消消消消费费费费支支支支出出出出构构构构成成成成数数数数据据据据如如如如表表表表。试绘制雷达图试绘制雷达图试绘制雷达图试绘制雷达图20032003年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成(%)(%)项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务37.129.796.307.3111.0814.3510.743.30 45.595.674.205.968.3612.1315.872.21第五十七页,讲稿共五十八页哦比较多个样本的相似性比较多个样本的相似性 雷达图雷达图(例题分析例题分析-Excel)第五十八页,讲稿共五十八页哦