统计学Chapter 2.ppt

上传人:qwe****56 文档编号:73169149 上传时间:2023-02-16 格式:PPT 页数:39 大小:1.98MB
返回 下载 相关 举报
统计学Chapter 2.ppt_第1页
第1页 / 共39页
统计学Chapter 2.ppt_第2页
第2页 / 共39页
点击查看更多>>
资源描述

《统计学Chapter 2.ppt》由会员分享,可在线阅读,更多相关《统计学Chapter 2.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学:思想、方法与应用统计学:思想、方法与应用袁卫袁卫刘超刘超欢迎交流欢迎交流新浪微博http:/ 17322.41%有些不赞成8210.62%完全不赞成506.48%不知道91.17%总计772100.00%2.4列联表列联表对表2.6,可以通过前面介绍的饼图和条形图来了解顾客对新凉鞋款式的接受状况。下面的饼图反映出有一半的顾客赞成新款式(包括有些赞成和完全赞成两部分)。2.4列联表列联表不同国家的顾客对该鞋款式的态度是怎么样的,有没有区别?换句话说,对该鞋新款式的态度是否随着国家的改变而变化。为了获得答案,我们需要把根据两个分类变量(即“对新凉鞋的态度”和“国家”)汇总得到的数据放在一个

2、二维列联表里面,见表2.7。2.4列联表列联表表表2.7对新凉鞋的接受态度的调查数据表(列联表)对新凉鞋的接受态度的调查数据表(列联表)对新凉鞋的态度完全赞成有些赞成既不反对也不赞成有些不赞成完全不赞成不知道 总计国家中国5258251231151法国3548402192154印度9628137100154英国21415023183156美国31484519103156总计235223173825097722.4列联表列联表列联表(列联表(contingencytable)是由两个或两个以上变量进行交叉分类得到的频数分布表。列联表中间的各个变量不同水平的交汇处,就是这种水平组合出现的频数或计数

3、(计数(count)。比如表2.7中的“中国”这一行的数字52,表明有52名中国顾客完全赞成新凉鞋的款式。构成列联表的变量都是定性变量或定序变量。一个r 行c列的列联表称为rc列联表,一般的把22的二维列联表又称为交叉表(交叉表(crosstable)。列联表可以有很多维。维数多的叫做高维列联表。2.4列联表列联表注意到表2.7还展示了每一行人数的总和及每一列的总和,分别放在最后一列和最后一行中。实际上,最后一行就是表2.6中的数据,即对新凉鞋态度的频数分布。列联表的最后一列反应的是变量“国家”的频数分布。在统计上就把列联表的这两部分数据称为对应变量的边际分布(边际分布(marginaldis

4、tribution)。2.4列联表列联表我们可能还想知道哪个国家的顾客更赞成新凉鞋的款式,哪个国家的顾客更反对新凉鞋的款式,或者哪个国家的顾客觉得无所谓?比如,我们看完全赞成这一列,我们可以看到印度赞成人数为96人,英国赞成人数仅21人,我们能否认为相对于印度的顾客,英国顾客不太赞成新凉鞋的款式呢?对这类问题的回答可以采用百分数。2.4列联表列联表列联表中有三种百分数,用列联表中的数据除以最后一列的数据得到行百分数(行百分数(rowpercent),例如,在中国顾客中,完全赞成的比例(行百分数)为52/151=34.44%。用列联表中的数据除以最后一行的数据得到列列百分数(百分数(column

5、percent),例如,在完全赞成的顾客中,中国顾客的占比(列百分数)为52/235=22.13%。而用列联表中的数据除以总的顾客数772得到总的百分数(百分数(totalpercent),例如。在中国顾客中完全赞成的人数占总人数的比例为52/772=6.74%。2.4列联表列联表表表2.8给给出出了了每每个个数数据据的的三三种种百百分分数数的的列列联联表表国家国家*态度态度交叉制表交叉制表态度合计完全赞成有些赞成既不反对也不赞成有些不赞成完全不赞成不知道国家中国计数5258251231151国家中的%34.44%38.41%16.56%7.95%1.99%0.66%100.00%态度中的%2

6、2.13%26.01%14.45%14.63%6.00%11.11%19.56%总数的%6.74%7.51%3.24%1.55%0.39%0.13%19.56%法国计数3548402192155国家中的%22.58%30.97%25.81%13.55%5.81%1.29%100.00%态度中的%14.89%21.52%23.12%25.61%18.00%22.22%20.08%总数的%4.50%6.20%5.20%2.70%1.20%0.30%20.08%印度计数9628137100154国家中的%62.34%18.18%8.44%4.55%6.49%0.00%100.00%态度中的%40.8

7、5%12.56%7.51%8.54%20.00%0.00%19.95%总数的%12.44%3.63%1.68%0.91%1.30%0.00%19.95%英国计数21415023183156国家中的%13.46%26.28%32.05%14.74%11.54%1.92%100.00%态度中的%8.94%18.39%28.90%28.05%36.00%33.33%20.21%总数的%2.72%5.31%6.48%2.98%2.33%0.39%20.21%美国计数31484519103156国家中的%19.87%30.77%28.85%12.18%6.41%1.92%100.00%态度中的%13.1

8、9%21.52%26.01%23.17%20.00%33.33%20.21%总数的%4.02%6.22%5.83%2.46%1.30%0.39%20.21%合计计数2352231738250 900.00%772国家中的%30.44%28.89%22.41%10.62%6.48%1.17%100.00%态度中的%100.00%100.00%100.00%100.00%100.00%100.00%100.00%总数的%30.44%28.89%22.41%10.62%6.48%1.17%100.00%2.4列联表列联表为了更便于理解,我们可以把对应于总的百分数的这部分数据单独拿出来,见表2.9。表

9、表2.9展示总的百分数的列联表展示总的百分数的列联表对新凉鞋的态度完全赞成有些赞成既不反对也不赞成有些不赞成完全不赞成 不知道总计国家中国 6.74%7.51%3.24%1.55%0.39%0.13%19.56%法国 4.53%6.22%5.18%2.72%1.17%0.26%19.95%印度 12.44%3.63%1.68%0.91%1.30%0.00%19.95%英国 2.72%5.31%6.48%2.98%2.33%0.39%20.21%美国 4.02%6.22%5.83%2.46%1.30%0.39%20.21%总计 30.44%28.89%22.41%10.62%6.48%1.17%

10、100.00%2.4列联表列联表使用列联表更感兴趣的问题是了解变量之间有没有关联。比如,我们希望知道中国人完全赞成新款式的比例与美国人完全赞成新款式的比例有没有区别,换句话说,被调查着对新款式的赞成是否依赖于被调查者所在的国家。可以从两方面看这个问题。首先,每个国家的对新凉鞋态度的分布是怎样的,这需要看表2.8的行百分数,于是得到表2.10。2.4列联表列联表表表2.10以国家的两个取值(中国和美国)的条件的对新凉鞋态度的条件分布以国家的两个取值(中国和美国)的条件的对新凉鞋态度的条件分布态度合计完全赞成有些赞成既不反对也不赞成有些不赞成完全不赞成不知道中国计数国家中的%52582512311

11、5134.4%38.4%16.6%7.9%2.0%.7%100.0%美国计数国家中的%3148451910315519.9%30.8%28.8%12.2%6.4%1.9%100.0%2.4列联表列联表分别看表2.10的每一行,我们可以在选中国家的前提下得到对新凉鞋态度的条件分布。每一行的百分数之和都为100%,根据被调查者的回答分配百分数。实际上,我们可以把被调查者限制为在中国的顾客,这样可以了解他们的态度是如何分布的,这样的分布称为条件分布(条件分布(conditionaldistribution),因为它表示了那些调查在满足一个条件的前提下得到的感兴趣的一个变量的分布。2.4列联表列联表我

12、们可以使用饼图比较两个条件分布,见图2.13。从图中可以看出,中国新款式赞成的比例高于美国。图图2.13中国和美国分别关于新凉鞋款式的态度调查的饼图中国和美国分别关于新凉鞋款式的态度调查的饼图2.4列联表列联表要了解每一行的百分数的变化,还可以通过条形图进行观察,这也是展示条件分布的一种方式。图图2.14中国和美国分别关于新凉鞋款式的态度调查的并排的条形图中国和美国分别关于新凉鞋款式的态度调查的并排的条形图2.4列联表列联表在列联表里还有一种情况是,如果一个变量的分布对于另一个变量的所有取值保持不变,则我们可以说这个两个变量是独立的独立的(independent),这表明这些变量之间没有关联。

13、2.4列联表列联表列联表中的一个经典例子就是著名的泰坦尼克号邮轮的海难数据。该数据有4个定性变量:(1)仓位等级(Class):分一等舱(1st)、二等舱(2nd)、三等舱(3rd)、船员(Crew)四个水平;(2)性别(Sex):有男(Male)、女(Female)两个水平;(3)年龄:有儿童(Child)、成年人(Adult)两个水平;(4)是否生还(Survived):分否(No)、是(Yes)两个水平。2.4列联表列联表该数据最简单的表格是两维的表格。下面是基于性别与否生还两个变量得到的22表格。从表中可以看出男性生还的人数比女性多从表中可以看出男性生还的人数比女性多23个,但男性死亡的比女性多个,但男性死亡的比女性多1138个。个。是否生还否是性别男性1364367女性1263442.4列联表列联表如果把四个变量都选入,就得到4222表。显然这样的表格看起来就罗唆多了。仓位登记一等舱二等舱三等舱四等舱性别年龄是否生还否是否是否是否是男性儿童05011351300成年人11857154 1438775670192女性儿童01012171400成年人414013808976320

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁