统计和统计数据的应用.pptx

上传人:莉*** 文档编号:74453448 上传时间:2023-02-26 格式:PPTX 页数:40 大小:264.23KB
返回 下载 相关 举报
统计和统计数据的应用.pptx_第1页
第1页 / 共40页
统计和统计数据的应用.pptx_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《统计和统计数据的应用.pptx》由会员分享,可在线阅读,更多相关《统计和统计数据的应用.pptx(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1统计和统计数据的应用统计和统计数据的应用2008年8月你相信这样的一些统计结论吗?你相信这样的一些统计结论吗?你相信这样的一些统计结论吗?你相信这样的一些统计结论吗?l l吸烟对健康是有害的,吸香烟的男性减少寿命吸烟对健康是有害的,吸香烟的男性减少寿命22502250天天l l不结婚的男性会减少寿命不结婚的男性会减少寿命35003500天,不结婚的女性会减天,不结婚的女性会减少寿命少寿命16001600天天l l身体超重身体超重30%30%会使寿命减少会使寿命减少13001300天天l l每天摄取每天摄取500500毫升维生素毫升维生素C C,生命可延长,生命可延长6 6年年l l身材

2、高的父亲,其子女的身高也较高身材高的父亲,其子女的身高也较高l l二个出生的子女没有第一个聪明,第三个出生的子二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推女没有第二个聪明,依此类推l l学生们在听了莫扎特钢琴曲学生们在听了莫扎特钢琴曲1010分钟后的推理测试会比分钟后的推理测试会比他们听他们听1010分钟娱乐磁带或其他曲目做得更好分钟娱乐磁带或其他曲目做得更好l l上课坐在前面的学生平均考试分数比坐在后面的学上课坐在前面的学生平均考试分数比坐在后面的学生高生高第1页/共40页2008年8月不同原因引起的寿命损失不同原因引起的寿命损失不同原因引起的寿命损失不同原因引起的

3、寿命损失原因原因原因原因天数天数天数天数原因原因原因原因天数天数天数天数未结婚(男性)3500饮酒130惯用左手3285枪炮事故11未结婚(女性)1600自然放射线830%超重1300医疗X-射线620%超重900咖啡6吸香烟(男性)2250口服避孕药5吸香烟(女性)800减肥饮料2抽雪茄300家里有烟雾报警-10用烟斗抽烟丝220带有气囊的轿车-50危险工作,事故300移动冠状动脉监护器-125一般工作,事故74注:负数表示寿命增加第2页/共40页2008年8月理解统计学对大众的必要性理解统计学对大众的必要性理解统计学对大众的必要性理解统计学对大众的必要性 与其他任何科学领域相比,社会公众对

4、统计学的理解是极为重要的(C.R.Rao)l l在在外外出出旅旅游游时时,需需要要关关心心一一段段时间内的详细天气预报时间内的详细天气预报l l在在投投资资股股票票时时,需需要要了了解解股股票票市市场场价价格格的的信信息息,了了解解某某只只特特定股票的有关财务信息定股票的有关财务信息l l如如果果你你关关心心足足球球世世界界杯杯,在在有有关关媒媒体体上上,可可以以看看到到详详细细的的报报道道l l如如果果你你关关心心宏宏观观经经济济形形式式,在在有关媒体上可以看到有关报道有关媒体上可以看到有关报道第3页/共40页2008年8月政治家或制定政策的人政治家或制定政策的人政治家或制定政策的人政治家或

5、制定政策的人理解统计学更重要理解统计学更重要理解统计学更重要理解统计学更重要政策制定者在作出决策时希望寻求技术指导,但他们自己在了政策制定者在作出决策时希望寻求技术指导,但他们自己在了解和解释信息时所需的专业技术知识却不足解和解释信息时所需的专业技术知识却不足l l在政府或工业部门中工作的统计学者们常常与他们的上司产在政府或工业部门中工作的统计学者们常常与他们的上司产生语言上的障碍。一个统计办公室的主管也是一个行政事务生语言上的障碍。一个统计办公室的主管也是一个行政事务官,一次与一些统计学者开会,统计学者抱怨从其他部门收官,一次与一些统计学者开会,统计学者抱怨从其他部门收到的一些估计值没有给出

6、标准误差到的一些估计值没有给出标准误差(估计时的误差大小,表示估计时的误差大小,表示估计的精度估计的精度),这个主管马上问道:,这个主管马上问道:“对误差也有标准吗?对误差也有标准吗?”l l一个统计顾问提交给茶叶委员会的报告中,含有标题为一个统计顾问提交给茶叶委员会的报告中,含有标题为“饮饮茶人数的估计值茶人数的估计值(含标准误差含标准误差)”)”的附表。不久,一封信被送到的附表。不久,一封信被送到这个统计学者手中,问道什么是人们喝红茶时的这个统计学者手中,问道什么是人们喝红茶时的“标准误差标准误差”l l皇家委员会审查一份统计报告,报告中提到中产阶级家庭平皇家委员会审查一份统计报告,报告中

7、提到中产阶级家庭平均有均有2.22.2个子女,委员会评述说:个子女,委员会评述说:“每一个成人女性有每一个成人女性有2.22.2个子个子女的数字是荒谬的。这是为了要求对中产阶级提供财政援助女的数字是荒谬的。这是为了要求对中产阶级提供财政援助以便通过四舍五入被平均值提高到一个更合适的整数以便通过四舍五入被平均值提高到一个更合适的整数第4页/共40页2008年8月政治家或制定政策的人政治家或制定政策的人政治家或制定政策的人政治家或制定政策的人理解统计学更重要理解统计学更重要理解统计学更重要理解统计学更重要政策制定者在作出决策时希望寻求技术指导,但他们自己在了解和解释信息时所需的专业技术知识却不足l

8、 l健健康康大大臣臣对对一一个个统统计计学学者者的的报报告告中中提提到到的的去去年年由由于于某某种种疾疾病病,平平均均10001000中中死死亡亡人人数数为为3.23.2这这个个数数字字发发生生了了兴兴趣趣。他他问问他他的的私私人人秘秘书书,3.23.2个个人人是是如如何何死死法法?他他的的秘秘书书说说:“先先生生,当当一一个个统统计计学学家家说说死死了了3.23.2个个人人时时,意意味味着着3 3个个人人已已经经死死了了,两两个个人人正正要死要死”第5页/共40页1.1 1.1 统计及其应用领域统计及其应用领域统计及其应用领域统计及其应用领域 1.1.1 1.1.1 统计学研究什么?统计学研

9、究什么?统计学研究什么?统计学研究什么?1.1.2 1.1.2 统计的应用统计的应用统计的应用统计的应用第第 1 章章 统计和统计数据统计和统计数据第6页/共40页1.1.1 统计学研究什么统计学研究什么?1.1 统计及其应用领域统计及其应用领域第7页/共40页2008年8月什么是统计学什么是统计学什么是统计学什么是统计学?(statistics)(statistics)1.1.收集数据:取得数据收集数据:取得数据2.2.处理数据:图表展示处理数据:图表展示 3.3.分析数据:利用统计方法分析数据:利用统计方法分析数据分析数据4.4.数据解释:结果的说明数据解释:结果的说明5.5.得到结论:从

10、数据分析中得到结论:从数据分析中得出客观结论得出客观结论收集、处理、分析、解释数据并从数据中得出结论的科学收集、处理、分析、解释数据并从数据中得出结论的科学 第8页/共40页2008年8月统计方法统计方法统计方法统计方法统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第9页/共40页2008年8月描述统计描述统计描述统计描述统计(descriptive statistics)(descriptive statistics)1.1.研究数据收集、整理和研究数据收集、整理和描述的统计学方法描述的统计学方法 2.2.内容内容n n搜集数据搜集数据n n整理数据整理数据

11、n n展示数据展示数据n n描述性分析描述性分析3.3.目的目的n n描述数据特征描述数据特征n n找出数据的基本规律找出数据的基本规律0 025255050QQ1 1QQ2 2QQ3 3QQ4 4¥x x=30 =30 s s2 2=105=105第10页/共40页2008年8月推断统计推断统计推断统计推断统计 (inferential statistics)(inferential statistics)1.1.研究如何利用样本数研究如何利用样本数据来推断总体特征的据来推断总体特征的统计学方法统计学方法2.2.内容内容 参数参数估计估计 假设检验假设检验3.3.目的目的 对总体特征作出推对

12、总体特征作出推断断样样本本总总体体第11页/共40页2008年8月统计学研究什么?统计学研究什么?统计学研究什么?统计学研究什么?1.1.物物理理学学研研究究的的是是如如热热、光光、电电、运运动动规规律律那那样样的自然现象的自然现象2.2.化化学学家家测测定定物物质质的的组组成成及及化化学学元元素素之之间间的的交交互互作用作用3.3.生物学家研究植物和动物的生活生物学家研究植物和动物的生活4.4.数数学学家家则则在在给给出出的的假假定定之之下下沉沉溺溺于于他他自自己己推推演演各种命题的游戏各种命题的游戏5.5.这这些些学学科科中中的的每每一一门门都都有有它它自自己己的的问问题题,而而且且有有解

13、解决决这这些些问问题题的的各各自自的的方方法法,各各学学科科为为此此而而成为一门单独的学科成为一门单独的学科第12页/共40页2008年8月统计学研究什么?统计学研究什么?统计学研究什么?统计学研究什么?1.1.统统计计学学没没有有任任何何固固定定的的对对象象,是是一一门门独独特特的的学问学问2.2.统统计计学学研研究究的的是是来来自自各各领领域域的的数数据据,由由解解决决其其他他领领域域内内的的问问题题而而存存在在并并兴兴旺旺发发达达。按按萨萨维奇维奇(L.J.Savage)(L.J.Savage)的说法:的说法:l l统统计计学学基基本本上上是是寄寄生生的的。靠靠研研究究其其他他领领域域内

14、内的的工工作作而而生生存存。这这不不是是对对统统计计学学的的轻轻视视,这这是是因因为为对对很很多多寄寄主主来来说说,如如果果没没有有寄寄生生虫虫就就会会死死。对对有有的的动动物物来来说说,如如果果没没有有寄寄生生虫虫就就不不能能消消化化它它们们的的食食物物。因因此此,人人类类奋奋斗斗的的很很多多领领域域,如如果果没没有有统统计计学学,虽虽然然不不会会死死亡亡,但但一一定定会会变变得得很弱很弱第13页/共40页2008年8月统计学研究什么?统计学研究什么?统计学研究什么?统计学研究什么?统计学是一门科学统计学是一门科学统计学是一门科学统计学是一门科学n n统统计计学学提提供供一一套套方方法法和和

15、技技术术,这这些些方方法法和和技技术术不不能能用用于于固固定定模模式式,使使用用者者在在给给定定的的情情况况下下必必须须根根据据所所掌掌握握的的专专门门知知识识选选择使用的方法,而且,如果需要还要进行必要的修正择使用的方法,而且,如果需要还要进行必要的修正n n统统计计方方法法是是通通用用的的数数据据分分析析方方法法。这这些些方方法法不不是是为为某某个个特特定定的问题领域而构造的的问题领域而构造的统计学是一种技术统计学是一种技术统计学是一种技术统计学是一种技术n n如如同同工工业业生生产产过过程程中中的的质质量量控控制制程程序序一一样样,统统计计方方法法是是为为保保证证产产品品达达到到所所希希

16、望望的的质质量量和和保保持持其其稳稳定定性性的的的的管管理理系系统统中中建建立起来的立起来的n n统计方法也能用于控制、减少和考察不确定性统计方法也能用于控制、减少和考察不确定性统计学是一门艺术统计学是一门艺术统计学是一门艺术统计学是一门艺术n n作作为为归归纳纳推推理理的的统统计计方方法法不不是是没没有有争争议议的的。不不同同的的人人对对同同一一组组数数据据的分析可能得到不同的结论的分析可能得到不同的结论n n一一本本印印度度小小说说红红色色城城堡堡(The(The Red Red Fort)Fort)说说:使使用用数数字字讲讲故故事事取取决决于于统统计计学学家家的的技技巧巧和和他他们们的的

17、经经验验。在在这这个个意意义义下下,统统计计学学也也是是一一门门艺术艺术第14页/共40页2008年8月统计是一种思维方式统计是一种思维方式统计是一种思维方式统计是一种思维方式n n统统计计思思维维总总有有一一天天会会像像读读与与写写一一样样成成为为一一个个有效率公民的必备能力有效率公民的必备能力(H.G.Wells)(H.G.Wells)n n在在终终极极的的分分析析中中,一一切切知知识识都都是是历历史史;在在抽抽象象的的意意义义下下,一一切切科科学学都都是是数数学学;在在理理性性的的基础上,所有的判断都是统计学基础上,所有的判断都是统计学(C.R.Rao)(C.R.Rao)第15页/共40

18、页1.1.2 统计的应用统计的应用1.1 统计及其应用领域统计及其应用领域第16页/共40页2008年8月统计的应用领域统计的应用领域统计的应用领域统计的应用领域【例例例例1.11.1】用统计识别作者用统计识别作者用统计识别作者用统计识别作者 1787178817871788年年,三三位位作作者者Alexander Alexander HamiltonHamilton,John John JayJay和和James James MadisonMadison为为了了说说服服纽纽约约人人认认可可宪宪法法,匿匿名名发发表表了了著著名名的的8585篇篇论论文文。这这些些论论文文中中的的大大多多数数作作

19、者者已已经经得得到到了了识识别别,但但是是,其其中中的的1212篇篇论论文文的作者身份引起了争议的作者身份引起了争议 通通过过对对不不同同单单词词的的频频数数进进行行统统计计分分析析,得得出出的的结结论论是是,James James MadisonMadison最最有有可可能能是是这这1212篇篇论论文文的的作作者者。现现在在,对对于于这这些些存存在在争争议议的的论论文文,认认为为James James MadisonMadison是是原原创创作作者者的的说说法法占占主主导导地地位位,而而且几乎可以肯定这种说法是正确且几乎可以肯定这种说法是正确 第17页/共40页2008年8月统计的应用领域统

20、计的应用领域统计的应用领域统计的应用领域【例例例例1.21.2】用简单的描述统计量得到一个重要发现用简单的描述统计量得到一个重要发现用简单的描述统计量得到一个重要发现用简单的描述统计量得到一个重要发现 费费舍舍(R(RA AFisher)Fisher)在在19521952的的一一篇篇文文章章中中举举了了一一个个例例子子,说说明明如如何何由由基基本本的的描描述述统统计计量量的的知知识识引引出出一一个个重重要要的的发发现现。2020世世纪纪早早期期,哥哥本本哈哈根根卡卡尔尔堡堡实实验验室室的的施施密密特特(J.Schmidt)(J.Schmidt)发发现现不不同同地地区区所所捕捕获获的的同同种种鱼

21、鱼类类的的脊脊椎椎骨骨和和鳃鳃线线的的数数量量有有很很大大不不同同;甚甚至至在在同同一一海海湾湾内内不不同同地地点点所所捕获的同种鱼类,也发现这样的倾向捕获的同种鱼类,也发现这样的倾向 然然而而,鳗鳗鱼鱼的的脊脊椎椎骨骨的的数数量量变变化化不不大大。施施密密特特从从欧欧洲洲各各地地、冰冰岛岛、亚亚速速尔尔群群岛岛以以及及尼尼罗罗河河等等几几乎乎分分离离的的海海域域里里所所捕捕获获的的鳗鳗鱼鱼的的样样本本中中,计计算算发发现现了了几几乎乎一一样样的的均均值值和和标标准准偏偏差差值值。由由此此,施施密密特特推推断断所所有有各各个个不不同同海海域域内内的的鳗鳗鱼鱼是是由由海海洋洋中中某某公公共共场场

22、所所繁繁殖殖的的。后后来来名名为为“戴戴纳纳(Dana)”(Dana)”的科学考察船在一次远征中发现了这个场所的科学考察船在一次远征中发现了这个场所第18页/共40页2008年8月统计的应用领域统计的应用领域统计的应用领域统计的应用领域【例例例例1.31.3】挑战者号航天飞机失事预测挑战者号航天飞机失事预测挑战者号航天飞机失事预测挑战者号航天飞机失事预测 19861986年年1 1月月2828日日清清晨晨,载载有有7 7名名宇宇航航员员的的挑挑战战者者号号进进入入发发射射状状态态。就就在在发发射射前前,有有冰冰片片牢牢附附在在机机壳壳上上。几几分分钟钟后后,正正当当电电视视新新闻闻报报道道它它

23、已已进进入入轨轨道道时时,航航天天飞飞机机在在毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存 推推动动航航天天飞飞机机进进入入太太空空的的两两个个固固体体燃燃料料发发动动机机是是由由ThiokolThiokol公公司司制制造造的的。失失事事前前一一天天晚晚上上,ThiokolThiokol公公司司的的经经理理们们和和国国家家航航空空航航天天局局就就如如期期发发射射还还是是推推迟迟发发射射产产生生了了争争执执。天天气气预预报报发发射射时时的的气气温温为为31310 0F F。争争执执的的结结果果采采纳纳了了ThiokolThiokol公公司司经经理理

24、们们的的建建议议:按按计计划划发发射射航航天天飞飞机机。因因为为他他们们觉觉得得没没有有确确凿凿证证据据表表明明低低温温会会对对固固体体燃燃料料火火箭箭推推进器的性能产生影响进器的性能产生影响第19页/共40页2008年8月统计的应用领域统计的应用领域统计的应用领域统计的应用领域【例例例例1.31.3】挑战者号航天飞机失事预测挑战者号航天飞机失事预测挑战者号航天飞机失事预测挑战者号航天飞机失事预测 在在此此次次失失事事前前,该该航航天天飞飞机机2424次次发发射射成成功功。将将航航天天飞飞机机送送入入太太空空的的两两个个固固体体燃燃料料推推进进器器由由6 6只只OO型型项项圈圈密密封封。在在几

25、几次次飞飞行行中中,曾曾发发生生过过OO型型项项圈圈被被腐腐蚀蚀或或气气体体泄泄漏漏事事故故。这这样样的的事事故故是是及及其其危危险险的的。前前2424次次发发射射中中有有一一次次发发动动机机遭遭到到了了永永久久性性破破坏坏。根根据据2323次次飞飞行行中中发发生生腐腐蚀蚀或或泄泄漏漏事事故故的的次次数数(因因变变量量)及及火火箭箭连连接接处处的的温温度度(自自变变量量)数数据据,进进行行线线性性回回归归得得到到的的回回归方程为归方程为当当温温度度为为31310 0F F时时,OO型型项项圈圈发发生生事事故故的的预预计计次次数数为为2.2252.225次次。结结果果显显示示连连接接处处的的温温

26、度度与与OO型型项项圈圈事事故故之之间间有有一一定定的的相相关关性性。如如果果当当时时那那些些经经理理们们看看到到了了回回归归的的预预测测结结果果,也也许许推推迟迟发发射射会成为其谨慎的选择会成为其谨慎的选择第20页/共40页2008年8月统计的应用领域统计的应用领域统计的应用领域统计的应用领域actuarial work actuarial work(精算精算精算精算)agriculture agriculture(农业农业农业农业)animal science animal science(动物学动物学动物学动物学)anthropology anthropology(人类学人类学人类学人类

27、学)archaeology archaeology(考古学考古学考古学考古学)auditing auditing(审计学审计学审计学审计学)crystallography crystallography(晶体学晶体学晶体学晶体学)demography demography(人口统计学人口统计学人口统计学人口统计学)dentistry dentistry(牙医学牙医学牙医学牙医学)ecology ecology(生态学生态学生态学生态学)econometrics econometrics(经济计量学经济计量学经济计量学经济计量学)education education(教育学教育学教育学教育学)

28、election forecasting and projection election forecasting and projection(选举预测和策划选举预测和策划选举预测和策划选举预测和策划)engineering engineering(工程工程工程工程)epidemiology epidemiology(流行病学流行病学流行病学流行病学)finance finance(金融金融金融金融)fisheries research fisheries research(水产渔业研究水产渔业研究水产渔业研究水产渔业研究)gambling gambling(赌博赌博赌博赌博)genetics

29、 genetics(遗传学遗传学遗传学遗传学)geography geography(地理学地理学地理学地理学)geology geology(地质学地质学地质学地质学)historical historical research research(历历历历史史史史研研研研究究究究)human human genetics genetics(人人人人类类类类遗遗遗遗传传传传学学学学)第21页/共40页2008年8月统计的应用领域统计的应用领域统计的应用领域统计的应用领域hydrology hydrology(水文学水文学水文学水文学)industryindustry(工业工业工业工业)ling

30、uisticslinguistics(语言学语言学语言学语言学)literature literature(文学文学文学文学)manpower planningmanpower planning(劳动力计划劳动力计划劳动力计划劳动力计划)management sciencemanagement science(管理科学管理科学管理科学管理科学)marketing marketing(市场营销学市场营销学市场营销学市场营销学)medical diagnosismedical diagnosis(医学诊断医学诊断医学诊断医学诊断)meteorology meteorology(气象学气象学气象学气

31、象学)military sciencemilitary science(军事科学军事科学军事科学军事科学)nuclear material safeguardsnuclear material safeguards(核材料安全管理核材料安全管理核材料安全管理核材料安全管理)ophthalmology ophthalmology(眼科学眼科学眼科学眼科学)pharmaceutics pharmaceutics(制药学制药学制药学制药学)physicsphysics(物理学物理学物理学物理学)political sciencepolitical science(政治学政治学政治学政治学)psych

32、ology psychology(心理学心理学心理学心理学)psychophysics psychophysics(心理物理学心理物理学心理物理学心理物理学)quality controlquality control(质量控制质量控制质量控制质量控制)religious studiesreligious studies(宗教研究宗教研究宗教研究宗教研究)sociologysociology(社会学社会学社会学社会学)survey samplingsurvey sampling(调查抽样调查抽样调查抽样调查抽样)taxonomy taxonomy(分类学分类学分类学分类学)weather mo

33、dification weather modification(气象改善气象改善气象改善气象改善)第22页/共40页2008年8月统计的误用与滥用统计的误用与滥用统计的误用与滥用统计的误用与滥用1.1.大约在一个世纪以前,政治家大约在一个世纪以前,政治家Benjamin DisraeliBenjamin Disraeli曾有一个曾有一个著名的论断:著名的论断:“有三类谎言:谎言、糟透的谎言和统有三类谎言:谎言、糟透的谎言和统有三类谎言:谎言、糟透的谎言和统有三类谎言:谎言、糟透的谎言和统计计计计”。他还说:他还说:“图并没有说谎,是说谎者在画图图并没有说谎,是说谎者在画图图并没有说谎,是说谎者

34、在画图图并没有说谎,是说谎者在画图”2.2.历史学家历史学家Andrew LangAndrew Lang说,一些人使用统计说,一些人使用统计“就像喝醉就像喝醉就像喝醉就像喝醉酒的人使用街灯柱酒的人使用街灯柱酒的人使用街灯柱酒的人使用街灯柱支撑的功能多于照明支撑的功能多于照明支撑的功能多于照明支撑的功能多于照明”3.3.统计滥用统计滥用统计滥用统计滥用n n不好的样本不好的样本不好的样本不好的样本n n过小的样本过小的样本过小的样本过小的样本n n误导性图表误导性图表误导性图表误导性图表n n局部描述局部描述局部描述局部描述n n故意曲解故意曲解故意曲解故意曲解第23页/共40页2008年8月统

35、计的误用与滥用统计的误用与滥用统计的误用与滥用统计的误用与滥用1.1.统计应用上的两个极端统计应用上的两个极端l l不用或几乎不用统计不用或几乎不用统计l l简单问题复杂化简单问题复杂化2.2.在统计应用中,这两个极端都是不可取的在统计应用中,这两个极端都是不可取的3.3.简简单单的的方方法法不不一一定定没没用用,复复杂杂的的方方法法也也不不一一定定有有用用。正正如如有有的的学学者者所所说说的的,最最简简单单的的模模型往往是最有用的型往往是最有用的4.4.统统计计应应该该恰恰当当地地应应用用到到它它能能起起作作用用的的地地方方。不不能能把把统统计计神神秘秘化化,更更不不能能歪歪曲曲统统计计,把

36、把统统计作为掩盖实事的陷阱计作为掩盖实事的陷阱第24页/共40页1.2 1.2 怎样获得统计数据怎样获得统计数据怎样获得统计数据怎样获得统计数据 1.2.1 1.2.1 变量与数据变量与数据变量与数据变量与数据 1.2.2 1.2.2 数据的来源数据的来源数据的来源数据的来源 第第 1 章章 统计和统计数据统计和统计数据第25页/共40页1.2.1 变量与数据变量与数据1.2 怎样获得统计数据怎样获得统计数据第26页/共40页2008年8月变量与数据变量与数据变量与数据变量与数据1.1.变量变量(variable)(variable)n n从一次观察到下一次观察会出现不同结果的某从一次观察到下

37、一次观察会出现不同结果的某种特征种特征l l观察一个企业的销售额,这个月和上个月有所不同;观察一个企业的销售额,这个月和上个月有所不同;观察股票市场上涨股票的家数,今天与昨天数量不观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样这次投掷的结果和下一次也不一样l l“企业销售额企业销售额”、“上涨股票的家数上涨股票的家数”、“生活费生活费支出支出”、“投掷一枚骰子出现的点数投掷一枚骰子出现的点数”

38、等就是变量等就是变量2.2.数据数据(data)(data)n n观察到的变量的结果观察到的变量的结果第27页/共40页2008年8月变量与数据变量与数据变量与数据变量与数据1.1.定量变量定量变量(quantitative variable)(quantitative variable)或数值变量或数值变量(metric variable)(metric variable)n n可以用阿拉伯数据来记录其观察结果可以用阿拉伯数据来记录其观察结果n n如如“企业销售额企业销售额”、“上涨股票的家数上涨股票的家数”、“生活费支出生活费支出”、“投掷一枚骰子出现的点数投掷一枚骰子出现的点数”n n定

39、量变量的观察结果称为定量数据或数值型数据定量变量的观察结果称为定量数据或数值型数据(metric data)(metric data)2.2.分类变量分类变量(categorical variable)(categorical variable)n n表现为不同的类别表现为不同的类别n n如如“性别性别”、“企业所属的行业企业所属的行业”、“学生所在的学院学生所在的学院”等等n n分类变量的观察结果就是分类数据分类变量的观察结果就是分类数据(categorical data)(categorical data)3.3.顺序变量顺序变量(rank variable)(rank variable)

40、或有序分类变量或有序分类变量n n具有一定顺序的类别变量具有一定顺序的类别变量n n如考试成绩按等级,一个人对事物的态度如考试成绩按等级,一个人对事物的态度n n顺序变量的观察结果就是顺序数据或有序分类数据顺序变量的观察结果就是顺序数据或有序分类数据(rank data)(rank data)4.4.分类变量和顺序变量统称为定性变量分类变量和顺序变量统称为定性变量(qualitative variable)(qualitative variable)第28页/共40页1.2.2 数据的来源数据的来源1.2 怎样获得统计数据怎样获得统计数据第29页/共40页2008年8月数据的来源数据的来源数据

41、的来源数据的来源1.1.寻找二手数据寻找二手数据2.2.抽取样本抽取样本n n总总体体(population)(population):包包含含所所研研究究的的全全部部个个体体(数据数据)的集合的集合n n样样本本(sample)(sample):从从总总体体中中抽抽取取的的一一部部分分元元素素的集合的集合n n样样本本量量(sample(sample size)size):构构成成样样本本的的元元素素的的数数目目3.3.概率抽样方法概率抽样方法第30页/共40页2008年8月概率抽样概率抽样概率抽样概率抽样(probability samplingprobability sampling)1

42、.1.根根据据一一个个已已知知的的概概率率来来抽抽取取样样本本单位,也称随机抽样单位,也称随机抽样2.2.特点特点n n按按一一定定的的概概率率以以随随机机原原则则抽抽取取样本样本n n抽抽取取样样本本时时使使每每个个单单位位都都有有一一定定的机会被抽中的机会被抽中n n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的,或是可以计算出来的的,或是可以计算出来的 n n当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到到每每个个样样本本单单位位被抽中的概率被抽中的概率第31页/共40页2008年8月简单随机抽样简单随机抽样简单随机抽样简单随机抽样(simple r

43、andom samplingsimple random sampling)1.1.从从总总体体NN个个单单位位(元元素素)中中随随机机地地抽抽取取n n个个单单位位作作为为样样本本,使使得得总总总总体体体体中中中中每每每每一一一一个个个个元元元元素素素素都都有有相相同同的的机机会会(概率概率)被抽中被抽中 2.2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.3.特点特点n n简简单单、直直观观,在在抽抽样样框框完完整整时时,可可直直接接从从中中抽抽取取样本样本n n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.4.局限性局限

44、性n n当当NN很大时,不易构造抽样框很大时,不易构造抽样框n n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n n没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率第32页/共40页2008年8月简单随机样本简单随机样本简单随机样本简单随机样本(simple random samplesimple random sample)1.1.由简单随机抽样形成的样本2.2.从总体N个单位中随机地抽取n个单位作为样本,使得每每一一个个容容量量为为n样样本本都有相同的机会(概率)被抽中 3.3.参数估计和假设检验所依据的主要是简单随机样本第33页/共

45、40页2008年8月分层抽样分层抽样分层抽样分层抽样(stratified samplingstratified sampling)1.1.将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.2.优点n n保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从从而而提提高高估估计计的的精精度度n n组织实施调查方便组织实施调查方便n n既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的的目目标标量量进进行行估估计计第34页/共40页2008年8月系统抽样系统抽样系统抽样系统抽样(systematic sampling

46、systematic sampling)1.1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n n先先从从数数字字1 1到到k k之之间间随随机机抽抽取取一一个个数数字字r r作作为为初初始始单单位位,以以后后依依次取次取r r+k k,r r+2+2k k等单位等单位2.2.优点:操作简便,有时可提高估计的精度3.3.缺点:对估计量方差的估计比较困难第35页/共40页2008年8月系统抽样系统抽样系统抽样系统抽样(systematic samplingsystematic sampling)1.1.将总体中

47、的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n n先先从从数数字字1 1到到k k之之间间随随机机抽抽取取一一个个数数字字r r作作为为初初始始单单位位,以以后后依依次取次取r r+k k,r r+2+2k k等单位等单位2.2.优点:操作简便,有时可提高估计的精度3.3.缺点:对估计量方差的估计比较困难第36页/共40页2008年8月整群抽样整群抽样整群抽样整群抽样(cluster samplingcluster sampling)1.1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位

48、全部实施调查2.2.特点n n抽抽样样时时只只需需群群的的抽抽样样框框,可可简简化工作量化工作量n n调调查查的的地地点点相相对对集集中中,节节省省调调查费用,方便调查的实施查费用,方便调查的实施n n缺点是估计的精度通常较差缺点是估计的精度通常较差第37页/共40页2008年8月几种常用的统计软件几种常用的统计软件几种常用的统计软件几种常用的统计软件(Software)(Software)典型的统计软件典型的统计软件nSASnSPSSnMINITABnSTATISTICAnExcelMINITABMINITABMINITABSTATISTICASTATISTICASTATISTICAExceExceExcel llSASSASSASSPSSSPSSSPSS第38页/共40页2008年8月本章小节本章小节本章小节本章小节l l统计学的含义统计学的含义l l统计学的研究内容统计学的研究内容l l统计的应用领域统计的应用领域l l统计数据的类型统计数据的类型l l获得统计数据的途径获得统计数据的途径第39页/共40页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁