《统计学第一章绪论优秀PPT.ppt》由会员分享,可在线阅读,更多相关《统计学第一章绪论优秀PPT.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第一章绪论o课程性质:课程性质:专业基础课,专业基础课,o学时总数学时总数:48学时(第学时(第1-16周)周)o总评成果的组成:总评成果的组成:o 第一部分:平常成果第一部分:平常成果(占占30%)o 其次部分:考试成果其次部分:考试成果(占占70%)两部分加权平均两部分加权平均 总评成果总评成果 课课 前前 说说 明明2课前说明课前说明oo1、授课方式:授课与上机实践相结合,依据教、授课方式:授课与上机实践相结合,依据教学进度有可能的话,支配学进度有可能的话,支配12次的课堂探讨。次的课堂探讨。oo2、有个人考勤、小组作业等考核内容。、有个人考勤、小组作业等考核内容。oo3、学生最好
2、能利用课余时间上机熟悉、学生最好能利用课余时间上机熟悉Excel实实现统计计算的过程。现统计计算的过程。oo4、期末考试为闭卷。、期末考试为闭卷。oo5、总评成果由平常成果(出勤状况、个人作业、总评成果由平常成果(出勤状况、个人作业、小组作业等)和期末考试等部分构成。小组作业等)和期末考试等部分构成。3教学参考书(中文版)教学参考书(中文版)oo庞皓庞皓庞皓庞皓 杨作廪主编统计学,西南财经高校出版杨作廪主编统计学,西南财经高校出版杨作廪主编统计学,西南财经高校出版杨作廪主编统计学,西南财经高校出版社,社,社,社,20002000年年年年3 3月其次版月其次版月其次版月其次版oo黄良文主编统计学
3、原理,中国统计出版社黄良文主编统计学原理,中国统计出版社黄良文主编统计学原理,中国统计出版社黄良文主编统计学原理,中国统计出版社20002000年年年年6 6月第一版月第一版月第一版月第一版ooGudmund R.IversenGudmund R.Iversen,吴喜之等译统计学,吴喜之等译统计学,吴喜之等译统计学,吴喜之等译统计学基本概念和方法(基本概念和方法(基本概念和方法(基本概念和方法(StatisticsStatistics the the conceptual approachconceptual approach高等教化出版社,高等教化出版社,高等教化出版社,高等教化出版社,20
4、002000年年年年3 3月第一版月第一版月第一版月第一版 oo贾俊同等主编统计学,中国人民高校出版社,贾俊同等主编统计学,中国人民高校出版社,贾俊同等主编统计学,中国人民高校出版社,贾俊同等主编统计学,中国人民高校出版社,20042004年年年年1010月其次版月其次版月其次版月其次版oo吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统计出版社,计出版社,计出版社,计出版社,20042004年年年年8 8月月月月4教学参考书(英文版)教学参考书(英文版)ooDavie L.Anderson
5、,Davie L.Anderson,Statistics for Statistics for Business and EconomyBusiness and Economy 6 6thth Edition Edition(影印(影印版),版),机械工业出版社机械工业出版社19981998年年7 7月月ooDouglas A.Lind,William G.Marchal,Robert Douglas A.Lind,William G.Marchal,Robert D.Mason,D.Mason,Statistical Techniques in Statistical Techniques
6、in Business and EconomicsBusiness and Economics 11 11thth Edition,(Edition,(影印版影印版),中信出版社,中信出版社,20022002年年5 5月(月(CFACFA系列)系列)ooJessica M.Utts,Robert F.Heckard,Jessica M.Utts,Robert F.Heckard,Mind on Mind on StatisticsStatistics(影印版影印版),机械工业出版社,机械工业出版社,20022002年年1010月月5第第 一一 章章 导论导论o1.1 统计学及其应用领域统计学及
7、其应用领域o1.2 统计数据的类型统计数据的类型o1.3 统计中的几个基本概念统计中的几个基本概念o1.4 几种常用的统计软件几种常用的统计软件6学习目标学习目标o1.理解统计学的含义理解统计学的含义o2.理解统计数据与统计学的关系理解统计数据与统计学的关系o3.了解统计学的应用领域了解统计学的应用领域o4.了解数据的类型了解数据的类型o5.理解统计中的几个基本概念理解统计中的几个基本概念 71.1 统计学及其应用领域统计学及其应用领域一一.统计学与统计规律统计学与统计规律二二.统计的应用领域统计的应用领域三三.历史上著名的统计学家历史上著名的统计学家8你想过下面的问题吗你想过下面的问题吗?o
8、 当你买了一台电器产品时,被告知三年内可以免当你买了一台电器产品时,被告知三年内可以免费保修。那么厂家这样说的依据是什么费保修。那么厂家这样说的依据是什么?因为说多因为说多了厂家会损失;说少了则会失去竞争力,也是损失。了厂家会损失;说少了则会失去竞争力,也是损失。究竟这个保修期是怎样确定的呢究竟这个保修期是怎样确定的呢?o 在同一年级中,同样统计学的课程可能由一些不在同一年级中,同样统计学的课程可能由一些不同老师讲授。老师讲课方式当然不一样;考试题目同老师讲授。老师讲课方式当然不一样;考试题目也不确定相同。那么如何比较不同班级的统计学成也不确定相同。那么如何比较不同班级的统计学成果是否有差异呢
9、果是否有差异呢?9你想过下面的问题吗你想过下面的问题吗?o高高校校排排名名是是一一个个特特别别敏敏感感的的问问题题。不不同同的的机机构构得得出出不不同同的的结结果果;各各自自都都说说自自己己是是客客观观、公公正正和和有有道道理理的。究竟如何理解这些不同的结果呢的。究竟如何理解这些不同的结果呢?o o 任任何何公公司司都都有有一一个个信信用用问问题题。假假如如这这些些公公司司试试图图得得到到贷贷款款时时并并没没有有不不还还贷贷的的不不良良记记录录。如如何何依依据据它它们们的的财财务务和和商商业业资资料料来来推推断断一一个个公公司司的的信信用用等等级级呢呢?10你想过下面的问题吗你想过下面的问题吗
10、?o如如何何通通过过问问卷卷调调查查来来得得到到性性别别、年年龄龄、职职业业、收收入入等等各各种种因因素素与与公公众众对对某某项项事事物物(比比如如商商品品或或政政策策)的的看法的关系呢看法的关系呢?o o 如如何何才才能能够够比比较较客客观观地地得得到到某某个个电电视视节节目目的的收收视视率,以确定插播的广告价格是否合理呢率,以确定插播的广告价格是否合理呢?o最最简简洁洁的的问问题题,如如怎怎样样计计算算国国家家和和地地区区的的平平均均发发展展速速度度?如如何何衡衡量量和和反反映映全全国国城城镇镇镇镇居居民民家家庭庭的的收收入入水水平平的的凹凹凸凸及及其其增增长长速速度度?反反映映某某地地区
11、区的的物物价价变变动动 状况的状况的CPICPI又是如何得到的?又是如何得到的?11什么是统计学?1.数据搜集:取得数据数据搜集:取得数据2.数据分析:分析数据数据分析:分析数据 3.数据描述:图表展示数据数据描述:图表展示数据4.数据说明:结果的说明数据说明:结果的说明 贾贾俊俊同同等等认认为为“收收集集、分分析析、表表述述和和说说明明数数据据的的科科学学”(摘摘自自贾贾俊俊同同等等主主编编统统计计学其次版,学其次版,P1)什么是统计学?什么是统计学?12什么是统计学什么是统计学?o 吴喜之认为:吴喜之认为:“统计学统计学(statistics)是用以是用以收集数据、分析数据、以及由数据得出
12、结论收集数据、分析数据、以及由数据得出结论的一组概念、原则和方法。的一组概念、原则和方法。”o(摘自(摘自吴喜之编著统计学:从数据到结论吴喜之编著统计学:从数据到结论P2)13什么是统计学什么是统计学?o黄良文认为:黄良文认为:“统计学是关于数据搜集、整统计学是关于数据搜集、整理、归纳、分析的方法论科学。理、归纳、分析的方法论科学。”o(摘自(摘自黄良文主编统计学原理黄良文主编统计学原理,P1)14What is Meant by Statistics?oStatistics is the science of collecting,organizing,presenting,analyzin
13、g,and interpreting numerical data to assist in making more effective decisions.oCited by Douglas A.Lind,William G.Marchal,Robert D.Mason,Statistical Techniques in Business and Economics 11th Edition,(影印版影印版)15statistics的定义的定义(不列颠百科全书不列颠百科全书)ostatistics:the science of collecting,analyzing,presenting,
14、and interpreting data.o Copyright 1994-2000 Encyclopaedia Britannica,Inc.o (不列颠百科全书)16统计学探讨的对象统计学探讨的对象o统计探讨的对象是大量现象总体的数量方面。统计探讨的对象是大量现象总体的数量方面。o统计学的探讨对象是现象总体的数量特征和数量关统计学的探讨对象是现象总体的数量特征和数量关系,通过这些数量方面反映社会经济现象的规律性。系,通过这些数量方面反映社会经济现象的规律性。o数量方面的表现形式数量方面的表现形式:o (1)静态统计数据)静态统计数据o (2)动态统计数据)动态统计数据o (3)相关统计数
15、据)相关统计数据17统计探讨的特点之一统计探讨的特点之一o(一)数量性(一)数量性o统计的探讨对象是现象的数量方面,例如社统计的探讨对象是现象的数量方面,例如社会经济现象的规模、水平、现象间的数量关会经济现象的规模、水平、现象间的数量关系,以及确定现象质量的数量界限。系,以及确定现象质量的数量界限。o统计探讨对象的数量性,是统计区分于其他统计探讨对象的数量性,是统计区分于其他社会经济调查探讨活动的根本特点。社会经济调查探讨活动的根本特点。18统计探讨的特点之二统计探讨的特点之二o(二)总体性(二)总体性o 统计探讨对象不是个体现象的数量方面,统计探讨对象不是个体现象的数量方面,而是由很多个体现
16、象构成的总体的数量方面。而是由很多个体现象构成的总体的数量方面。o统计探讨对象的总体性的特点是由社会经济统计探讨对象的总体性的特点是由社会经济现象的特点和统计探讨的目的确定的现象的特点和统计探讨的目的确定的19统计探讨的特点之三统计探讨的特点之三o(三)具体性(三)具体性o统计所探讨对象的数量是具体的数量,不是统计所探讨对象的数量是具体的数量,不是抽象的数量,这是统计和数学的重要区分。抽象的数量,这是统计和数学的重要区分。o假如抽掉具体的内容,不是在确定时间、地假如抽掉具体的内容,不是在确定时间、地点和条件下进行探讨,那就不能说明任何问点和条件下进行探讨,那就不能说明任何问题,也就不成其为统计
17、,其数据也就不是统题,也就不成其为统计,其数据也就不是统计数据。计数据。20统计探讨的特点之四统计探讨的特点之四o(四)变异性(四)变异性o统计探讨的对象总是处在变更之中的,这种统计探讨的对象总是处在变更之中的,这种变更不仅表现在数量上,同时也会表现在品变更不仅表现在数量上,同时也会表现在品质上,质上,o因此,统计探讨的对象不仅是在确定的特定因此,统计探讨的对象不仅是在确定的特定阶段是静态的,同时更多地表现为动态的,阶段是静态的,同时更多地表现为动态的,这也增加了统计探讨的难度。这也增加了统计探讨的难度。21统计探讨的过程统计探讨的过程收集数据收集数据(取得数据取得数据取得数据取得数据)整理数
18、据整理数据(处理数据处理数据处理数据处理数据)解释数据解释数据(结果说明结果说明结果说明结果说明)分析数据分析数据(研究数据研究数据研究数据研究数据)实际问题实际问题22随机性和规律性随机性和规律性o随机性和规律性:关系亲密的孪生子随机性和规律性:关系亲密的孪生子23o例例如如,人人的的寿寿命命是是很很难难预预先先确确定定的的。一一个个吸吸烟烟、喝喝酒酒、不不熬熬炼炼、而而且且喜喜好好油油荤荤食食物物的的人人可可能能比比一一个个很很少少得得病病、生生活活习习惯惯良良好好的人活得长。的人活得长。o因因此此,可可以以说说,活活得得长长短短有有确确定定的的随随机机性性(randomness)。这这种
19、种随随机机性性可可能能和和人人的的经经验验、基基因因、习习惯惯等等等等多多数数不不易易说说清清的的因因素素都有关系。都有关系。随机性和规律性随机性和规律性24随机性和规律性随机性和规律性o但是从总体来说,我国公民的预期寿命却是但是从总体来说,我国公民的预期寿命却是特别稳定的,而且由于生活水平的提高在逐特别稳定的,而且由于生活水平的提高在逐步增长;比如步增长;比如1996年的平均预期寿命为年的平均预期寿命为70.80岁岁,而而2000年为年为71.40岁。这就是规律性。岁。这就是规律性。o一个人可能活过这个平均年龄,也可能活不一个人可能活过这个平均年龄,也可能活不到这个年龄,这是随机的。但是总体
20、来说,到这个年龄,这是随机的。但是总体来说,预期寿命的稳定性,却说明白随机之中有规预期寿命的稳定性,却说明白随机之中有规律性。这种规律就是统计规律。律性。这种规律就是统计规律。25o通过对看起来随机的现象进行统计分析,通过对看起来随机的现象进行统计分析,我们起先相识这个世界。统计思想的基础我们起先相识这个世界。统计思想的基础学问能够帮助把随机性归纳于可能的规律学问能够帮助把随机性归纳于可能的规律性中。性中。o统计思想:从我们如何视察事物和事物本统计思想:从我们如何视察事物和事物本身如何真正发生两方面,帮助我们理解随身如何真正发生两方面,帮助我们理解随机性和规律性的重要性。因此,统计可以机性和规
21、律性的重要性。因此,统计可以看作是一项对随机现象中的规律性的探讨。看作是一项对随机现象中的规律性的探讨。随机性和规律性随机性和规律性26随机性和规律性随机性和规律性o 然然而而,甚甚至至规规律律也也表表现现出出某某种种随随机机性性。假假如如你你再再掷掷100次次硬硬币币,正正面面朝朝上上的的次次数数几几乎乎不不会会和和前前100次次完完全全一一样样。在在第第一一个个100次次中中,或或许许有有48次次硬硬币币的的正正面面朝朝上上,然然而而在在其其次次个个100次次中中,或或许许就就有有53次次正正面面朝朝上上。这这表表明明白白统统计计的的一个重要的本质特征。一个重要的本质特征。o 不不管管我我
22、们们是是否否再再进进行行一一次次或或一一组组新新的的视视察察,每每次次观观测测得得到到的的结结果果,并并不不能能得得到到和和上上次次视视察察一一模一样的结果。模一样的结果。27o这种偏差不仅仅发生于掷硬币时,而且发生于这种偏差不仅仅发生于掷硬币时,而且发生于调查、试验和其它任何一种方式的数据收集中。调查、试验和其它任何一种方式的数据收集中。假如在某次调查中,人们被问到他们如何看待假如在某次调查中,人们被问到他们如何看待当今的某一重要问题,某一比例的人会有某一当今的某一重要问题,某一比例的人会有某一特定的观点。特定的观点。o假如对不同的人再做同样的调查,则有不同于假如对不同的人再做同样的调查,则
23、有不同于上述比例的人支持这一观点。这两个比例之间上述比例的人支持这一观点。这两个比例之间的差异主要是由于数据本身的随机性引起的。的差异主要是由于数据本身的随机性引起的。在这种意义下来说,统计就成了对数据中的偏在这种意义下来说,统计就成了对数据中的偏差问题的探讨。差问题的探讨。随机性和规律性28o 依依据据作作为为统统计计基基础础的的数数学学理理论论(概概率率论论),我我们们可可以以确确定定一一项项调调查查中中的的某某一一比比例例有有多多大大的的随随机机性性,以以及及在在下下一一次次的的重重复复调调查查中中,这这个个比比例例可可能能有有多多大大的的偏偏差差。我我们们甚甚至至可可以以指指出出,这这
24、两两个个比比例例之之间间的的差差异异,是是否否大大到到了了随随机机性性本本身身所所不能说明的地步。不能说明的地步。o我们将在以后章节中引申和具体探讨这些思想。我们将在以后章节中引申和具体探讨这些思想。随机性和规律性随机性和规律性29随机性和规律性随机性和规律性o在规律性中,变更趋势时有出现。比如,随在规律性中,变更趋势时有出现。比如,随着渐渐增加的汽车平安带的运用和保险气囊着渐渐增加的汽车平安带的运用和保险气囊的安装,发生车祸的比例或许在上升,但造的安装,发生车祸的比例或许在上升,但造成的司机损伤呈下降趋势。成的司机损伤呈下降趋势。o统计把单独的、随机的事务置于规律性中,统计把单独的、随机的事
25、务置于规律性中,并揭示其变更趋势。假如在不同时期,交通并揭示其变更趋势。假如在不同时期,交通事故发生次数的(两种规律性的)差异超出事故发生次数的(两种规律性的)差异超出了随机性本身可以说明的地步,那么变更趋了随机性本身可以说明的地步,那么变更趋势就发生了。势就发生了。30o让让我我们们回回顾顾一一下下2020世世纪纪5050年年头头小小儿儿麻麻痹痹症症疫苗的投入运用过程。疫苗的投入运用过程。o小小儿儿麻麻痹痹症症是是一一种种可可怕怕的的疾疾病病,通通常常能能使使患患者者(大大部部分分是是儿儿童童)瘫瘫痪痪或或死死亡亡。在在这这种种病病经经过过多多年年流流行行之之后后,一一种种疫疫苗苗最最终终被
26、被研研制制出出来来。科科学学家家们们希希望望该该疫疫苗苗能能够够预预防防这这种种可可怕怕的的疾疾病病,但但是是没没有有人人清清晰晰这这种种疫疫苗是否真能像人们期盼的那样起作用。苗是否真能像人们期盼的那样起作用。探讨随机性和规律性的例子探讨随机性和规律性的例子31o尽尽管管试试验验室室和和动动物物试试验验的的结结果果很很令令人人激激昂昂,然然而而唯唯一一检检验验这这种种疫疫苗苗是是否否起起作作用用的的方方法法还还是是人人体试验。体试验。o因因为为小小儿儿麻麻痹痹症症是是一一种种较较罕罕见见的的疾疾病病,疫疫苗苗必必需需试试用用于于相相当当一一大大批批孩孩子子们们的的身身上上,所所以以探探讨讨者们
27、确定在者们确定在2020万个孩子身上做试验。万个孩子身上做试验。o此此外外,探探讨讨者者们们还还确确定定用用另另外外相相同同数数目目的的孩孩子子作作为为比比照照组组。比比照照组组的的孩孩子子仅仅仅仅得得到到劝劝慰慰剂剂一一种种看看起起来来像像疫疫苗苗的的替替代代品品以以便便为为视视察察疫苗是否真的起作用。疫苗是否真的起作用。探讨随机性和规律性时的例子探讨随机性和规律性时的例子32o 当孩子们被注射了疫苗或劝慰剂以当孩子们被注射了疫苗或劝慰剂以后,探讨者们起先在下一个后,探讨者们起先在下一个“小儿麻小儿麻痹症季节痹症季节”中视察试验结果。在比照中视察试验结果。在比照组中,有组中,有138个孩子感
28、染了此病。这个孩子感染了此病。这个数字当然有确定的随机性,探讨者个数字当然有确定的随机性,探讨者们并不能确定它意味着什么。们并不能确定它意味着什么。o假如另外一组的假如另外一组的20万个孩子也被注万个孩子也被注射劝慰剂,那么不确定会有同样多的射劝慰剂,那么不确定会有同样多的孩子感染此疾病。依据随机性的大小,孩子感染此疾病。依据随机性的大小,可能有可能有130或或140或其它数目的孩或其它数目的孩子们染上小儿麻痹症。子们染上小儿麻痹症。探讨随机性和规律性时的例子探讨随机性和规律性时的例子33o 在在被被注注射射了了疫疫苗苗的的那那一一组组(称称之之为为试试验验组组)中中,有有56个个孩孩子子患患
29、了了小小儿儿麻麻痹痹症症,这这个个数数字字当当然然也也有随机性。有随机性。o问问题题的的关关键键之之处处在在于于,患患该该疾疾病病的的56个个孩孩子子和和138个个孩孩子子的的差差别别是是否否超超过过了了随随机机性性所所能能说说明明的的程程度度。假假如如是是的的话话(即即56与与138之之差差是是显显著著的的大大),那那么么探探讨讨者者们们就就能能够够有有把把握握说说,疫疫苗苗起起作作用用了了。利利用用后后面面介介绍绍的的方方法法,我我们们可可以以看看到到,138和和56的的差差别别超超出出了了随随机机性性本本身身所所能能说说明明的的范范围围,因因此此该该疫疫苗苗被被宣宣布布为为能能有有效效降
30、降低低该该疾疾病病发发病率的作用,其研制是成功的。病率的作用,其研制是成功的。探讨随机性和规律性时例子探讨随机性和规律性时例子34o从从今今以以后后,这这种种疫疫苗苗在在很很多多国国家家根根除除了了小小儿儿麻麻痹痹症症。全全世世界界的的健健康康组组织织所所做做的的进进一一步步的的努努力力,将将使使不不发发达达国国家家的的孩孩子子们们,在在不不远远的的将将来来,也也有有可可能能不不再再遭遭遇小儿麻痹症所带来的苦痛。遇小儿麻痹症所带来的苦痛。o在在某某种种重重要要的的意意义义上上说说,统统计计推推理理为为发发展展和和检检验验疫疫苗的探讨者们供应了有力的理论支持。苗的探讨者们供应了有力的理论支持。探
31、讨随机性和规律性时例子探讨随机性和规律性时例子35概率和机会概率和机会o 概率(概率(Probability)是一个取值在)是一个取值在0和和1之间的数,它用以度量某一随机事务以多大之间的数,它用以度量某一随机事务以多大的机会或可能性发生。的机会或可能性发生。36这是这是 Museum of Science,Boston,US,有关正,有关正态分布和概率态分布和概率的介绍。的介绍。37概率和机会概率和机会o有些事务发生的概率是无法精确推断的。比如,你对别有些事务发生的概率是无法精确推断的。比如,你对别人说你这个中秋节准备去旅游的概率或许是人说你这个中秋节准备去旅游的概率或许是80%80%。o但
32、是,有些简洁随机事务的概率是可以知道和计算出来但是,有些简洁随机事务的概率是可以知道和计算出来的。的。o比如,掷一枚匀整的骰子。但掷出骰子之后原委会得到比如,掷一枚匀整的骰子。但掷出骰子之后原委会得到哪一种结果事先是无法预知的。这体现了随机性。哪一种结果事先是无法预知的。这体现了随机性。o但是,只要没有人在骰子上做手脚,你事先知道得到但是,只要没有人在骰子上做手脚,你事先知道得到6 6点那一面的概率应当是六分之一。得到其它点的概率也点那一面的概率应当是六分之一。得到其它点的概率也是一样。当然,依据我们学过的古典概率还可以计算出是一样。当然,依据我们学过的古典概率还可以计算出比较困难随机结果发生
33、的概率值,这反映了掷骰子的规比较困难随机结果发生的概率值,这反映了掷骰子的规律性。律性。38统计方法体系统计方法体系39统计方法之一类:统计方法之一类:描述统计描述统计(descriptive statistics)1.内容内容n搜集数据n整理数据n展示数据n描述性分析2.目的目的n描述数据特征n找出数据的基本规律0 0 0252525505050Q1Q1Q1Q2Q2Q2Q3Q3Q3Q4Q4Q4¥x x x=30 =30 =30 s s s2 22=105=105=10540统计方法之另一类统计方法之另一类推断统计推断统计(inferential statistics)1.内容内容参数估计假设
34、检验2.目的目的对总体特征作出推断样样样样本本本本总体总体总体总体41描述统计与推断统计的关系描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据揭示总体内揭示总体内揭示总体内揭示总体内在的数量规在的数量规在的数量规在的数量规律性律性律性律性推断统计推断统计推断统计推断统计(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进行估计和检验等)行估计和检验等)行估计和检验等)行估计和检验等)概率论概率论概率论概率论(包括分布理论、大数定律(包括分布
35、理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律和中心极限定理等)和中心极限定理等)和中心极限定理等)和中心极限定理等)描述统计描述统计描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据42统计的应用领域统计的应用领域统计学统计学经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会学社会学社会学社会学43统计的应用领域统计的应用领域actuarial work(actuarial work(精
36、算精算精算精算)agriculture()agriculture(农业农业农业农业)animal science(animal science(动物学动物学动物学动物学)anthropology()anthropology(人类学人类学人类学人类学)archaeology(archaeology(考古学考古学考古学考古学)auditing()auditing(审计学审计学审计学审计学)crystallography(crystallography(晶体学晶体学晶体学晶体学)demography()demography(人口统计学人口统计学人口统计学人口统计学)dentistry(dentist
37、ry(牙医学牙医学牙医学牙医学)ecology()ecology(生态学生态学生态学生态学)econometrics(econometrics(经济计量学经济计量学经济计量学经济计量学)education()education(教化学教化学教化学教化学)election forecasting and projection(election forecasting and projection(选举预料和策划选举预料和策划选举预料和策划选举预料和策划)engineering(engineering(工程工程工程工程)epidemiology()epidemiology(流行病学流行病学流行病学
38、流行病学)finance(finance(金融金融金融金融)fisheries research(fisheries research(水产渔业探讨水产渔业探讨水产渔业探讨水产渔业探讨)gambling(gambling(赌博赌博赌博赌博)genetics()genetics(遗传学遗传学遗传学遗传学)geography(geography(地理学地理学地理学地理学)geology()geology(地质学地质学地质学地质学)historical historical research research(历历历历史史史史探探探探讨讨讨讨)human human genetics genetic
39、s(人人人人类类类类遗遗遗遗传传传传学学学学)44统计的应用领域统计的应用领域hydrology(hydrology(水文学水文学水文学水文学)Industry()Industry(工业工业工业工业)linguistics(linguistics(语言学语言学语言学语言学)literature()literature(文学文学文学文学)manpower planning(manpower planning(劳动力支配劳动力支配劳动力支配劳动力支配)management science(management science(管理科学管理科学管理科学管理科学)marketing marketing
40、(市市市市场场场场营营营营销销销销学学学学)medical medical diagnosis diagnosis(医医医医学学学学诊诊诊诊断断断断)meteorology(meteorology(气象学气象学气象学气象学)military science()military science(军事科学军事科学军事科学军事科学)nuclear material safeguards(nuclear material safeguards(核材料平安管理核材料平安管理核材料平安管理核材料平安管理)ophthalmology(ophthalmology(眼科学眼科学眼科学眼科学)pharmaceut
41、ics()pharmaceutics(制药学制药学制药学制药学)physics(physics(物理学物理学物理学物理学)political science()political science(政治学政治学政治学政治学)psychology(psychology(心理学心理学心理学心理学)psychophysics()psychophysics(心理物理学心理物理学心理物理学心理物理学)quality control(quality control(质量限制质量限制质量限制质量限制)religious studies()religious studies(宗教探讨宗教探讨宗教探讨宗教探讨)s
42、ociology(sociology(社会学社会学社会学社会学)survey sampling()survey sampling(调查抽样调查抽样调查抽样调查抽样)taxonomy taxonomy(分分分分类类类类学学学学)weather weather modification modification(气气气气象象象象改善改善改善改善)45历史上著名的统计学家历史上著名的统计学家 Jacob Bernoulli(Jacob Bernoulli(伯努利伯努利)(1654-1705)(1654-1705)Edmond Halley(Edmond Halley(哈雷哈雷)(1656-1742)
43、(1656-1742)De De MoivreMoivre(棣美佛棣美佛)(1667-1754)(1667-1754)Thomas Thomas BayesBayes(贝叶斯贝叶斯)(1702-1761)(1702-1761)Leonhard Euler(Leonhard Euler(欧拉欧拉)(1707-1783)(1707-1783)Pierre Simon Laplace(Pierre Simon Laplace(拉普拉斯拉普拉斯)(1749-1827)(1749-1827)AdrienAdrien Marie Legendre(Marie Legendre(勒让德勒让德)(1752-1
44、833)(1752-1833)Thomas Robert Malthus(Thomas Robert Malthus(马尔萨斯马尔萨斯)(1766-1834)(1766-1834)Thomas Robert Thomas Robert Malthus Malthus(马尔萨斯马尔萨斯)Pierre Simon Laplace Pierre Simon Laplace(拉普拉斯拉普拉斯)Leonhard Euler Leonhard Euler(欧拉欧拉)46历史上著名的统计学家历史上著名的统计学家 Friedrich Gauss(Friedrich Gauss(高斯高斯)(1777-1855)
45、(1777-1855)Johann Johann GregorGregor Mendel(Mendel(孟德尔孟德尔)(1822-1884)(1822-1884)Karl Pearson(Karl Pearson(皮尔森皮尔森)(1857-1936)(1857-1936)Ronald Aylmer Fisher(Ronald Aylmer Fisher(费歇费歇)(1890-1962),)(1890-1962),JerzyJerzy NeymanNeyman(1894-1981)(1894-1981)EgonEgon Sharpe Pearson(Sharpe Pearson(皮尔森皮尔森)(
46、1895-1980)(1895-1980)William Feller(William Feller(费勒费勒)(1906-1970).)(1906-1970).Friedrich Gauss Friedrich Gauss(高斯高斯)Johann Gregor MendelJohann Gregor Mendel(孟德尔孟德尔)471.一、分类数据、依次数据、数值型数据一、分类数据、依次数据、数值型数据2.二、观测数据和试验数据二、观测数据和试验数据3.三、截面数据和时间序列数据三、截面数据和时间序列数据1.2 统计统计数据的类型数据的类型48什么是统计数据?什么是统计数据?(data)1.
47、对各类现象进行计量的结果对各类现象进行计量的结果 2.不不是是指指单单个个的的数数字字,而而是是由由多多个个数数据据构构成成的数据集合的数据集合 3.不不仅仅仅仅是是指指数数字字,它它可可以以是是数数字字的的,也也可可以是文字的以是文字的 4.从实质上说,数据是指某变量的具体取值。从实质上说,数据是指某变量的具体取值。5.当然,数据可以是文字、也可以是数字当然,数据可以是文字、也可以是数字49这里要明确变量与数据的区分与联系这里要明确变量与数据的区分与联系o变量(名):是表明某变量(名):是表明某事物某个特征的概念和事物某个特征的概念和名称,且可以取不同的名称,且可以取不同的值。值。o例如例如
48、,人的性别、物体,人的性别、物体颜色、学历、产品等级、颜色、学历、产品等级、婚姻状况、所属民族、婚姻状况、所属民族、年龄、身高、体重、收年龄、身高、体重、收入、肤色、国籍,入、肤色、国籍,等等等等变量的分类变量的分类名名名名义义义义变变变变量量量量依依依依次次次次变变变变量量量量数数数数值值值值变变变变量量量量50一、统计数据的分类一、统计数据的分类o统计数据的分类统计数据的分类o按计量层按计量层次次分分分分类类类类的的的的数数数数据据据据顺顺顺顺序序序序的的的的数数数数据据据据数数数数值值值值型型型型数数数数据据据据o按时间状按时间状况况截截截截面面面面的的的的数数数数据据据据时时时时序序序
49、序的的的的数数数数据据据据o按收集方按收集方法法观观观观察察察察的的的的数数数数据据据据试试试试验验验验的的的的数数数数据据据据51一、统计数据的分类一、统计数据的分类(按计量尺度的大小分类按计量尺度的大小分类)1.分类数据分类数据(categorical data)2.对事物进行分类的结果对事物进行分类的结果3.数据表现为类别,用文字来表述数据表现为类别,用文字来表述4.例例如如,人人口口按按性性别别分分为为男男、女女两两类类;物物体体按按颜颜色色不不同同分分为为红红、黄、蓝;黄、蓝;5.依次数据依次数据(rank data)6.对事物类别依次的测度对事物类别依次的测度7.数据表现为类别,用
50、文字来表述数据表现为类别,用文字来表述8.例例如如,产产品品按按等等级级分分为为一一等等品品、二二等等品品、三三等等品品、次次品品等等、学历、职称学历、职称 9.数值型数据数值型数据(metric data)10.对事物的精确测度对事物的精确测度11.结果表现为具体的数值结果表现为具体的数值12.例如:身高为例如:身高为175cm、168cm;年龄为;年龄为21、20、19岁岁52二、统计数据的分类二、统计数据的分类 (按收集方法分按收集方法分)1.观测的数据观测的数据(observational data)2.通过调查或观测而收集到的数据通过调查或观测而收集到的数据3.在没有对事物人为限制的