《统计学第一章绪论.ppt》由会员分享,可在线阅读,更多相关《统计学第一章绪论.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第一章绪论o课程性质:课程性质:专业基础课,专业基础课,o学时总数学时总数:48学时(第学时(第1-16周)周)o总评成绩的组成:总评成绩的组成:第一部分:平时成绩第一部分:平时成绩(占占30%)o 第二部分:考试成绩第二部分:考试成绩(占占70%)两部分加权平均两部分加权平均 总评成绩总评成绩 课课 前前 说说 明明2课前说明课前说明oo1、授课方式:授课与上机实践相结合,根据教、授课方式:授课与上机实践相结合,根据教学进度有可能的话,安排学进度有可能的话,安排12次的课堂讨论。次的课堂讨论。oo2、有个人考勤、小组作业等考核内容。、有个人考勤、小组作业等考核内容。oo3、学生最好能利
2、用课余时间上机熟悉、学生最好能利用课余时间上机熟悉Excel实实现统计计算的过程。现统计计算的过程。oo4、期末考试为闭卷。、期末考试为闭卷。oo5、总评成绩由平时成绩(出勤情况、个人作业、总评成绩由平时成绩(出勤情况、个人作业、小组作业等)和期末考试等部分构成。小组作业等)和期末考试等部分构成。3教学参考书(中文版)教学参考书(中文版)oo庞皓庞皓庞皓庞皓 杨作廪主编统计学,西南财经大学出版杨作廪主编统计学,西南财经大学出版杨作廪主编统计学,西南财经大学出版杨作廪主编统计学,西南财经大学出版社,社,社,社,20002000年年年年3 3月第二版月第二版月第二版月第二版oo黄良文主编统计学原理
3、,中国统计出版社黄良文主编统计学原理,中国统计出版社黄良文主编统计学原理,中国统计出版社黄良文主编统计学原理,中国统计出版社20002000年年年年6 6月第一版月第一版月第一版月第一版ooGudmund R.IversenGudmund R.Iversen,吴喜之等译,吴喜之等译,吴喜之等译,吴喜之等译统计学统计学统计学统计学基本概念和方法(基本概念和方法(基本概念和方法(基本概念和方法(StatisticsStatistics the the conceptual approachconceptual approach高等教育出版社,高等教育出版社,高等教育出版社,高等教育出版社,2000
4、200020002000年年年年3 3 3 3月第一版月第一版月第一版月第一版 oo贾俊平等主编统计学,中国人民大学出版社,贾俊平等主编统计学,中国人民大学出版社,贾俊平等主编统计学,中国人民大学出版社,贾俊平等主编统计学,中国人民大学出版社,20042004年年年年1010月第二版月第二版月第二版月第二版oo吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统吴喜之编著统计学:从数据到结论,中国统计出版社,计出版社,计出版社,计出版社,20042004年年年年8 8月月月月4教学参考书(英文版)教学参考书(英文版)ooDavie
5、L.Anderson,Davie L.Anderson,Statistics for Statistics for Business and EconomyBusiness and Economy 6 6thth Edition Edition(影印(影印版),版),机械工业出版社机械工业出版社19981998年年7 7月月ooDouglas A.Lind,William G.Marchal,Robert Douglas A.Lind,William G.Marchal,Robert D.Mason,D.Mason,Statistical Techniques in Statistical T
6、echniques in Business and EconomicsBusiness and Economics 11 11thth Edition,(Edition,(影印版影印版),中信出版社,中信出版社,20022002年年5 5月(月(CFACFA系列)系列)ooJessica M.Utts,Robert F.Heckard,Jessica M.Utts,Robert F.Heckard,Mind on Mind on StatisticsStatistics(影印版影印版),机械工业出版社,机械工业出版社,20022002年年1010月月5第第 一一 章章 导论导论o1.1 统计学
7、及其应用领域统计学及其应用领域o1.2 统计数据的类型统计数据的类型o1.3 统计中的几个基本概念统计中的几个基本概念o1.4 几种常用的统计软件几种常用的统计软件6学习目标学习目标o1.理解统计学的含义理解统计学的含义o2.理解统计数据与统计学的关系理解统计数据与统计学的关系o3.了解统计学的应用领域了解统计学的应用领域o4.了解数据的类型了解数据的类型o5.理解统计中的几个基本概念理解统计中的几个基本概念 71.1 统计学及其应用领域统计学及其应用领域一一.统计学与统计规律统计学与统计规律二二.统计的应用领域统计的应用领域三三.历史上著名的统计学家历史上著名的统计学家8你想过下面的问题吗你
8、想过下面的问题吗?o 当你买了一台电器产品时,被告知三年内可以免当你买了一台电器产品时,被告知三年内可以免费保修。那么厂家这样说的依据是什么费保修。那么厂家这样说的依据是什么?因为说多因为说多了厂家会损失;说少了则会失去竞争力,也是损失。了厂家会损失;说少了则会失去竞争力,也是损失。到底这个保修期是怎样决定的呢到底这个保修期是怎样决定的呢?o 在同一年级中,同样统计学的课程可能由一些不在同一年级中,同样统计学的课程可能由一些不同教师讲授。教师讲课方式当然不一样;考试题目同教师讲授。教师讲课方式当然不一样;考试题目也不一定相同。那么如何比较不同班级的统计学成也不一定相同。那么如何比较不同班级的统
9、计学成绩是否有差异呢绩是否有差异呢?9你想过下面的问题吗你想过下面的问题吗?o大大学学排排名名是是一一个个非非常常敏敏感感的的问问题题。不不同同的的机机构构得得出出不不同同的的结结果果;各各自自都都说说自自己己是是客客观观、公公正正和和有有道道理理的。到底如何理解这些不同的结果呢的。到底如何理解这些不同的结果呢?o o 任何公司都有一个信用问题。如果这些公司试图任何公司都有一个信用问题。如果这些公司试图得到贷款时并没有不还贷的不良记录。如何根据它得到贷款时并没有不还贷的不良记录。如何根据它们的财务和商业资料来判断一个公司的信用等级呢们的财务和商业资料来判断一个公司的信用等级呢?10你想过下面的
10、问题吗你想过下面的问题吗?o如如何何通通过过问问卷卷调调查查来来得得到到性性别别、年年龄龄、职职业业、收收入入等等各各种种因因素素与与公公众众对对某某项项事事物物(比比如如商商品品或或政政策策)的的态度的关系呢态度的关系呢?o 如何才能够比较客观地得到某个电视节目的收视如何才能够比较客观地得到某个电视节目的收视率,以确定插播的广告价格是否合理呢率,以确定插播的广告价格是否合理呢?o最简单的问题最简单的问题,如怎样计算国家和地区的平均发展,如怎样计算国家和地区的平均发展速度?如何衡量和反映全国城镇镇居民家庭的收入速度?如何衡量和反映全国城镇镇居民家庭的收入水平的高低及其增长速度?反映某地区的物价
11、变动水平的高低及其增长速度?反映某地区的物价变动 情况的情况的CPI又是如何得到的?又是如何得到的?11什么是统计学?1.数据搜集:取得数据数据搜集:取得数据2.数据分析:分析数据数据分析:分析数据 3.数据描述:图表展示数据数据描述:图表展示数据4.数据解释:结果的说明数据解释:结果的说明 贾贾俊俊平平等等认认为为“收收集集、分分析析、表表述述和和解解释释数数据据的的科科学学”(摘摘自自贾贾贾贾俊俊俊俊平平平平等等等等主主主主编编编编统统统统计计计计学学学学第二版,第二版,第二版,第二版,P1P1)什么是统计学?什么是统计学?12什么是统计学什么是统计学?o 吴喜之认为:吴喜之认为:“统计学
12、统计学(statistics)是用以是用以收集数据、分析数据、以及由数据得出结论收集数据、分析数据、以及由数据得出结论的一组概念、原则和方法。的一组概念、原则和方法。”o(摘自(摘自吴喜之编著统计学:从数据到结论吴喜之编著统计学:从数据到结论P2)13什么是统计学什么是统计学?o黄良文认为:黄良文认为:“统计学是关于数据搜集、整统计学是关于数据搜集、整理、归纳、分析的方法论科学。理、归纳、分析的方法论科学。”o(摘自(摘自黄良文主编统计学原理黄良文主编统计学原理,P1)14What is Meant by Statistics?oStatistics is the science of col
13、lecting,organizing,presenting,analyzing,and interpreting numerical data to assist in making more effective decisions.oCited by Douglas A.Lind,William G.Marchal,Robert D.Mason,Statistical Techniques in Business and Economics 11th Edition,(影印版影印版)15statistics的定义的定义(不列颠百科全书不列颠百科全书)ostatistics:the scien
14、ce of collecting,analyzing,presenting,and interpreting data.o Copyright 1994-2000 Encyclopaedia Britannica,Inc.o (不列颠百科全书)16统计学研究的对象统计学研究的对象o统计研究的对象是大量现象总体的数量方面统计研究的对象是大量现象总体的数量方面。o统计学的研究对象是现象总体的数量特征和数量关统计学的研究对象是现象总体的数量特征和数量关系,通过这些数量方面反映社会经济现象的规律性。系,通过这些数量方面反映社会经济现象的规律性。o数量方面的表现形式数量方面的表现形式:(1)静态统计数据
15、)静态统计数据 (2)动态统计数据)动态统计数据 (3)相关统计数据)相关统计数据17统计研究的特点之一统计研究的特点之一o(一)数量性(一)数量性o统计的研究对象是现象的数量方面,例如社统计的研究对象是现象的数量方面,例如社会经济现象的规模、水平、现象间的数量关会经济现象的规模、水平、现象间的数量关系,以及决定现象质量的数量界限。系,以及决定现象质量的数量界限。o统计研究对象的数量性,是统计区别于其他统计研究对象的数量性,是统计区别于其他社会经济调查研究活动的根本特点。社会经济调查研究活动的根本特点。18统计研究的特点之二统计研究的特点之二o(二)总体性(二)总体性o 统计研究对象不是个体现
16、象的数量方面,统计研究对象不是个体现象的数量方面,而是由许多个体现象构成的总体的数量方面。而是由许多个体现象构成的总体的数量方面。o统计研究对象的总体性的特点是由社会经济统计研究对象的总体性的特点是由社会经济现象的特点和统计研究的目的决定的现象的特点和统计研究的目的决定的19统计研究的特点之三统计研究的特点之三o(三)具体性(三)具体性o统计所研究对象的数量是具体的数量,不是统计所研究对象的数量是具体的数量,不是抽象的数量,这是统计和数学的重要区别。抽象的数量,这是统计和数学的重要区别。o如果抽掉具体的内容,不是在一定时间、地如果抽掉具体的内容,不是在一定时间、地点和条件下进行研究,那就不能说
17、明任何问点和条件下进行研究,那就不能说明任何问题,也就不成其为统计,其数据也就不是统题,也就不成其为统计,其数据也就不是统计数据。计数据。20统计研究的特点之四统计研究的特点之四o(四)变异性(四)变异性o统计研究的对象总是处在变化之中的,这种统计研究的对象总是处在变化之中的,这种变化不仅表现在数量上,同时也会表现在品变化不仅表现在数量上,同时也会表现在品质上,质上,o因此,统计研究的对象不仅是在一定的特定因此,统计研究的对象不仅是在一定的特定阶段是静态的,同时更多地表现为动态的,阶段是静态的,同时更多地表现为动态的,这也增加了统计研究的难度。这也增加了统计研究的难度。21统计研究的过程统计研
18、究的过程收集数据收集数据(取得数据取得数据取得数据取得数据)整理数据整理数据(处理数据处理数据处理数据处理数据)解释数据解释数据(结果说明结果说明结果说明结果说明)分析数据分析数据(研究数据研究数据研究数据研究数据)实际问题实际问题22随机性和规律性随机性和规律性o随机性和规律性:关系密切的孪生子随机性和规律性:关系密切的孪生子23o例例如如,人人的的寿寿命命是是很很难难预预先先确确定定的的。一一个个吸吸烟烟、喝喝酒酒、不不锻锻炼炼、而而且且喜喜好好油油荤荤食食物物的的人人可可能能比比一一个个很很少少得得病病、生生活活习习惯惯良良好好的人活得长。的人活得长。o因因此此,可可以以说说,活活得得长
19、长短短有有一一定定的的随随机机性性(randomness)。这这种种随随机机性性可可能能和和人人的的经经历历、基基因因、习习惯惯等等等等无无数数不不易易说说清清的的因因素素都有关系。都有关系。随机性和规律性随机性和规律性24随机性和规律性随机性和规律性o但是从总体来说,我国公民的预期寿命却是但是从总体来说,我国公民的预期寿命却是非常稳定的,而且由于生活水平的提高在逐非常稳定的,而且由于生活水平的提高在逐步增长;比如步增长;比如1996年的平均预期寿命为年的平均预期寿命为70.80岁岁,而而2000年为年为71.40岁。这就是规律性。岁。这就是规律性。o一个人可能活过这个平均年龄,也可能活不一个
20、人可能活过这个平均年龄,也可能活不到这个年龄,这是随机的。但是总体来说,到这个年龄,这是随机的。但是总体来说,预期寿命的稳定性,却说明了随机之中有规预期寿命的稳定性,却说明了随机之中有规律性。这种规律就是统计规律。律性。这种规律就是统计规律。25o通过对看起来随机的现象进行统计分析,通过对看起来随机的现象进行统计分析,我们开始认识这个世界。统计思想的基础我们开始认识这个世界。统计思想的基础知识能够帮助把随机性归纳于可能的规律知识能够帮助把随机性归纳于可能的规律性中。性中。o统计思想统计思想:从我们如何:从我们如何观察事物观察事物和和事物本事物本身如何真正发生身如何真正发生两方面,帮助我们理解随
21、两方面,帮助我们理解随机性和规律性的重要性。因此,统计可以机性和规律性的重要性。因此,统计可以看作是一项对随机现象中的规律性的研究。看作是一项对随机现象中的规律性的研究。随机性和规律性随机性和规律性26随机性和规律性随机性和规律性o 然然而而,甚甚至至规规律律也也表表现现出出某某种种随随机机性性。如如果果你你再再掷掷100次次硬硬币币,正正面面朝朝上上的的次次数数几几乎乎不不会会和和前前100次次完完全全一一样样。在在第第一一个个100次次中中,也也许许有有48次次硬硬币币的的正正面面朝朝上上,然然而而在在第第二二个个100次次中中,也也许许就就有有53次次正正面面朝朝上上。这这表表明明了了统
22、统计计的的一个重要的本质特征。一个重要的本质特征。o 不不管管我我们们是是否否再再进进行行一一次次或或一一组组新新的的观观察察,每每次次观观测测得得到到的的结结果果,并并不不能能得得到到和和上上次次观观察察一一模一样的结果。模一样的结果。27o这种偏差不仅仅发生于掷硬币时,而且发生于这种偏差不仅仅发生于掷硬币时,而且发生于调查、实验和其它任何一种方式的数据收集中。调查、实验和其它任何一种方式的数据收集中。如果在某次调查中,人们被问到他们如何看待如果在某次调查中,人们被问到他们如何看待当今的某一重要问题,某一比例的人会有某一当今的某一重要问题,某一比例的人会有某一特定的观点。特定的观点。o如果对
23、不同的人再做同样的调查,则有不同于如果对不同的人再做同样的调查,则有不同于上述比例的人支持这一观点。这两个比例之间上述比例的人支持这一观点。这两个比例之间的差异主要是由于数据本身的随机性引起的。的差异主要是由于数据本身的随机性引起的。在这种意义下来说,统计就成了对数据中的在这种意义下来说,统计就成了对数据中的偏偏差问题差问题的研究。的研究。随机性和规律性28o 根根据据作作为为统统计计基基础础的的数数学学理理论论(概概率率论论),我我们们可可以以确确定定一一项项调调查查中中的的某某一一比比例例有有多多大大的的随随机机性性,以以及及在在下下一一次次的的重重复复调调查查中中,这这个个比比例例可可能
24、能有有多多大大的的偏偏差差。我我们们甚甚至至可可以以指指出出,这这两两个个比比例例之之间间的的差差异异,是是否否大大到到了了随随机机性性本本身身所所不能解释的地步。不能解释的地步。o我们将在以后章节中引申和详细讨论这些思想。我们将在以后章节中引申和详细讨论这些思想。随机性和规律性随机性和规律性29随机性和规律性随机性和规律性o在规律性中,变化趋势时有出现。比如,随在规律性中,变化趋势时有出现。比如,随着逐渐增加的汽车安全带的使用和保险气囊着逐渐增加的汽车安全带的使用和保险气囊的安装,发生车祸的比例也许在上升,但造的安装,发生车祸的比例也许在上升,但造成的司机损伤呈下降趋势。成的司机损伤呈下降趋
25、势。o统计把单独的、随机的事件置于规律性中,统计把单独的、随机的事件置于规律性中,并揭示其变化趋势并揭示其变化趋势。如果在不同时期,交通如果在不同时期,交通事故发生次数的(两种规律性的)差异超出事故发生次数的(两种规律性的)差异超出了随机性本身可以解释的地步,那么变化趋了随机性本身可以解释的地步,那么变化趋势就发生了。势就发生了。30o让让我我们们回回顾顾一一下下2020世世纪纪5050年年代代小小儿儿麻麻痹痹症症疫苗的投入使用过程。疫苗的投入使用过程。o小小儿儿麻麻痹痹症症是是一一种种可可怕怕的的疾疾病病,通通常常能能使使患患者者(大大部部分分是是儿儿童童)瘫瘫痪痪或或死死亡亡。在在这这种种
26、病病经经过过多多年年流流行行之之后后,一一种种疫疫苗苗最最终终被被研研制制出出来来。科科学学家家们们希希望望该该疫疫苗苗能能够够预预防防这这种种可可怕怕的的疾疾病病,但但是是没没有有人人清清楚楚这这种种疫疫苗是否真能像人们期待的那样起作用。苗是否真能像人们期待的那样起作用。研究随机性和规律性的例子研究随机性和规律性的例子31o尽尽管管实实验验室室和和动动物物实实验验的的结结果果很很令令人人振振奋奋,然然而而唯唯一一检检验验这这种种疫疫苗苗是是否否起起作作用用的的方方法法还还是是人人体实验。体实验。o因因为为小小儿儿麻麻痹痹症症是是一一种种较较罕罕见见的的疾疾病病,疫疫苗苗必必须须试试用用于于相
27、相当当一一大大批批孩孩子子们们的的身身上上,所所以以研研究究者们决定在者们决定在2020万个孩子身上做实验。万个孩子身上做实验。o此此外外,研研究究者者们们还还决决定定用用另另外外相相同同数数目目的的孩孩子子作作为为对对照照组组。对对照照组组的的孩孩子子仅仅仅仅得得到到安安慰慰剂剂一一种种看看起起来来像像疫疫苗苗的的替替代代品品以以便便为为观观察察疫苗是否真的起作用。疫苗是否真的起作用。研究随机性和规律性时的例子研究随机性和规律性时的例子32o 当孩子们被注射了疫苗或安慰剂以当孩子们被注射了疫苗或安慰剂以后,研究者们开始在下一个后,研究者们开始在下一个“小儿麻小儿麻痹症季节痹症季节”中观察实验
28、结果。在对照中观察实验结果。在对照组中,有组中,有138138个孩子感染了此病。这个孩子感染了此病。这个数字当然有一定的随机性,研究者个数字当然有一定的随机性,研究者们并不能确定它意味着什么。们并不能确定它意味着什么。o如果另外一组的如果另外一组的2020万个孩子也被注射万个孩子也被注射安慰剂,那么不一定会有同样多的孩安慰剂,那么不一定会有同样多的孩子感染此疾病。根据随机性的大小,子感染此疾病。根据随机性的大小,可能有可能有130130或或140140或其它数目的孩子们或其它数目的孩子们染上小儿麻痹症染上小儿麻痹症。研究随机性和规律性时的例子研究随机性和规律性时的例子33o 在在被被注注射射了
29、了疫疫苗苗的的那那一一组组(称称之之为为试试验验组组)中中,有有5656个个孩孩子子患患了了小小儿儿麻麻痹痹症症,这这个个数数字字当当然然也也有有随机性。随机性。o问问题题的的关关键键之之处处在在于于,患患该该疾疾病病的的5656个个孩孩子子和和138138个个孩孩子子的的差差别别是是否否超超过过了了随随机机性性所所能能解解释释的的程程度度。如如果果是是的的话话(即即5656与与138138之之差差是是显显著著的的大大),那那么么研研究究者者们们就就能能够够有有把把握握说说,疫疫苗苗起起作作用用了了。利利用用后后面面介介绍绍的的方方法法,我我们们可可以以看看到到,138138和和5656的的差
30、差别别超超出出了了随随机机性性本本身身所所能能解解释释的的范范围围,因因此此该该疫疫苗苗被被宣宣布布为为能能有有效效降降低低该该疾疾病病发发病病率率的的作作用用,其研制是成功的。其研制是成功的。研究随机性和规律性时例子研究随机性和规律性时例子34o从从此此以以后后,这这种种疫疫苗苗在在许许多多国国家家根根除除了了小小儿儿麻麻痹痹症症。全全世世界界的的健健康康组组织织所所做做的的进进一一步步的的努努力力,将将使使不不发发达达国国家家的的孩孩子子们们,在在不不远远的的将将来来,也也有有可可能能不不再再遭遭受小儿麻痹症所带来的痛苦。受小儿麻痹症所带来的痛苦。o在在某某种种重重要要的的意意义义上上说说
31、,统统计计推推理理为为发发展展和和检检验验疫疫苗的研究者们提供了有力的理论支持。苗的研究者们提供了有力的理论支持。研究随机性和规律性时例子研究随机性和规律性时例子35概率和机会概率和机会o 概率(概率(Probability)是一个取值在是一个取值在0和和1之间的数,它用以度量某一随机事件以多大之间的数,它用以度量某一随机事件以多大的机会或可能性发生。的机会或可能性发生。36这是这是 Museum of Science,Boston,US,有关正,有关正态分布和概率态分布和概率的介绍。的介绍。37概率和机会概率和机会o有些事件发生的概率是无法精确推断的。比如,你对别有些事件发生的概率是无法精确
32、推断的。比如,你对别人说你这个中秋节准备去旅游的概率大概是人说你这个中秋节准备去旅游的概率大概是80%80%。o但是,有些简单随机事件的概率是可以知道和计算出来但是,有些简单随机事件的概率是可以知道和计算出来的。的。o比如,掷一枚均匀的骰子。但掷出骰子之后究竟会得到比如,掷一枚均匀的骰子。但掷出骰子之后究竟会得到哪一种结果事先是无法预知的。这体现了随机性。哪一种结果事先是无法预知的。这体现了随机性。o但是,只要没有人在骰子上做手脚,你事先知道得到但是,只要没有人在骰子上做手脚,你事先知道得到6 6点那一面的概率应该是六分之一。得到其它点的概率也点那一面的概率应该是六分之一。得到其它点的概率也是
33、一样。当然,根据我们学过的古典概率还可以计算出是一样。当然,根据我们学过的古典概率还可以计算出比较复杂随机结果发生的概率值,这反映了掷骰子的规比较复杂随机结果发生的概率值,这反映了掷骰子的规律性。律性。38统计方法体系统计方法体系39统计方法之一类:统计方法之一类:描述统计描述统计(descriptive statistics)1.内容内容n搜集数据n整理数据n展示数据n描述性分析2.目的目的n描述数据特征n找出数据的基本规律0 0 0252525505050Q1Q1Q1Q2Q2Q2Q3Q3Q3Q4Q4Q4¥x x x=30 =30 =30 s s s2 22=105=105=10540统计方
34、法之另一类统计方法之另一类推断统计推断统计(inferential statistics)1.内容内容参数估计假设检验2.目的目的对总体特征作出推断样样样样本本本本总体总体总体总体41描述统计与推断统计的关系描述统计与推断统计的关系反映客观现反映客观现反映客观现反映客观现象的数据象的数据象的数据象的数据揭示总体内揭示总体内揭示总体内揭示总体内在的数量规在的数量规在的数量规在的数量规律性律性律性律性推断统计推断统计推断统计推断统计(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率(利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进行估计和
35、检验等)行估计和检验等)行估计和检验等)行估计和检验等)概率论概率论概率论概率论(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律(包括分布理论、大数定律和中心极限定理等)和中心极限定理等)和中心极限定理等)和中心极限定理等)描述统计描述统计描述统计描述统计(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整(统计数据的搜集、整理、显示和分析等)理、显示和分析等)理、显示和分析等)理、显示和分析等)总体数据总体数据样本数据样本数据42统计的应用领域统计的应用领域统计学统计学经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会
36、学社会学社会学社会学43统计的应用领域统计的应用领域actuarial work actuarial work(精算精算精算精算)agriculture agriculture(农业农业农业农业)animal science animal science(动物学动物学动物学动物学)anthropology anthropology(人类学人类学人类学人类学)archaeology archaeology(考古学考古学考古学考古学)auditing auditing(审计学审计学审计学审计学)crystallography crystallography(晶体学晶体学晶体学晶体学)demogra
37、phy demography(人口统计学人口统计学人口统计学人口统计学)dentistry dentistry(牙医学牙医学牙医学牙医学)ecology ecology(生态学生态学生态学生态学)econometrics econometrics(经济计量学经济计量学经济计量学经济计量学)education education(教育学教育学教育学教育学)election forecasting and projection election forecasting and projection(选举预测和策划选举预测和策划选举预测和策划选举预测和策划)engineering engineeri
38、ng(工程工程工程工程)epidemiology epidemiology(流行病学流行病学流行病学流行病学)finance finance(金融金融金融金融)fisheries research fisheries research(水产渔业研究水产渔业研究水产渔业研究水产渔业研究)gambling gambling(赌博赌博赌博赌博)genetics genetics(遗传学遗传学遗传学遗传学)geography geography(地理学地理学地理学地理学)geology geology(地质学地质学地质学地质学)historical historical research resear
39、ch(历历历历史史史史研研研研究究究究)human human genetics genetics(人人人人类类类类遗遗遗遗传传传传学学学学)44统计的应用领域统计的应用领域hydrology hydrology(水文学水文学水文学水文学)IndustryIndustry(工业工业工业工业)linguisticslinguistics(语言学语言学语言学语言学)literature literature(文学文学文学文学)manpower planningmanpower planning(劳动力计划劳动力计划劳动力计划劳动力计划)management sciencemanagement sc
40、ience(管理科学管理科学管理科学管理科学)marketing marketing(市场营销学市场营销学市场营销学市场营销学)medical diagnosismedical diagnosis(医学诊断医学诊断医学诊断医学诊断)meteorology meteorology(气象学气象学气象学气象学)military sciencemilitary science(军事科学军事科学军事科学军事科学)nuclear material safeguardsnuclear material safeguards(核材料安全管理核材料安全管理核材料安全管理核材料安全管理)ophthalmology
41、 ophthalmology(眼科学眼科学眼科学眼科学)pharmaceutics pharmaceutics(制药学制药学制药学制药学)physicsphysics(物理学物理学物理学物理学)political sciencepolitical science(政治学政治学政治学政治学)psychology psychology(心理学心理学心理学心理学)psychophysics psychophysics(心理物理学心理物理学心理物理学心理物理学)quality controlquality control(质量控制质量控制质量控制质量控制)religious studiesreligi
42、ous studies(宗教研究宗教研究宗教研究宗教研究)sociologysociology(社会学社会学社会学社会学)survey samplingsurvey sampling(调查抽样调查抽样调查抽样调查抽样)taxonomy taxonomy(分类学分类学分类学分类学)weather modification weather modification(气象改善气象改善气象改善气象改善)45历史上著名的统计学家历史上著名的统计学家 Jacob Bernoulli(Jacob Bernoulli(伯努利伯努利)(1654-1705)(1654-1705)Edmond Halley(Edm
43、ond Halley(哈雷哈雷)(1656-1742)(1656-1742)De De MoivreMoivre(棣美佛棣美佛)(1667-1754)(1667-1754)Thomas Thomas BayesBayes(贝叶斯贝叶斯)(1702-1761)(1702-1761)Leonhard Euler(Leonhard Euler(欧拉欧拉)(1707-1783)(1707-1783)Pierre Simon Laplace(Pierre Simon Laplace(拉普拉斯拉普拉斯)(1749-1827)(1749-1827)AdrienAdrien Marie Legendre(Ma
44、rie Legendre(勒让德勒让德)(1752-1833)(1752-1833)Thomas Robert Malthus(Thomas Robert Malthus(马尔萨斯马尔萨斯)(1766-1834)(1766-1834)Thomas Robert Thomas Robert Malthus Malthus(马尔萨斯马尔萨斯)Pierre Simon Laplace Pierre Simon Laplace(拉普拉斯拉普拉斯)Leonhard Euler Leonhard Euler(欧拉欧拉)46历史上著名的统计学家历史上著名的统计学家 Friedrich Gauss(Fried
45、rich Gauss(高斯高斯)(1777-1855)(1777-1855)Johann Johann GregorGregor Mendel(Mendel(孟德尔孟德尔)(1822-1884)(1822-1884)Karl Pearson(Karl Pearson(皮尔森皮尔森)(1857-1936)(1857-1936)Ronald Aylmer Fisher(Ronald Aylmer Fisher(费歇费歇)(1890-1962),)(1890-1962),JerzyJerzy NeymanNeyman(1894-1981)(1894-1981)EgonEgon Sharpe Pear
46、son(Sharpe Pearson(皮尔森皮尔森)(1895-1980)(1895-1980)William Feller(William Feller(费勒费勒)(1906-1970).)(1906-1970).Friedrich Gauss Friedrich Gauss(高斯高斯)Johann Gregor MendelJohann Gregor Mendel(孟德尔孟德尔)471.一、分类数据、顺序数据、数值型数据一、分类数据、顺序数据、数值型数据2.二、观测数据和实验数据二、观测数据和实验数据3.三、截面数据和时间序列数据三、截面数据和时间序列数据1.2 统计统计数据的类型数据的类
47、型48什么是统计数据?什么是统计数据?(data)1.对各类现象进行计量的结果对各类现象进行计量的结果 2.不不是是指指单单个个的的数数字字,而而是是由由多多个个数数据据构构成成的数据集合的数据集合 3.不不仅仅仅仅是是指指数数字字,它它可可以以是是数数字字的的,也也可可以是文字的以是文字的 4.从实质上说,数据是指某变量的具体取值。从实质上说,数据是指某变量的具体取值。5.当然,数据可以是文字、也可以是数字当然,数据可以是文字、也可以是数字49这里要明确变量与数据的区别与联系这里要明确变量与数据的区别与联系o变量(名):是表明某变量(名):是表明某事物某个特征的概念和事物某个特征的概念和名称
48、,且可以取不同的名称,且可以取不同的值。值。o例如例如,人的性别、物体,人的性别、物体颜色、学历、产品等级、颜色、学历、产品等级、婚姻状况、所属民族、婚姻状况、所属民族、年龄、身高、体重、收年龄、身高、体重、收入、肤色、国籍,入、肤色、国籍,等等等等变量的分类变量的分类名名名名义义义义变变变变量量量量顺顺顺顺序序序序变变变变量量量量数数数数值值值值变变变变量量量量50一、统计数据的分类一、统计数据的分类o统计数据的分类统计数据的分类o按计量层按计量层次次分分分分类类类类的的的的数数数数据据据据顺顺顺顺序序序序的的的的数数数数据据据据数数数数值值值值型型型型数数数数据据据据o按时间状按时间状况况
49、截截截截面面面面的的的的数数数数据据据据时时时时序序序序的的的的数数数数据据据据o按收集方按收集方法法观观观观察察察察的的的的数数数数据据据据试试试试验验验验的的的的数数数数据据据据51一、统计数据的分类一、统计数据的分类(按计量尺度的大小分类按计量尺度的大小分类)1.分类数据分类数据(categorical data)n对事物进行分类的结果对事物进行分类的结果n数据表现为类别,用文字来表述数据表现为类别,用文字来表述n例例如如,人人口口按按性性别别分分为为男男、女女两两类类;物物体体按按颜颜色色不不同同分分为红、黄、蓝;为红、黄、蓝;2.顺序数据顺序数据(rank data)n对事物类别顺序
50、的测度对事物类别顺序的测度n数据表现为类别,用文字来表述数据表现为类别,用文字来表述n例例如如,产产品品按按等等级级分分为为一一等等品品、二二等等品品、三三等等品品、次次品品等、学历、职称等、学历、职称 3.数值型数据数值型数据(metric data)n对事物的精确测度对事物的精确测度n结果表现为具体的数值结果表现为具体的数值n例例如如:身身高高为为175cm、168cm;年年龄龄为为21、20、19岁岁52二、统计数据的分类二、统计数据的分类 (按收集方法分按收集方法分)1.观测的数据观测的数据(observational data)n通过调查或观测而收集到的数据通过调查或观测而收集到的数