《数理统计的几个基本概念.pptx》由会员分享,可在线阅读,更多相关《数理统计的几个基本概念.pptx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计发展简史数理统计发展简史16621662年年 格朗特格朗特 关于死亡公报的自然和政治观察关于死亡公报的自然和政治观察(1 1)提出了)提出了“数据简约数据简约”的思想;的思想;(2 2)指出了数据的可信性问题;)指出了数据的可信性问题;(3 3)统计比率的稳定性概念;)统计比率的稳定性概念;(4 4)引进了生命表的概念。)引进了生命表的概念。创新思想:创新思想:第1页/共39页“贝叶斯提出了一种归纳推理的理论,以后被一些贝叶斯提出了一种归纳推理的理论,以后被一些统计学者发展为一种系统的统计推断方法,称为贝统计学者发展为一种系统的统计推断方法,称为贝叶斯方法叶斯方法 .”摘自摘自中国大百
2、科全书中国大百科全书贝叶斯(17021761)贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计 第2页/共39页 “他的思想深入数学、空间、大自然的奥秘他的思想深入数学、空间、大自然的奥秘.他推动了数学的进展直到下个世纪他推动了数学的进展直到下个世纪.”摘自慕尼黑博物馆高斯画像下的诗句摘自慕尼黑博物馆高斯画像下的诗句“高斯是世界上最伟大的数学家高斯是世界上最伟大的数学家.”拉普拉斯拉普拉斯高斯(1777-1855)第3页/共39页“高尔顿等人关于回归分析的先驱
3、性的工作,以及高尔顿等人关于回归分析的先驱性的工作,以及时间序列分析方面的一些工作,时间序列分析方面的一些工作,是数理统计学是数理统计学发展史中的重要事件发展史中的重要事件.”摘自摘自中国大百科全书中国大百科全书高尔顿(18221911)第4页/共39页现代统计学的奠基人,现代统计学的奠基人,公认为统计学之父。公认为统计学之父。皮尔逊(18571936)第5页/共39页“费希尔是使统计学成为一门有坚实理论基础费希尔是使统计学成为一门有坚实理论基础并获得广泛应用的主要统计学家之一并获得广泛应用的主要统计学家之一.”摘自摘自中国大百科全书中国大百科全书费希尔 (18901962)第6页/共39页“
4、内曼与皮尔逊在内曼与皮尔逊在1928192819381938年期间发表了一系年期间发表了一系列文章,建立了假设检验的一种严格的数学理论列文章,建立了假设检验的一种严格的数学理论.”摘自摘自中国大百科全书中国大百科全书内曼 (18941981)第7页/共39页“从1938年到1945年,许(宝騄)所发表的论文处在多元分析数学理论发展的前沿.许推进了矩阵论在统计理论中的作用,同时也证明了有关矩阵的一些新的定理.”安德逊许宝禄(19101970)“我不希望自己的文章登在有名的杂志上而出名,我希望杂志因为登了我的文章而出名。”第8页/共39页统计的应用领域统计的应用领域统计学经济学经济学管理学管理学医
5、学医学工程学工程学社会学社会学第9页/共39页actuarial workactuarial work (精算精算)agricultureagriculture (农业农业)animal scienceanimal science (动物学动物学)anthropologyanthropology (人类学人类学)archaeologyarchaeology (考古学考古学)auditingauditing (审计学审计学)crystallographycrystallography (晶晶体体学学)demographydemography (人人口口统统计计学学)dentistry denti
6、stry(牙医学牙医学)ecologyecology (生态学生态学)econometrics econometrics(经济计量学经济计量学)education education(教育学教育学)election forecasting and projectionelection forecasting and projection (选举预测和策划选举预测和策划)engineering engineering(工程工程)epidemiology epidemiology(流行病学流行病学)financefinance (金融金融)fisheries researchfisheries r
7、esearch (水产渔业研究水产渔业研究)gambling gambling(赌博赌博)geneticsgenetics (遗传学遗传学)geographygeography (地理学地理学)geologygeology (地质学地质学)historical historical researchresearch (历历史史研研究究)human human geneticsgenetics (人人类类遗遗传学传学)第10页/共39页hydrologyhydrology (水文学水文学)IndustryIndustry (工业工业)linguisticslinguistics (语言学语言学)
8、literature literature(文学文学)manpower planningmanpower planning (劳动力计划劳动力计划)management sciencemanagement science (管理科学管理科学)marketing marketing(市场营销学市场营销学)medical diagnosismedical diagnosis (医学诊医学诊断断)meteorology meteorology(气象学气象学)military sciencemilitary science (军事科学军事科学)nuclear material safeguardsnu
9、clear material safeguards (核材料安全管理核材料安全管理)ophthalmology ophthalmology(眼科学眼科学)pharmaceuticspharmaceutics (制药学制药学)physics physics(物理学物理学)political sciencepolitical science (政治学政治学)psychologypsychology (心理学心理学)psychophysicspsychophysics (心理物理心理物理学学)quality controlquality control (质量控制质量控制)religious stu
10、diesreligious studies (宗教研究宗教研究)sociologysociology (社会学社会学)survey samplingsurvey sampling (调查抽调查抽样样)taxonomy taxonomy(分类学分类学)weather modificationweather modification (气象气象改善改善)第11页/共39页第一节 数理统计的几个基本概念1 总体与样本总体与样本2 统计量统计量第12页/共39页1 总 体 与 样 本 第13页/共39页 一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象.1.1.总体(populatio
11、n)研究对象的全体称为总体,总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体中每个成员称为总体中每个成员称为个体个体,第14页/共39页因此在理论上可以把因此在理论上可以把总体总体与与概率分布概率分布等同起来等同起来.总体可以用随机变量及其分布来描述.在实际研究中,我们关心的是总体中的个体的某个或某些指标(如人的身高、灯泡的寿命,汽车的耗油量).第15页/共39页 例1 研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量 X 表示,或用其分布函数 F(x)表示.某批灯泡的寿命总体寿命 X 可用一概率(指数)分布来刻划第16页/共39页
12、类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,用若关心的数量指标是身高和体重,用 X 和和Y 分别表分别表示身高和体重,那么此总体就可用二维随机变量示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表示来表示.统计中,总体就是一个概率分布.第17页/共39页2.样本(sample)(1)定义定义 为了解总体的分布为了解总体的分布,从总体中随机地取从总体中随机地取 n 个有代表性的个体个有代表性的个体 X1,Xn ,称称 X1,Xn 为总为总体的体的一个样本一个样本;n 称为称为样本容
13、量样本容量.在实施抽样之后,得到在实施抽样之后,得到 n 个实数个实数 x1,xn,它们分别是它们分别是 X1,Xn 的观测值,称为的观测值,称为样本值,有样本值,有时简称样本时简称样本.第18页/共39页注注:样本的二重性样本的二重性1.样本是随机变量样本是随机变量:X1,X2,Xn2.样本是一组数值:x1,x2,xn第19页/共39页例.啤酒厂生产的瓶装啤酒规定净含量为 640 g,由于随机性,事实上不可能使得所有的啤酒净含量均达到标准.现从某厂生产的啤酒中随机地抽取 10 瓶测定其净含量,记为X1,X2,X10,具体结果如下:641 635 640 637 642 638 645 643
14、 639 640这是一容量为 10 的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量.第20页/共39页最常用的一种抽样叫作“简单随机抽样”,其特点:1.代表性代表性:X1,X2,Xn 中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2.独立性:X1,X2,Xn 是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本,它可以看成是n个相互独立且与总体同分布的随机变量X1,X2,Xn.(2)简单随机抽样 简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn 是取自某总体的样本”时,若不特别说明,就指简单随机样本.第21页/共39页=F(x1)F(
15、x2)F(xn)若总体 X 的分布函数为 F(x),则其简单随机样本(X1,X2,Xn)的联合分布函数为第22页/共39页 若总体 X 为离散型,分布列为其简单随机样本的联合概率分布列为其简单随机样本的联合概率分布列为 若总体 X 为连续型,分布密度为 p(x;),其简单随机样本的联合概率密度函数为以后统一称为概率函数.第23页/共39页例例1 设总体设总体 X B(1,p),设,设 X1,X2,X3 是来自总体是来自总体 X 的一个样本,的一个样本,(1)写出()写出(X1,X2,X3)的(联合)概率函数;)的(联合)概率函数;(2)求求X1+X2+X3 的概率分布。的概率分布。第24页/共
16、39页总体(理论分布)?样本 样本值 统计是从手中已有的资料 样本值,去推断总体的情况总体分布 F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁注:总体、样本、样本值的关系第25页/共39页2 统计量第26页/共39页定义定义 设设 X1,Xn 是来自总体是来自总体 X 的一个样本,若样的一个样本,若样本函数本函数 T=T(X1,Xn)不含任何未知参数,则称不含任何未知参数,则称 T 是一个是一个统计量统计量。统计量的分布称为统计量的分布称为抽样分布抽样分布。2.1 定义 第27页/共39页2.2.常用统计量1 样本
17、均值 1、定义:设 X1,X2,Xn 是取自某总体的样本,其算术平均值称为样本均值,即:它反映了总体均值的信息第28页/共39页 定理定理 1样本均值的分布 设 X1,X2,Xn 是来自某个总体 X 的样本,(1)若总体分布为 ,则(2)若总体分布未知或不是正态分布,但 则 的渐近分布为 。(大样本场合)第29页/共39页n 取不同值时样本均值的分布注注:第30页/共39页总体:总体:样本:考虑投掷样本:考虑投掷 n 次,次,X1,Xn 表示第表示第 i 次投掷情况,次投掷情况,样本均值:样本均值:样本值:投掷样本值:投掷 100 次后,得到正面的次数为次后,得到正面的次数为 51 次,次,样
18、本均值:样本均值:第31页/共39页2.2 样本方差1、定义:设 X1,X 2,Xn 是取自某总体的样本,则称为样本方差,其算术平方根 S 称为样本标准差。它反映了总体方差的信息第32页/共39页注:定义中的 n 是样本容量,称为偏差平方和,n-1称为自由度.即自由变动的 r.v.的个数.这是由于 在 确定后,n 个偏差 中只有n-1个可以自由变动.第33页/共39页2.3 修正样本方差1、定义:设 X1,X 2,Xn 是取自某总体的样本,则称为样本方差,其算术平方根 S*称为修正样本标准差。它反映了总体方差的信息第34页/共39页 定理定理 2设 X1,X 2,Xn 是取自某总体 X 的样本,且 X 具有二阶矩,即则有它反映了总体方差的信息第35页/共39页思考题若总体四阶矩存在,考虑第36页/共39页2.4 样本矩它反映了总体 k 阶原点矩的信息为样本 k 阶原点矩.k=1,2,定义:设 X1,X2,Xn 是取自某总体 X 的样本,称统计量第37页/共39页2.4 样本矩为样本 k 阶中心矩.它反映了总体 k 阶中心矩的信息称统计量 k=2,3,第38页/共39页感谢您的观看!第39页/共39页