统计学复习大纲本科生.pptx

上传人:莉*** 文档编号:90149888 上传时间:2023-05-13 格式:PPTX 页数:48 大小:457.03KB
返回 下载 相关 举报
统计学复习大纲本科生.pptx_第1页
第1页 / 共48页
统计学复习大纲本科生.pptx_第2页
第2页 / 共48页
点击查看更多>>
资源描述

《统计学复习大纲本科生.pptx》由会员分享,可在线阅读,更多相关《统计学复习大纲本科生.pptx(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1统计学复习大纲本科生统计学复习大纲本科生第一章第一章 统计及统计数据统计及统计数据n n统计学:统计学:统计学:统计学:收集、处理、分析、解释数据并从数收集、处理、分析、解释数据并从数收集、处理、分析、解释数据并从数收集、处理、分析、解释数据并从数据中得出结论的科学据中得出结论的科学据中得出结论的科学据中得出结论的科学1.1.描述统计:研究数据收集、整理和描述的统计描述统计:研究数据收集、整理和描述的统计描述统计:研究数据收集、整理和描述的统计描述统计:研究数据收集、整理和描述的统计学方法学方法学方法学方法 2.2.推断统计:研究如何利用样本数据来推断总体推断统计:研究如何利用样本数据

2、来推断总体推断统计:研究如何利用样本数据来推断总体推断统计:研究如何利用样本数据来推断总体特征的统计学方法特征的统计学方法特征的统计学方法特征的统计学方法n n变量、变量的分类:变量、变量的分类:变量、变量的分类:变量、变量的分类:数值变量、分类变量和顺序变量数值变量、分类变量和顺序变量数值变量、分类变量和顺序变量数值变量、分类变量和顺序变量n n抽样方法:抽样方法:抽样方法:抽样方法:简单随机抽样,分层抽样,系统抽样,整群简单随机抽样,分层抽样,系统抽样,整群简单随机抽样,分层抽样,系统抽样,整群简单随机抽样,分层抽样,系统抽样,整群抽样。抽样。抽样。抽样。第1页/共48页第二章第二章 数据

3、的图表表示数据的图表表示n n定性数据的图表表示:定性数据的图表表示:定性数据的图表表示:定性数据的图表表示:频数分布表,条形图,帕累托图,饼图,环形图。频数分布表,条形图,帕累托图,饼图,环形图。频数分布表,条形图,帕累托图,饼图,环形图。频数分布表,条形图,帕累托图,饼图,环形图。n n定量数据的图表表示:定量数据的图表表示:定量数据的图表表示:定量数据的图表表示:频数分布表,直方图,茎叶图,箱线图,散点图,雷达图频数分布表,直方图,茎叶图,箱线图,散点图,雷达图频数分布表,直方图,茎叶图,箱线图,散点图,雷达图频数分布表,直方图,茎叶图,箱线图,散点图,雷达图第2页/共48页第第 三章三

4、章 用统计量描述数据用统计量描述数据n n水平的度量:平均数、中位数、分位数、众数水平的度量:平均数、中位数、分位数、众数水平的度量:平均数、中位数、分位数、众数水平的度量:平均数、中位数、分位数、众数n n差异的度量:极差、四分位差、方差(样本方差,总体方差)、差异的度量:极差、四分位差、方差(样本方差,总体方差)、差异的度量:极差、四分位差、方差(样本方差,总体方差)、差异的度量:极差、四分位差、方差(样本方差,总体方差)、标准差、离散系数标准差、离散系数标准差、离散系数标准差、离散系数第3页/共48页第四章第四章 概率分布概率分布n n概率概率概率概率:对事件发生的可能性大小的度量对事件

5、发生的可能性大小的度量对事件发生的可能性大小的度量对事件发生的可能性大小的度量n n离散型概率分布:离散型概率分布:离散型概率分布:离散型概率分布:二项分布二项分布二项分布二项分布:一次试验只有两个可能结果,即一次试验只有两个可能结果,即一次试验只有两个可能结果,即一次试验只有两个可能结果,即“成功成功成功成功”和和和和“失失失失败败败败”一次试验一次试验一次试验一次试验“成功成功成功成功”的概率为的概率为的概率为的概率为p p,失败的概率为,失败的概率为,失败的概率为,失败的概率为q q=1-=1-p p,且概率且概率且概率且概率p p对每次试验都是相同的对每次试验都是相同的对每次试验都是相

6、同的对每次试验都是相同的 ,试验是相互独立的,并试验是相互独立的,并试验是相互独立的,并试验是相互独立的,并可以重复进行可以重复进行可以重复进行可以重复进行n n次次次次 。重重重重复复复复进行进行进行进行 n n 次试验,出现次试验,出现次试验,出现次试验,出现“成功成功成功成功”的的的的次数的概率分布称为二项分布,记为次数的概率分布称为二项分布,记为次数的概率分布称为二项分布,记为次数的概率分布称为二项分布,记为X X B B(n n,p p)。第4页/共48页n n 泊松分布:泊松分布:n n连续型概率分布:正态分布连续型概率分布:正态分布第四章第四章 概率分布概率分布第5页/共48页n

7、 nc c c c2 2-分布:分布:分布:分布:对于对于n n个标准正态随机变量个标准正态随机变量y y1 1,y y2 2,y yn n,则随机变量则随机变量 称为具有称为具有n n个自由度的个自由度的 2 2分分布,记为布,记为 2 20 0 由正态分布导出的几个重要分布:c2-分布,t-分布,F-分布第6页/共48页t t-分布分布分布分布1.提出者是William Gosset,也被称为学生分布(students t)2.t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 xxt 分布与标

8、准正态分布的比较t 分布标准正态分布t t不同自由度的t分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z若随机变量X N(0,1),Yc2(n),则第7页/共48页F分布分布1.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 称F为服从自由度n1和n2的F分布,记为F F F第8页/共48页第四章第四章 概率分布概率分布n n参数、统计量的概念参数、统计量的概念参数、统计量的概念参数、统计量的概念第9页/共48页第四章第四章 概率分布概率分布统计量的分布:统计量的分布:统计量的分布:统计量的

9、分布:n n 样本均值的分布:样本均值的分布:样本均值的分布:样本均值的分布:n n 样本比例的分布:样本比例的分布:样本比例的分布:样本比例的分布:n n 样本方差的分布:样本方差的分布:样本方差的分布:样本方差的分布:第10页/共48页中心极限定理中心极限定理(central limit theoremcentral limit theorem)从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布当样本容量足够大时(n 30),样本均值的抽样分布逐渐趋于正态分布一个任意分布的总体x x第11页/共48页n n大样本,

10、不管总体分布是否正态,总体方差大样本,不管总体分布是否正态,总体方差大样本,不管总体分布是否正态,总体方差大样本,不管总体分布是否正态,总体方差s s s s2 2 2 2已知,已知,已知,已知,大样本,不管总体分布是否正态,总体方差未知,样本均值的分布小样本,总体分布正态,总体方差已知,小样本,总体分布正态,总体方差未知,第12页/共48页n n 样本比例的分布:样本比例的分布:样本比例的分布:样本比例的分布:当样本容量很大时(当样本容量很大时(npnp(成功次数成功次数)和和n n(1-(1-p p)()(失败次失败次数数)均应该大于均应该大于1010),样本比例的抽样分布可,样本比例的抽

11、样分布可用正态分布近似,即用正态分布近似,即第13页/共48页第四章第四章 概率分布概率分布n n 样本方差的分布:样本方差的分布:样本方差的分布:样本方差的分布:对于来自正态总体的简单随机样本,则第14页/共48页第五章第五章 参数估计参数估计n n参数估计:用样本统计量去估计总体的参数参数估计:用样本统计量去估计总体的参数参数估计:用样本统计量去估计总体的参数参数估计:用样本统计量去估计总体的参数n n点估计:用样本的估计量的某个取值直接作为点估计:用样本的估计量的某个取值直接作为点估计:用样本的估计量的某个取值直接作为点估计:用样本的估计量的某个取值直接作为总体参数的估计值总体参数的估计

12、值总体参数的估计值总体参数的估计值n n区间估计:在点估计的基础上,给出总体参数区间估计:在点估计的基础上,给出总体参数区间估计:在点估计的基础上,给出总体参数区间估计:在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加估计的一个估计区间,该区间由样本统计量加估计的一个估计区间,该区间由样本统计量加估计的一个估计区间,该区间由样本统计量加减估计误差而得到减估计误差而得到减估计误差而得到减估计误差而得到n n评价估计量的标准:无偏、有效、一致评价估计量的标准:无偏、有效、一致评价估计量的标准:无偏、有效、一致评价估计量的标准:无偏、有效、一致n n置信水平:将构造置信区间的步

13、骤重复很多次,置信水平:将构造置信区间的步骤重复很多次,置信水平:将构造置信区间的步骤重复很多次,置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,置信区间包含总体参数真值的次数所占的比例,置信区间包含总体参数真值的次数所占的比例,置信区间包含总体参数真值的次数所占的比例,也称置信度也称置信度也称置信度也称置信度 第15页/共48页 -1.96-1.96 x x95%95%构造m区间估计的原理:+1.96+1.96 x x构造的m估计区间为:称为置信水平。称为95%置信水平下的置信区间第16页/共48页Z Z/21 1-0 0区间估计的原理-Z-Z/2/2/2

14、Z=Z=构造的m的(1-置信水平下的置信区间为:由第17页/共48页第五章第五章 参数估计参数估计n n一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计第18页/共48页总体均值的区间估计总体均值的区间估计总体均值的区间估计总体均值的区间估计1.1.总体均值在置信水平下的置信区间可一般性地表达为总体均值在置信水平下的置信区间可一般性地表达为 注:具体分位数为多少,要看样本均值服从的分布。此时要考虑以下注:具体分位数为多少,要看样本均值服从的分布。此时要考虑以下三个方面:大样本三个方面:大样本/小样本;总体是否正态;总体方差是否已知。小样本;总体是否正态;总体方

15、差是否已知。样本均值分位数值样本均值的标准误差第19页/共48页总体比例的区间估计总体比例的区间估计n n1.1.假定条件假定条件n n总体服从二项分布;总体服从二项分布;npnp(成功次数成功次数)和和n n(1-(1-p p)()(失败失败次数次数)均应该大于均应该大于10(10(也有些书上说大于也有些书上说大于5)5)n n使用正态分布统计量使用正态分布统计量 z z总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为样本比例分位数值样本比例的标准误差2.2.由由第20页/共48页总体方差的区间估计总体方差的区间估计(总体服从正态

16、分布)(总体服从正态分布)(总体服从正态分布)(总体服从正态分布)n n1.1.估计一个总体的方差或标准差估计一个总体的方差或标准差n n2.2.总体方差总体方差 2 2 的点估计量为的点估计量为s s2 2,且且 总体方差在总体方差在1-1-置信水平下的置信区间为置信水平下的置信区间为3.3.3.由由由 1-1-1-1-1-自由度为自由度为n n-1-1的的 第21页/共48页第五章第五章 参数估计参数估计样本量的确定样本量的确定n n 估计总体均值时样本量的确估计总体均值时样本量的确定定n n 估计总体比例时样本量的确估计总体比例时样本量的确定定其中:其中:其中:其中:第22页/共48页第

17、第 六六 章章 假设检验假设检验1.1.1.1.假设检验:先对总体的参数假设检验:先对总体的参数假设检验:先对总体的参数假设检验:先对总体的参数(或分布形式或分布形式或分布形式或分布形式)提出提出提出提出某种假设,然后利用样本信息判断假设是否成某种假设,然后利用样本信息判断假设是否成某种假设,然后利用样本信息判断假设是否成某种假设,然后利用样本信息判断假设是否成立的统计方法立的统计方法立的统计方法立的统计方法2.2.2.2.原假设:又称原假设:又称原假设:又称原假设:又称“0 0 0 0假设假设假设假设”,研究者想收集证据,研究者想收集证据,研究者想收集证据,研究者想收集证据予以反对的假设,用

18、予以反对的假设,用予以反对的假设,用予以反对的假设,用H H H H0 0 0 0表示。所表达的含义总表示。所表达的含义总表示。所表达的含义总表示。所表达的含义总是指参数没有变化或变量之间没有关系是指参数没有变化或变量之间没有关系是指参数没有变化或变量之间没有关系是指参数没有变化或变量之间没有关系 3.3.3.3.备备备备择择择择假假假假设设设设:也也也也称称称称“研研研研究究究究假假假假设设设设”,研研研研究究究究者者者者想想想想收收收收集集集集证证证证据据据据予予予予以以以以支支支支持持持持的的的的假假假假设设设设,用用用用H H H H1 1 1 1或或或或H H H Ha a a a表

19、表表表示示示示,所所所所表表表表达达达达的的的的含含含含义义义义是是是是总总总总体体体体参参参参数数数数发发发发生生生生了了了了变变变变化化化化或或或或变变变变量量量量之之之之间间间间有有有有某某某某种关系种关系种关系种关系第23页/共48页第第 六六 章章 假设检验假设检验1.1.假假假假设设设设检检检检验验验验逻逻逻逻辑辑辑辑上上上上运运运运用用用用反反反反证证证证法法法法,统统统统计计计计上上上上依依依依据据据据小小小小概概概概率原理率原理率原理率原理2.2.备备备备择择择择假假假假设设设设通通通通常常常常用用用用于于于于表表表表达达达达研研研研究究究究者者者者自自自自己己己己倾倾倾倾向

20、向向向于于于于支支支支持持持持的的的的看看看看法法法法,然然然然后后后后就就就就是是是是想想想想办办办办法法法法收收收收集集集集证证证证据据据据拒拒拒拒绝绝绝绝原原原原假假假假设设设设,以支持备择假设以支持备择假设以支持备择假设以支持备择假设 3.3.小小小小概概概概率率率率是是是是在在在在一一一一次次次次试试试试验验验验中中中中,一一一一个个个个几几几几乎乎乎乎不不不不可可可可能能能能发发发发生生生生的事件发生的概率(一般认为小于的事件发生的概率(一般认为小于的事件发生的概率(一般认为小于的事件发生的概率(一般认为小于0.050.05)在在在在一一一一次次次次试试试试验验验验中中中中小小小小

21、概概概概率率率率事事事事件件件件一一一一旦旦旦旦发发发发生生生生,我们就有理由拒绝原假设我们就有理由拒绝原假设我们就有理由拒绝原假设我们就有理由拒绝原假设第24页/共48页双侧检验与单侧检验双侧检验与单侧检验(假设的形式假设的形式假设的形式假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:m m =m m0 0H0:m m m m0 0H0:m m m m0 0备择假设备择假设H1:m m m m0 0H1:m m m m0 0以总体均值的检验为例第25页/共48页假设检验的步骤假设检验的步骤n n1.提出原假设与备择假设n n2.确定检验统计量n n3.确定显

22、著性水平n n4.用统计量的值或者P值做决策(此步骤需要知道统计量的分布,需要确定是双侧检验还是单侧检验)第26页/共48页双侧检验双侧检验 /2 2 /2 2 Z Z拒绝拒绝H H0 0拒绝拒绝H H0 00 00临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第27页/共48页左侧检验左侧检验 Z Z拒绝拒绝H H0 00 00临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值

23、值值第28页/共48页右侧检验右侧检验 Z Z拒绝拒绝H H0 00 00计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值P P P 值值值第29页/共48页第第 六六 章章 假设检验假设检验n n一个总体参数的检验n n 总体均值的检验n n 总体比例的检验n n 总体方差的检验第30页/共48页一个总体均值的检验一个总体均值的检验(作出判断作出判断作出判断作出判断)是否已知小小小样本量n大大大 是否已知否否否 t 检验否否否z 检验是是是z 检验 是是是z 检验第31页/共48页总体比例检验总体比例检验1.1.假定条件n n总体服从二项分布总体服从二项分布n n可用

24、正态分布来近似可用正态分布来近似(大样本大样本)2.2.检验的 z 统计量 0 0为假设的总体比例为假设的总体比例第32页/共48页总体方差的检验总体方差的检验(2 2检验检验检验检验)1.1.检验一个总体的方差或标准差2.2.假设总体近似服从正态分布3.3.使用 2分布4.4.检验统计量假设的总体方差假设的总体方差第33页/共48页两个总体均值之差的检验两个总体均值之差的检验(方法总结方法总结方法总结方法总结)第34页/共48页两类错误与显著性水平两类错误与显著性水平1.1.第第类错误类错误(错误错误)n n原假设为正确时拒绝原假设原假设为正确时拒绝原假设n n第第类错误的概率记为类错误的概

25、率记为,被称为显著性水平被称为显著性水平n n2.2.第第类错误类错误(错误错误)n n原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设n n第第类错误的概率记为类错误的概率记为 (Beta)(Beta)无误第类错误第类错误无误H0为真H1为真接受H0拒绝H0第35页/共48页第第 八章八章 一元线性回归一元线性回归uu相关关系相关关系uu用散点图描述相关关系用散点图描述相关关系uu用相关系数度量关系强度用相关系数度量关系强度第36页/共48页 回归分析:回归分析:回归分析:回归分析:1.1.重点考察一个特定的变量重点考察一个特定的变量(因变量因变量),而把其他变量,而把其他变量(自变量自

26、变量)看作看作是影响这一变量的因素,并通过适当的数学模型将变量间的关是影响这一变量的因素,并通过适当的数学模型将变量间的关系表达出来系表达出来2.2.利用样本数据建立模型的估计方程利用样本数据建立模型的估计方程3.3.对模型进行显著性检验对模型进行显著性检验4.4.进而通过一个或几个自变量的取值来估计或预测因变量的取值进而通过一个或几个自变量的取值来估计或预测因变量的取值第37页/共48页第第 八章八章 一元线性回归一元线性回归n n一元线性回归最小二乘估计第38页/共48页Karl Gauss的最小化图的最小化图(xi,yi)(x1,y1)(x2,y2)(xn,yn)x xy y第39页/共

27、48页Karl Gauss的最小化图的最小化图(xi,yi)(x1,y1)(x2,y2)(xn,yn)x xy y第40页/共48页参数的最小二乘估计参数的最小二乘估计(和和和和 的计算公式的计算公式的计算公式的计算公式)根据最小二乘法,可得求解 和 的公式如下第41页/共48页误差分解图误差分解图x xy yy y第42页/共48页误差平方和的分解误差平方和的分解(三个平方和的意义三个平方和的意义三个平方和的意义三个平方和的意义)1.1.总平方和总平方和(SSTSSTtotal sum of squares)total sum of squares)n n反映因变量的反映因变量的 n n 个

28、观察值与其均值的总误差个观察值与其均值的总误差2.2.回归平方和回归平方和(SSRSSRsum of squares of regression)sum of squares of regression)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x x 与与 y y 之之间间的的线线性性关关系系引引起起的的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.3.残差平方和残差平方和(SSESSEsum of squares of error)sum of squares of e

29、rror)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称称为不可解释的平方和或剩余平方和为不可解释的平方和或剩余平方和第43页/共48页判定系数判定系数R2 (coefficient of determinationcoefficient of determination)1.1.回归平方和回归平方和占总误差平方和的比例占总误差平方和的比例2.反映回归直线的拟合程度,是度量拟合优度的统计量3.取值范围在 0,1 之间4.R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差5.决定系数平方根等于相关系数第44页/共48页第十章第十章

30、 时间序列时间序列n n时间序列:时间序列:按时间顺序记录的一组数据n n时间序列的成分:趋势、季节变动、随机性时间序列的成分:趋势、季节变动、随机性 n n平稳序列用平稳序列用平滑法预测(简单平均法、移动平均法、指数平滑平滑法预测(简单平均法、移动平均法、指数平滑法)法)n n趋势预测方法:线性趋势推测趋势预测方法:线性趋势推测n n多成分序列的预测:分解预测多成分序列的预测:分解预测第45页/共48页时间序列预测的程序时间序列预测的程序1.确定时间序列所包含的成分2.找出适合此类时间序列的预测方法,并对可能的预测方法进行评估,以确定最佳预测方案3.利用最佳预测方案进行预测 第46页/共48页计算季节指数计算季节指数n n1.计算各季节的移动平均数n n2.计算中心化移动平均数n n3.计算实际值与中心化移动平均数的比n n4.计算各个季节的季节指数n n5.调整,使得四个季节指数的平均数为1.第47页/共48页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁