《统计概念汇总.doc》由会员分享,可在线阅读,更多相关《统计概念汇总.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计概念汇总总体、个体:在统计学中,将我们研究的问题所涉及的对象的全体称为总体,而把总体中的每个成员称为个体。样本、样本容量:样本是总体中所抽取的一局部个体,而样本容量是指样本中个体的数目。 简单随机抽样:设一个总体的个数为.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.这样抽取的样本,叫做简单随机样本.系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个局部,然后按事先定出的规那么,从每一局部抽取一个个体,得到所需要的样本.这种抽样称为系统抽样.分层抽样:当总体是由差异明显的几局部组成时,常将总体分成几局部,然后按照各局部所
2、占得比进展抽样,这种抽样叫分层抽样。三种抽样的根本步骤:1.简单随机抽样:抽签法与随机数表法抽签法根本步骤:将总体中的个体编号;制签;在箱子中搅匀签条;抽取.随机数表法根本步骤:将总体中的个体编号;利用随机数表按规那么取数;汇总.2.系统抽样的步骤:将总体中的个体随机编号;将编号分段;在第1段中用简单随机抽样确定起始的个体编号;按照预先研究的规那么抽样.注意:有时候先剔除一局部个体(不整除)分层;按照比例确定每层抽取的人数;各层抽样;方法可以是简单随机抽样也可以是系统抽样集合成样本.总体分布的估计 :由于总体分布通常不易知道,往往用样本的频率分布估计总体分布,样本的容量越大,估计越准确。编制频
3、率分布表的方法步骤:求极差;决定组距与组数;决定分点,将数据分组;登记频数,计算频率,列出频率分布表.频率分布条形图 当总体中个体取不同数值很少时步骤列频率分布表,画条形图 频率分布直方图总体的个体取不同值较多甚至无限时步骤:计算最大小值;决定组距与组数,决定分点,列频率分布表,画直方图频率分布折线图:把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图.横轴上的左右端点没有实际意义;当样本容量越大,所分组数越多,折线图将越接近于总体密度曲线.总体密度曲线:在频率分布直方图中,样本容量越大,所分组数越多,在各组的频率就越接近总体在相应各组中取值得概率.设想样本容量无限增大,
4、分组的组距无限缩小,那么频率与分布直方图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线.正态分布:如果总体密度曲线是或近似的是函数的图像,其中实数实参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体,其分布叫正态分布,记作标准正态分布:正态分布函数中,当,此时记为.正态曲线的性质:1曲线在轴上方,与轴不相交.2曲线关于直线对称.3曲线的形状由确定. 越大,曲线越“矮胖,表示总体的分布越分散;越小,曲线越“瘦高,表示总体的分布越集中.假设检验:进展假设检验可归结为如下三步:1提出统计假设;2确定一次试验中的取值是否落入范围,承受假设;如果,由于这是小概率事件,就拒绝统计假设
5、.取值概率取值概率取值概率茎叶图:用中间的数字表示数据的十位数,两边的数字表示数据的个位数,茎按从小到大的顺序从上向以下出,共茎的叶一般按从大到小或从小到大的顺序同行列出,这样的图叫做茎叶图.优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图便于记录与表示.缺点:其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.中位数:将数据按从小到大或从大到小,处在中间的数据;但当数据为偶数个时,处于中间两个的数据的平均数为中位数;众数:在数据中出现次数最多的数。但众数不一定是唯一的。样本方差、样本标准差:设样本元素为,样本的平均数为,定义,
6、其中表示样本方差,表示样本标准差.相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种非确定性关系.散点图:具有相关关系的两个变量的数据所对应的图形,不是一条确定的直线,而是一些散乱得点,这个图形叫散点图.回归直线方程:设与组观测值的的、,.最小二乘法:为了刻画实际观察值与回归直线上相应点纵坐标的偏离程度,我们用离差的平方与,即作为总离差,并使之到达最小.这样,回归直线就是所有直线中取最小值的那一条.由于平方又叫二乘法,所以这种使“离差平方与为最小的方法,又叫最小二乘法.样本相关系数:对于变量与的一组观测值来说,我们把叫做变量与之间的样本相关系数简称相关系数,用它来衡量它们之间的线性相关程度.具有以下性质:,且越接近,线性相关程度越强;越接近那么称、完全线性相关.相关性检验的步骤:1作统计假设:与不具有相关性相关关系.2根据小概率与附表中查出的一个临界值.3根据样本相关系数计算公式算出,说明有的把握认为与之间具有线性相关关系.独立性检验:,当时,有的把握说事件与有关;当时,有的把握说事件与时,认为事件与是无关的.第 6 页