《统计复习.课程学习.pptx》由会员分享,可在线阅读,更多相关《统计复习.课程学习.pptx(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计统计(tngj)复习复习.第一页,共48页。随机抽样 1.在抽取样本(yngbn)中,考虑的最主要的原则是什么?样本(yngbn)的代表性:每个个体有同样的机会被抽中第2页/共48页第二页,共48页。随机抽样 2.本章介绍(jisho)的三种随机抽样方法,它们有什么联系与区别?它们各自的特点和适用范围是什么?第3页/共48页第三页,共48页。探究?探究?比较简单随机抽样、系统抽样、分比较简单随机抽样、系统抽样、分层抽样的优点层抽样的优点(yudin)(yudin)、缺点及、缺点及适用范围适用范围类类 别别 简简 单单随随 机机抽抽 样样 系系 统统抽抽 样样 分分 层层抽抽 样样(
2、1)抽抽样样过过程程中中每每个个个个体体被被抽抽到到的的可可能能性性相相等等(2)每)每次抽出个次抽出个体后不再体后不再将它放回,将它放回,即不放回即不放回抽样抽样 共同点共同点 各自特点各自特点 从总体中从总体中逐个抽取逐个抽取 将总体均分成将总体均分成几部分,按预几部分,按预先制定的规则先制定的规则在各部分抽取在各部分抽取 将总体分成将总体分成几层,分层几层,分层进行抽取进行抽取 联联 系系 在起始部在起始部分样时采分样时采用简随机用简随机抽样抽样 分层抽样分层抽样时采用简时采用简单随机抽单随机抽样或系统样或系统抽样抽样 适适 用范用范 围围 总体个总体个数较少数较少 总体个总体个数较多数
3、较多 总体由差总体由差异明显的异明显的几部分组几部分组成成 第4页/共48页第四页,共48页。例例1 1 1.1.从从 N N 个编号中抽取个编号中抽取 n n 个号码入样,用系统抽个号码入样,用系统抽样的方法样的方法(fngf)(fngf)抽样,则抽样的间隔为抽样,则抽样的间隔为_,每个个体入样的可能性为,每个个体入样的可能性为_。2.2.一个公司共有一个公司共有N N名员工,下设一些部门,要采用等名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取比例分层抽样的方法从全体员工中抽取(chu q)(chu q)样本样本容量为容量为n n的样本,已知某部门有的样本,已知某部门有m
4、m名员工,那么从该部门名员工,那么从该部门抽取抽取(chu q)(chu q)的员工人数是的员工人数是_。第5页/共48页第五页,共48页。用样本估计用样本估计(gj)总体总体n n用样本估计总体用样本估计总体(两种):两种):n n 一种一种(y zhn)是:用样是:用样本的频率分布估计总体的分布。本的频率分布估计总体的分布。n n 另一种另一种(y zhn)是:用是:用样本的数字特征(平均数标准差样本的数字特征(平均数标准差等)估计总体的数字特征。等)估计总体的数字特征。第6页/共48页第六页,共48页。用样本用样本(yngbn)的频率分布估计总的频率分布估计总体分布体分布一一 频率分布表
5、和频率分布直方图频率分布表和频率分布直方图频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线三三 茎叶图(茎叶图(stem-and-leaf display)第7页/共48页第七页,共48页。用样本估计(gj)总体 1.作样本(yngbn)频率分布直方图的步骤:(1 1)求极差;)求极差;(2 2)决定)决定(judng)(judng)组距与组数组距与组数;(;(组数极差组数极差/组距组距)(3 3)将数据分组;)将数据分组;(4 4)列频率分布表(分组,频数,频率);)列频率分布表(分组,频数,频率);(5 5)画频率分布直方图。)画频率分布直方图。第8页/共48页第八页,共48页。表
6、表21 100位居民的月均用水量位居民的月均用水量 (单位(单位:t )3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3
7、 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2第9页/共48页第九页,共48页。步骤:步骤:1.求极差(一组数据中最大值与最小值的求极差(一组数据中最大值与最小值的 差)。差)。4.30.2=4.1(t)2.决定组距与组数(样本容量不超过决定组距与组数(样本容量不超过100时,组数常时,组数常分成分成512组)。组)。3.将数据分组(将数据分组(9组)。组)。0,0.5),0.5,1)
8、,4,4.5)4.列频率分布表列频率分布表。5.画频率分布直方图画频率分布直方图。第10页/共48页第十页,共48页。表22 100位居民月均用水量的 频率分布表 分组 频数累计(li j)频数 频率 0,0.5)4 0.04 0.5,1)8 0.08 1,1.5)15 0.15 1.5,2)22 0.22 2,2.5)25 0.25 2.5,3)14 0.14 3,3.5)6 0.06 3.5,4)4 0.04 4,4.5)2 0.02 合计 100 1.00第11页/共48页第十一页,共48页。00.511.522.53 3.5 4 4.50.500.400.300.200.10频率频率/
9、组距组距月均用水量月均用水量/t注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和各长方形的面积总和(zngh)等于等于1。第12页/共48页第十二页,共48页。0.511.522.53 3.5 44.50.20频率频率/组距组距0月均用水量月均用水量/t0.500.400.300.10图图2.22 100位居民位居民(jmn)的月均用水量的频的月均用水量的频率分布折线图率分布折线图第13页/共48页第十三页,共48页。月均用水量月均用水量/t频率频率组距组距0ab总体密度曲线能够总体密度曲线能够(nnggu)很好的反映总体在各个范围很好的反映总体在各个
10、范围内的百分比,能构提供更准确的信息。尽管有些总体密度内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画曲线是客观存在的,但是很难象函数图象那样准确的地画出来。出来。?思考一下图中阴影部分的面积表示什么?思考一下图中阴影部分的面积表示什么?第14页/共48页第十四页,共48页。甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 注:中间的数字表示得分的十位注:中间的数字表示得分的十位(sh wi)数字。数字。旁边的数字分别表示两个人得分的个位数。旁边的数字分别表示两
11、个人得分的个位数。第15页/共48页第十五页,共48页。小结小结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失一些丢失一些直方图直方图 2)直观地表明分布地)直观地表明分布地 情况情况 信息信息 1)无信息损失)无信息损失 只能处理样本只能处理样本 茎页图茎页图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据第16页/共48页第十六页,共48页。2.通过对全国(qun u)所有高一年级学生的身高进行随机抽样,获得的样本频率分布与相应的总体分布有差别吗?样本频率(pnl)分布总体(zngt)分布当样本容量增大当样本容量增大组
12、距无限缩小组距无限缩小频率分布折线图总体密度曲线用样本估计总体第17页/共48页第十七页,共48页。例例2 2 对于样本频率分布折线图与总体密度曲线对于样本频率分布折线图与总体密度曲线(qxin)(qxin)的关系,下列说法正确的是的关系,下列说法正确的是 ()A.A.频率分布折线图与总体密度曲线频率分布折线图与总体密度曲线(qxin)(qxin)无无关;关;B.B.频率分布折线图就是总体密度曲线频率分布折线图就是总体密度曲线(qxin)(qxin);C.C.样本容量很大的频率分布折线图就是总体密样本容量很大的频率分布折线图就是总体密度曲线度曲线(qxin)(qxin);D.D.如果样本容量无
13、限增大,分组组距无限缩小,如果样本容量无限增大,分组组距无限缩小,那么频率分布折线图就会无限接近于一条光滑那么频率分布折线图就会无限接近于一条光滑曲线曲线(qxin)(qxin)总体密度曲线总体密度曲线(qxin)(qxin)。第18页/共48页第十八页,共48页。3.平均数平均数 设样本数据为x1,x2,x3,xn 那么样本平均数为X=(x1+x2+xn)/n 平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处(su ch)的水平第19页/共48页第十九页,共48页。1.众数众数(zhn sh)在一组数据中,出现次数最多的数据叫做这一组数据的众数。在一组数据中,出现次数最多的数据叫做
14、这一组数据的众数。在频率分布直方图中,就是最高矩形的中点在频率分布直方图中,就是最高矩形的中点(zhn(zhn di di n)n)所对应的数据。所对应的数据。注:注:若有几个两个或几个数据出现的最多,且出现的次数一样,这些数据若有几个两个或几个数据出现的最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数。则认为这组数据没有众数。样本数据不一定有众数,有众数则不一定只有一个样本数据不一定有众数,有众数则不一定只有一个第20页/共48页第二十页,共48页。从频率分布直方图中
15、可以看出从频率分布直方图中可以看出(kn ch)月均用水量的众数是月均用水量的众数是2.25t(最高矩形的中点)(最高矩形的中点)第21页/共48页第二十一页,共48页。2、中位数中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。而在频率分布直方图中的中位数左右两侧的直方图面积(min j)应该相等,因而可以确定估计其近似值。第22页/共48页第二十二页,共48页。二、思考二、思考(sko):如何从频率分布直方图中估:如何从频率分布直方图中估计中位数?计中位数?第23页/共48页第二十三页,共48页。3.平均数平均数 设样本数据为x1,x2
16、,x3,xn 那么样本平均数为X=(x1+x2+xn)/n 平均数描述了数据的平均水平,定量地反映了数据的集中(jzhng)趋势所处的水平第24页/共48页第二十四页,共48页。二、用样本二、用样本(yngbn)的标准差估计总体的标准差估计总体的标准差的标准差 数据的离散程度数据的离散程度(chngd)可以用极差、可以用极差、方差或标准差来描述。方差或标准差来描述。为了表示样本数据的单位表示的波动为了表示样本数据的单位表示的波动幅度,通常要求出样本方差幅度,通常要求出样本方差(fn ch)或或者它的算术平方根者它的算术平方根.第25页/共48页第二十五页,共48页。(1)方差方差:设在一组数据
17、,:设在一组数据,x1,x2,xn中,各数据与它们的平均数中,各数据与它们的平均数x的差的的差的平方分别是平方分别是 来衡量这组数据的波动大小来衡量这组数据的波动大小(dxio),并,并把它叫做这组数据的方差,一组数据方差把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。越大,则这组数据波动越大。那么那么(n me)我们用它们的平均数,即我们用它们的平均数,即第26页/共48页第二十六页,共48页。(2)标准差:我们把数据)标准差:我们把数据(shj)的方的方差的算术平方根叫做这组数据差的算术平方根叫做这组数据(shj)的的标准差,它也是一个用来衡量一组数据标准差,它也是一个用来衡
18、量一组数据(shj)的波动大小的重要的量。的波动大小的重要的量。计算计算(j sun)标准差的算法:标准差的算法:第27页/共48页第二十七页,共48页。例例3.计算计算(j sun)数据数据89,93,88,91,94,90,88,87的方差和标准差。(标准的方差和标准差。(标准差结果精确到差结果精确到0.1)解:解:.所以这组数据所以这组数据(shj)的方差为的方差为5.5,标准,标准差为差为2.3.第28页/共48页第二十八页,共48页。例例4.从甲、乙两名学生中选拔一人乘积射从甲、乙两名学生中选拔一人乘积射击比赛,对他们的射击水平进行测试,两击比赛,对他们的射击水平进行测试,两人在相同
19、的条件下各射击人在相同的条件下各射击10次,命中环数次,命中环数如下如下甲甲7,8,6,8,6,5,8,10,7,4;乙乙9,5,7,8,7,6,8,6,7,7.(1)计算甲、乙两人射击命中环数的平均)计算甲、乙两人射击命中环数的平均数和标准差;数和标准差;(2)比较两人的成绩,然后)比较两人的成绩,然后(rnhu)决决定选择哪一人参赛定选择哪一人参赛.第29页/共48页第二十九页,共48页。解解:(:(1)计算得)计算得x甲甲=7,x乙乙=7;s甲甲=1.73,s乙乙=1.10.(2)由()由(1)知,甲、乙两人平均成绩相)知,甲、乙两人平均成绩相等,但等,但s乙乙s甲,这表明乙的成绩比甲的
20、成甲,这表明乙的成绩比甲的成绩稳定绩稳定(wndng)一些,从成绩的稳定一些,从成绩的稳定(wndng)性考虑,可以选乙参赛。性考虑,可以选乙参赛。第30页/共48页第三十页,共48页。的平均数为的平均数为 ,(2)新数据)新数据方差为方差为 ,方差仍为,方差仍为 (1)新数据)新数据的平均数为的平均数为,方差为,方差为 的平均数为的平均数为(3)新数据)新数据如果数据如果数据的平均数为的平均数为 ,方差为方差为,则,则(4)方差)方差(fn ch)的的运算性质:运算性质:第31页/共48页第三十一页,共48页。练习练习(linx):(3)若)若k1,k2,k8的方差的方差(fn ch)为为3
21、,则,则2(k13),2(k23),2(k83)的方差的方差(fn ch)为为_43212第32页/共48页第三十二页,共48页。AB第33页/共48页第三十三页,共48页。(7)在一次歌手大奖赛上,七位评委为歌手打出的)在一次歌手大奖赛上,七位评委为歌手打出的分数分数(fnsh)如下:如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为值和方差分别为_9.5,0.016五、回顾五、回顾(hug)小结:小结:1用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数字
22、特征分两类:用样本平均数估计总体平均数。用样本平均数估计总体平均数。用样本方差、标准差估计总体方差、标准差。样本容用样本方差、标准差估计总体方差、标准差。样本容量越大,估计就越精确。量越大,估计就越精确。2方差、标准差描述一组数据围绕平均数波动的大方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化小,反映了一组数据变化(binhu)的幅度的幅度第34页/共48页第三十四页,共48页。例例3 3 已知有一样已知有一样(yyng)(yyng)本本x1,x2,xn,x1,x2,xn,其标准其标准差差S S8.58.5,另一样,另一样(yyng)(yyng)本本3x1+5,3x2+5,3
23、xn+53x1+5,3x2+5,3xn+5的标准差的标准差SS_。例例4 4 16 16种食品所含的热量值如下:种食品所含的热量值如下:123 123 164 430 190 175 236 123 123 164 430 190 175 236 320 250 280 160 150 210 123 320 250 280 160 150 210 123(1 1)求数据的中位数与平均数;)求数据的中位数与平均数;(2 2)用这两种数字特征)用这两种数字特征(tzhng)(tzhng)中的哪一种中的哪一种来描述这个数据集更合适?来描述这个数据集更合适?第35页/共48页第三十五页,共48页。变
24、量(binling)的相关关系例例6 6 为了考察两个变量为了考察两个变量x x和和y y之间的线性相关性,甲、之间的线性相关性,甲、乙两位同学各自独立作了乙两位同学各自独立作了1010次和次和1515次试验,并且次试验,并且利用线性回归方法,求得回归直线分别为利用线性回归方法,求得回归直线分别为l1l1、l2,l2,已知两人得的试验数据中,变量已知两人得的试验数据中,变量x x和和y y的数据的平的数据的平均值都相等均值都相等(xingdng)(xingdng),且分别都是,且分别都是s s、t t,那么,那么下列说法正确的是(下列说法正确的是()A.A.两直线一定有公共点(两直线一定有公共
25、点(s s,t t););B.B.两直线相交,但交点不一定是(两直线相交,但交点不一定是(s s,t t););C.C.必有两直线平行;必有两直线平行;D.D.两直线必定重合。两直线必定重合。第36页/共48页第三十六页,共48页。1、变量之间除了、变量之间除了(ch le)函数关系外,还有相关关系。函数关系外,还有相关关系。相同点:均是指两个变量相同点:均是指两个变量(binling)的关系的关系不同点:函数关系不同点:函数关系(gun x)是一种确定的是一种确定的关系关系(gun x)。而而 相关关系相关关系(gun x)是一种非确定关系是一种非确定关系(gun x).一、变量之间的相关关
26、系一、变量之间的相关关系相关关系和函数关系的区别相关关系和函数关系的区别第37页/共48页第三十七页,共48页。年龄 23273941454950脂肪 9.517.8 21.2 25.9 27.5 26.3 28.2年龄 53545657586061脂肪 29.630.2 31.4 30.8 33.5 35.2 34.6人体(rnt)的脂肪百分比和年龄第38页/共48页第三十八页,共48页。第39页/共48页第三十九页,共48页。1、散点图:将变量所对应(duyng)的点描出来,这些点组成 了变量之间的图就叫“散点图”正相关:散布(snb)在从左下角到右上角的区域。负相关:散布(snb)在左上
27、角到右下角的区域。第40页/共48页第四十页,共48页。回归回归(hugu)(hugu)直线:观察散点图的特征,直线:观察散点图的特征,如果各点大致分布在一条直线的附如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相近,就称两个变量之间具有线性相关的关系(即曲线拟合成直线),关的关系(即曲线拟合成直线),这条直线叫做回归这条直线叫做回归(hugu)(hugu)直线。直线。二回归直线二回归直线(zhxin)方程方程第41页/共48页第四十一页,共48页。一、相关关系一、相关关系(gun x)的判断的判断例例1:5个学生个学生(xu sheng)的数学和物理成绩如下表:的数学和物理成绩如
28、下表:ABCDE数学8075706560物理7066686462画出散点图,并判断画出散点图,并判断(pndun)它们是否有相关关系。它们是否有相关关系。解:解:数学成绩数学成绩由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。第42页/共48页第四十二页,共48页。二、求线性回归方程二、求线性回归方程例例2:观察两相关:观察两相关(xinggun)变量得如下表:变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量求两变量(binling)间的回归方程间的回归方程解解1:列表列表(li bio):i12345678910-1-2-3-
29、4-553421-9-7-5-3-1153799141512551512149计算得计算得:第43页/共48页第四十三页,共48页。求线性回归直线方程的步骤:求线性回归直线方程的步骤:第一步:列表达式:第一步:列表达式:第二步:计算第二步:计算 第三步:代入公式计算第三步:代入公式计算b,a的值;的值;第四步:写出直线方程第四步:写出直线方程 y=bx+a 。第44页/共48页第四十四页,共48页。例:有一个同学家开了一个小卖部,他为了例:有一个同学家开了一个小卖部,他为了(wi le)研究气温对热研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温饮销售的影响,经过统计,得到
30、一个卖出的热饮杯数与当天气温的对比表:的对比表:摄氏温度摄氏温度 -5 0 4 7 12 15 19 23 27 31 36热饮热饮(ryn)杯数杯数 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一从散点图中发现气温与热饮销售杯数之间关系的一 般规律般规律(gul);(3)求回归方程;求回归方程;(4)如果某天的气温是如果某天的气温是 C,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。利用线性回归方程对总体进行估计利用线性回归方程对总体进行估计第45页/共48页第四十五页,共48页
31、。解解:(1)散点图散点图(2)气温气温(qwn)与热饮杯数成负相关与热饮杯数成负相关,即气温即气温(qwn)越高,越高,卖出去的热饮杯数越少。卖出去的热饮杯数越少。温度温度热饮杯数热饮杯数第46页/共48页第四十六页,共48页。(3)从散点图可以看出,这些从散点图可以看出,这些(zhxi)点大致分布在一条点大致分布在一条直线附近。直线附近。Y=-2.352x+147.767(4)当)当x=2时,时,y=143.063,因此,这天大约可以卖出因此,这天大约可以卖出143杯热饮。杯热饮。第47页/共48页第四十七页,共48页。感谢您的观看感谢您的观看(gunkn)!第48页/共48页第四十八页,共48页。