《统计与统计案例zst.pptx》由会员分享,可在线阅读,更多相关《统计与统计案例zst.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1统计与统计案例统计与统计案例zstn n1简单随机抽样n n从元素个数为N的总体中 抽取容量为n的样本,如果每一次抽取时总体中的各个个体有 被抽到,这种抽样方法叫做简单随机抽样常用的简单随机抽样方法有和 逐个不放回地相等的(机会)概率抽签法随机数表法第1页/共22页n n2系统抽样n n当总体中的个体数较多时,可将总体分成均衡若干部分,然后按照预先制定的规则,从每一部分 ,得到所需要的样本,这种抽样方法叫做系统抽样n n3分层抽样n n当总体由的几部分组成时,将总体中各个个体按某种特征分成若干个能充分反映总体情况的几部分,每一部分叫做层,在各层中按各部分在总体中 进行简单随机抽样,这种
2、抽样方法叫做 抽取一个个体差异明显所占的比例分层抽样第2页/共22页n n4三种抽样方法的区别与联系:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会均等从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成第3页/共22页n n1相关关系及回归分析n n(1)相关关系:自变量取值一定时,因变量的取值带有一定的两个变量之间的关系叫做相关关系n n(2)回归分析:在统计中,对具有相关关
3、系的两个变量进行 叫做回归分析回归分析是寻找相关关系中非确定关系的某种确定性随机性统计分析第4页/共22页n n2散点图:将n个数据点(xi,yi)(i1,2,3n)描在平面直角坐标系中,以表示具有相关关系的两个变量的叫做散点图n n3正相关与负相关:从散点图上看,点散布的位置在从的区域内,两个变量的这种相关关系称为正相关;点散布的位置在从的区域内,两个变量的相关关系称为负相关左下角到右上角左上角到右下角图形第5页/共22页第6页/共22页第7页/共22页n n5线性回归模型ybxae(e称为 ),因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化在统计中,我们也把自变
4、量x称为 ,因变量y称为随机误差解释变量预报变量第8页/共22页n n系的强弱当r0时,表示两个变量;当r时,认为两个变量有很强的线性相关关系正相关负相关几乎不存在0.75第9页/共22页n n7用相关指数R2来刻画回归的效果,其计算公式是n nR2R2的值越大,说明残差平方和越n n小,也就是说模型拟合的效果在线性回归模型中,R2表示解释变量对预报变量变化的 ,R2越接近于1,表示回归的效果越好越好贡献率第10页/共22页n n8变量的不同“值”表示个体所属的,这样的变量称为分类变量n n9列出两个分类变量的表,称为列联表n n一般地,假设有两个分类变量X和Y,它们的值域分别为(x1,x2)
5、和(y1,y2),其样本频数列联表如下表:y1y2总计x1ababx2cdcd总计acbdabcd称为22列联表不同类别频数第11页/共22页n n10利用随机变量K2来确定在可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其中K2 多大程度上第12页/共22页独立性检验独立性检验第13页/共22页(1)计算线性回归方程的斜率与截距公式计算线性回归方程的斜率与截距公式:(2)回归直线的线性回归方程回归直线的线性回归方程:第14页/共22页求解线性回归问题的步骤求解线性回归问题的步骤求解线性回归问题的步骤求解线性回归问题的步骤:1.1.列表列表 ,画画散点图散点图.2.2.计算
6、计算计算计算:3.3.代入公式求代入公式求代入公式求代入公式求 和和和和4.4.列出直线方程列出直线方程列出直线方程列出直线方程第15页/共22页1)1)如果如果P(P(m10.828)=0.00110.828)=0.001表示有表示有99.9%99.9%的把握认为的把握认为”X X与与Y Y”有关系有关系;2)2)如果如果P(m7.879)=0.005P(m7.879)=0.005表示有表示有99.5%99.5%的把握认为的把握认为”X X与与Y Y”有关系有关系;3)3)如果如果P(m6.635)=0.01P(m6.635)=0.01表示有表示有99%99%的把握认为的把握认为”X X与与
7、Y Y”有关系有关系;4)4)如果如果P(m5.024)=0.025P(m5.024)=0.025表示有表示有97.5%97.5%的把握认为的把握认为”X X与与Y Y”有关系有关系;5)5)如果如果P(m3.841)=0.05P(m3.841)=0.05表示有表示有95%95%的把握认为的把握认为”X X与与Y Y”有关系有关系;6)6)如果如果P(m2.706)=0.10P(m2.706)=0.10表示有表示有90%90%的把握认为的把握认为”X X与与Y Y”有关系有关系;7)7)如果如果P(mP(m2.706),2.706),就认为没有充分的证据显示就认为没有充分的证据显示”X X与与
8、Y Y”有关系有关系;y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d22列联表第16页/共22页n n1下表是某厂下表是某厂14月份用水量月份用水量(单位:百吨单位:百吨)的一组数据,的一组数据,n n由其散点图可知,用水量由其散点图可知,用水量y与月与月份份x之间有较好的线性相关关系,求之间有较好的线性相关关系,求y与与x的回归方程并预测的回归方程并预测5月份用水量。月份用水量。月份月份x1234用水量用水量y4.5432.52:在对人们休闲方式的一次调查中,共调查了:在对人
9、们休闲方式的一次调查中,共调查了124人,其中女性人,其中女性70人,男性人,男性54人女性中有人女性中有43人主要的休闲人主要的休闲方式是看电视,另外方式是看电视,另外27人的休闲方式是运动;男性中有人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外人主要的休闲方式是看电视,另外33人主要的休闲方式是人主要的休闲方式是运动运动(1)根据以上数据建立一个根据以上数据建立一个22列联表;列联表;(2)检验休闲方式是否与性别有关,可靠性有多大检验休闲方式是否与性别有关,可靠性有多大第17页/共22页第18页/共22页n n练习2:在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动n n(1)根据以上数据建立一个22列联表;n n(2)检验休闲方式是否与性别有关,可靠性有多大第19页/共22页n n解:(1)22列联表如下:休闲方式性别看电视运动合计女432770男213354合计6460124第20页/共22页n n(2)假设休闲方式与性别无关,则n n所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关第21页/共22页