《《社会统计学》形考四作业.docx》由会员分享,可在线阅读,更多相关《《社会统计学》形考四作业.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、社会统计学形考四一、单项选择题(每题2分,共20分)1.以下关于因变量与自变量的表述不正确的是(C )A.自变量的变化是以因变量的变化为前提B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量是引起其他变量变化的变量D.因变量的变化不以自变量的变化为前提2.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( C)A.5小时B.6小时C.5.5小时D.6.5小时3.以下关于条形图的表述,不正确的是(B )A.条形图中条形的宽度是固定的B.条形图的矩形通常是
2、紧密排列的C.条形图中条形的长度(或高度)表示各类别频数的多少D.条形图通常是适用于所有类型数4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第(C )组组别按年龄分组(岁)工作人员数(人)120246225291433034244353918540441264549187505414855596合计112A.第3组B.第4组C.第5组D.第6组5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生(A )的成绩考得更好。A.数学B.语文C.两门课程一样D.无法判断散6.在假设检验中
3、,不拒绝虚无假设意味着(D )A.虚无假设是肯定正确的B.虚无假设肯定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的7.根据一个样本均值求出的90%的置信区间表明(C )A.总体均值一定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内8.在回归方程中,若回归系数等于0,这表明(B )A.因变量y对自变量x的影响是不显著的 B.自变量x对因变量y的影响是不显著的C.因变量y对自变量x的影响是显著的D.自变量x对因变量y的影响是显著的9.中心极限定理认为不论总体分布是否服从正态分布,从均
4、值为、方差为2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为(C )、方差为(C )的正态分布。A.,2B./n ,2/nC.,2/nD./n,210.下列哪种情况不适合用方差分析(B )A.性别对收入的影响B.年龄对收入的影响C.专业对收入的影响D.行业对收入的影响二、名词解释(每题5分,共20分)11.整群抽样整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。12.Z值z值;是以平均数为参考点,以标准差为单位的描述原始数据在总体相对位置的量数,通过
5、计算z值将一般正态分布转换为标准正态分布。13.二维表二维表:二维表就是行李交叉的表格,将两个变量一个分行排放,一个分类排放,行列交叉处就是属于两个变量的不同类的数据。14.误差减少比例在预测变量y的值时,知道变量x的值时所减少的误差与总误差的比值称为误差减少比例。三、简答题(每题10分,共30分)15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的(5)上月网购次数答:(1)网络供应商的姓名:定性(2)每月的网络服务费:定量、连续变量(3)上网的目的:定性(4)上月网购次数:定
6、量、离散变量16.简述什么是简单回归分析?其作用是什么?答:(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特变量的影响,是进行估计的一种方法,侧重于考察变量之间的数量伴随关系。(2)作用:从已知数据出发,确定变量之间的数学关系式。对变量间的关系进行统计体验并从影响某一个变量中找出影响显著的变量。17.如何对配对样本进行t检验。答:配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的检验用于检验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行检验时,首先计算两个样本中每个对应变量之间的差值:然后再检验其差值的均值是否为零,如
7、果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。四、计算题(共30分)18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注: Z025=1.96.19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。.变差来源SSdfMSFSig.组间AC320F000组内6048DE总计B39答:A:960,B:7008,C:3,D:36,E:168,F:1.90变差来源SSDFMSFSIG组间96033201.90.000组内604836168-总计700839-