《最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318).doc》由会员分享,可在线阅读,更多相关《最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318).doc(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、最新国家开放大学电大本科社会统计学期末标准题库及答案试卷号:1318最新国家开放大学电大本科社会统计学期末标准题库及答案试卷号:1318考试说明:本人汇总了历年来该科所有的试题及答案,形成了一个完好的标准考试题库,对考生的复习和考试起着非常重要的作用,会给您节省大量的时间。内容包含:单项选择题、名词解释题、简答题、计算题。做考题时,利用本文档中的查找工具(Ctrl+F),把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有其他网核、机考及教学考一体化试题答案,敬请查看。一、单项选择题 1某班级有100名学生,为了理解学生消费程度,将所有学生按照学习成绩排序后,在前十名
2、学生中随机抽出成绩为第3名的学生,后面以10为间隔依次选出第13、23、33、43、53、63、73、83、93九名同学进展调查。这种调查方法属于( )。A简单随机抽样 B整群抽样 C分层抽样 D系统抽样 2以下关于因变量与自变量的表述不正确的选项是( )。A自变量是引起其他变量变化的变量 B因变量是由于其他变量的变化而导致自身发生变化的变量 C自变量的变化是以因变量的变化为前提 D因变量的变化不以自变量的变化为前提 3某地区20_1- 2022年人口总量单位:万人分别为98,102,103,106,108,109,110,111,114,115,以下哪种图形最合适描绘这些数据?( ) A茎叶
3、图 B环形图 C饼图 D线图 4以下关于条形图的表述,不正确的选项是( )。A条形图中条形的宽度是固定的 B条形图中条形的长度或高度表示各类别频数的多少 C条形图的矩形通常是严密排列的 D条形图通常是适用于所有类型数据 5某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。A数学 B语文 c两门课程一样 D无法判断 6有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性程度表述正确的选项是( )。A甲的离
4、散程度小,稳定性程度低 B甲的离散程度小,稳定性程度高 C乙的离散程度小,稳定性程度低 D乙的离散程度大,稳定性程度高 7下表是某单位工作人员年龄分布表,该组数据的中位数出如今第( )组。A第3组 B第4组 C第5组 D第6组 8对于线性回归,在因变量的总离差平方和中,假如残差平方和所占比例越大,那么两个变量之间( )。A相关程度越大 B相关程度越小 C完全相关 D完全不相关 9回归平方和(SSR)反映了y的总变差中( )。A.由于_与y之间的线性关系引起的y的变化局部 B除了_对y的现有影响之外的其他因素对y变差的影响 C由于_与y之间的非线性关系引起的y的变化局部 D由于_与y之间的函数关
5、系引起的y的变化局部 10以下哪种情况不合适用方差分析p ?( ) A性别对收入的影响 B专业对收入的影响 C年龄对收入的影响 D行业对收入的影响 11.某班级有100名学生,为理解学生消费程度,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进展调查。这种抽样方法属于( )。A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样 12.以下关于因变量与自变量的表述不正确的选项是( )。A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化
6、是以因变量的变化为前提 D.因变量的变化不以自变量的变化为前提 13.某地区20_1- 2022年人口总量(单位:万人)分别为98,102 ,103, 106, 108,109,110,111,114,115,以下哪种图形最合适描绘这些数据? ( ) A.茎叶图 B.环形图 C.饼图 D.折线图 14.以下关于条形图的表述,不正确的选项是( )。A.条形图中条形的宽度是固定的 B.条形图中条形的长度(或高度)表示各类别频数的多少 C.条形图的矩形通常是严密排列的 D.条形图通常是适用于所有类型数 15某校期末考试,全校语文平均成绩为80分,标准差为3分;数学平均成绩为87分,标准差为5分。某学
7、生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。A数学 B语文 C两门课程一样 D无法判断 16有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性程度表述正确的选项是( )。A甲的离散程度小,稳定性程度低 B甲的离散程度小,稳定性程度高 C乙的离散程度小,稳定性程度低 D乙的离散程度大,稳定性程度高 17下表是某单位工作人员年龄分布表,该组数据的中位数出如今第( )组。A第3组 B第4组 C第5组 D第6组 18对于线性回归,在因变量的总离差平方和中,假如残差平方和所占比例越大,那么两个变量之间
8、( )。A相关程度越大 B相关程度越小 C完全相关 D完全不相关 19回归平方和( SSR)反映了y的总变差中( )。A由于_与y之间的线性关系引起的y的变化局部 B除了_对y的现有影响之外的其他因素对y变差的影响 C由于_与y之间的非线性关系引起的y的变化局部 D由于_与y之间的函数关系引起的y的变化局部 20以下哪种情况不合适用方差分析p ?( ) A性别对收入的影响 B专业对收入的影响 C年龄对收入的影响 D行业对收入的影响 21以下关于因变量与自变量的表述不正确的选项是( )。A自变量的变化是以因变量的变化为前提 B因变量是由于其他变量的变化而导致自身发生变化的变量 C自变量是引起其他
9、变量变化的变量 D因变量的变化不以自变量的变化为前提 22某班级学生平均每天上网时间可以分为以下六组:(1)1小时及以下;(2)1-2小时;(3)2-3小时;(4)3-4小时;(5)4-5小时;(6)5小时及以上,那么5小时及以上这一组的组中值近似为( )。A5小时 B6小时 C5.5小时 D6.5小时 23以下关于条形图的表述,不正确的选项是( )。A条形图中条形的宽度是固定的 B条形图的矩形通常是严密排列的 C条形图中条形的长度或高度表示各类别频数的多少 D条形图通常是适用于所有类型数 24下表是某单位工作人员年龄分布表,该组数据的中位数出如今第( )组。A第3组 B第4组 C第5组 D第
10、6组 25某校期末考试,全校语文平均成绩为80分,标准差为3分;数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。A数学 B语文 C两门课程一样 D无法判断散 26在假设检验中,不回绝虚无假设意味着( )。A虚无假设是肯定正确的 B虚无假设肯定是错误的 C没有证据证明虚无假设是正确的 D没有证据证明虚无假设是错误的 27根据一个样本均值求出的90的置信区间说明( )。A总体均值一定落人该区间内 B总体均值有90的概率不会落入该区间内 C总体均值有90的概率会落人该区间内 D总体均值有10的概率会落入该区间内 28在回归方程中
11、,假设回归系数等于0,这说明( )。A因变量y对自变量_的影响是不显著的 B自变量_对因变量y的影响是不显著的 C因变量y对自变量_的影响是显著的 D自变量_对因变量y的影响是显著的 29.中心极限定理认为不管总体分布是否服从正态分布,从均值为、方差为?的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为、方差为的正态分布。A.,2 B./n,2 /n C.,o2/n D./n,o? 30.以下哪种情况不合适使用方差分析p ? ( ) A.性别对收人的影响 B.年龄对收人的影响 C.专业对收人的影响 D.行业对收人的影响 31.为理解某地区的消费,
12、从该地区随机抽取8000户进展调查,其中80答复他们的月消费在3000元以上,20答复他们每月用于通讯、网络的费用在300元以上。此处8000户是( )。A.样本 B.总体 C.变量 D.统计量 32.某地区家庭年均收人可以分为以下六组:1)1500元及以下;2)1500一2500元;3)25003500元;4)3500-4500元;5)4500- 5500元;6)5500元及以上,那么该分组的组距近似为( )。A.500元 B.1500元 C.1250元 D.1000元 33.先将总体按某种特征或标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有
13、子样本合起来作为总样本,这样的抽样方式称为( )。A.简单随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 34.正态分布中,值越小,那么( )。A.离散趋势越小 B.离散趋势越大 C.曲线越低平 D.变量值越分散 35.对于左偏分布,平均数、中位数和众数之间的关系是( )。A.平均数中位数众数 B.中位数平均数众数 C.众数中位数平均数 D.众数平均数中位数 36.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性程度表述正确的选项是( )。A.甲的离散程度小,稳定性程度低 B.甲的离散程度小,稳定性程度高.C.乙的离散程
14、度小,稳定性程度低 D.乙的离散程度大,稳定性程度高 37以下哪种情况不合适用方差分析p ?( ) A性别对收入的影响 B专业对收入的影响 C年龄对收入的影响 D行业对收入的影响 38.某单位认为该厂第一加工车间残品率估计高于13,而该车间主任认为该比例偏高,假如要检验该说法是否正确,那么假设形式应该为。A.Ho:r0.13;H:.13 C.Ho:r=0.13;H :0.13 D.Ho:r0.13;H:0.13.39.残差平方和(SSE)反映了y的总变差中( )。A.由于_与y之间的线性关系引起的y的变化局部 B.除了_对y的现有影响之外的其他因索对y变差的影响 C.由于_与y之间的非线性关系
15、引起的y的变化局部 D.由于_与y之间的函数关系引起的y的变化局部 40.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,那么组间均方和组内均方分别为( )。A.432.71 B.216.71 C.432.426 D.216.426 二、名词解释题 1非概率抽样:根据主观意愿、实际情况等进展抽样,而不根据随机原那么进展抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。2二维表:二维表就是行列穿插的表格,将两个变量一个分行排放,一个分列排放,行列穿插处就是同属于两个变量的不同类的数据,也称为列联表。3置信程度:置信程度就是将构造置信区间的步骤重复很屡次,置信区间包含
16、总体参数真值的次数所占的比例。4卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。5非概率抽样:根据主观意愿、实际情况等进展抽样,而不根据随机原那么进展抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。6二维表:二维表就是行列穿插的表格,1分将两个变量一个分行排放,一个分列排放,1分行列穿插处就是同属于两个变量的不同类的数据,也称为列联表。7置信程度:置信程度就是将构造置信区间的步骤重复很屡次,置信区间包含总体参数真值的次数所占的比例。8卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理
17、论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。9整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的假设干小群体内的所有元素构成总体样本的方法。10Z值:Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描绘原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(_-)/ 11二维表:二维表就是行列穿插的表格,1分将两个变量一个分行排放,一个分列排放,1分行列穿插处就是同属于两个变量的不同类的数据,也称为列联表。12误差减少比例:在预测变量Y的值时,知道变量_
18、的值时所减少的误差(E- Ez)与总误差E,的比值称为误差减少比例,简称PRE。13散点图:在坐标系中,用_轴表示自变量_,用Y轴表示因变量y,而变量组(_,y)那么用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。14中心极限定理:中心极限定理详细内容为:不管总体分布是否服从正态分布,从均值为肛、方差为-2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为队方差为aZ/n的正态分布。15置信程度:置信程度就是将构造置信区间的步骤重复很屡次,置信区间包含总体参数真值的次数所占的比例。16离
19、散系数:离散系数是一组数据的标准差与该数据均值之比,也称为变异系数。三、简答题 1.等距分组和不等距分组有什么区别?请举例说明。答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别。(0.5分) (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历。(0.5分) (3)定距变量:当变量值不仅可以将个体区分为不同类型并进展排序,而且可以确定不同类别之间的数量差异和间隔差距时,这样的变量称为定距变量。例如:智商。(0.5分) (4)定比变量:除了上
20、述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入。(0.5分) 2简述相关系数的取值与意义。答:相关系数的取值在一11之间;相关系数的正负号表示两个变量相关关系的方向,“十”表示正相关,“一”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关。3简述什么是回归分析p ?其作用是什么? 答:(1)回归分析p 是通过-定的数学表达式将变量间的关系进展描绘,确定-一个变量或几个变量的变化对另一个特定变量的
21、影响,是进展估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析p 的作用包括: 从数据出发,确定变量之间的数学关系式; 对变量间的关系式进展统计检验,并从影响某一变量的多个变量中找出影响显著的变量; 利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。4.简述按照测量程度区分的四类变量,并举例说明。答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(0.5分)。(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定
22、序变量。例如:学历(0.5分)。(3)定距变量:当变量值不仅可以将个体区分为不同类型并进展排序,而且可以确定不同类别之间的数量差异和间隔差距时,这样的变量称为定距变量。例如:智商(0.5分)。(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入(0.5分)。5.简述相关系数的取值与意义。答:相关系数的取值在一11之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时
23、,只能说变量之间不存在线性相关,而不能说它们之间不相关。6简述什么是简单回归分析p ?其作用是什么? 答:(1)回归分析p 是通过一定的数学表达式将变量间的关系进展描绘,确定-个变量或几个变量的变化对另一个特定变量的影响,是进展估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析p 的作用包括: 从数据出发,确定变量之间的数学关系式; 对变量间的关系式进展统计检验,并从影响某一变量的多个变量中找出影响显著的变量; 利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。7.判断以下随机变量是定性变量还是定量变量,假如是定量变量,确定是离散变量还是连续变
24、量。(1)网络供给商的姓名;(2)每月的网络效劳费;(3)每月上网时间;(4).上网的目的;(5).上月网购次数。答:(1)网络供给商的姓名:定性 (2)每月的网络效劳费:定量、连续变量 (3)每月上网时间:定量、连续变量 (4)_上网的目的:定性 (5).上月网购次数:定量、离散变量 8.简述什么是简单回归分析p ?其作用是什么? 答:(1)回归分析p 是通过一定的数学表达式将变量间的关系进展描绘,确定-一个变量或几个变量的变化对另一个特定变量的影响,是进展估计或预测的一-种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析p 的作用包括: 从数据出发,确定变量之间的数学关系式; 对变量
25、间的关系式进展统计检验,并从影响某一变量的多个变量中找出影响显著的变量; 利用所求出的关系式,根据-一个变量或多个变量的取值估计或预测另一个特定变量的取值。9.如何对配对样本进展t检验。答:配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有一样均值的总体。在对配对样本进展t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,假如差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信程度上没有差异,假如差值的均值在置信区间外,那么说明两个总体均值在给定的置信程度上有差异。10简述按照测量程度区分的四
26、类变量,并举例说明。答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(0.5分)。(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历(0.5分)。(3)定距变量:当变量值不仅可以将个体区分为不同类型并进展排序,而且可以确定不同类别之间的数量差异和间隔差距时,这样的变量称为定距变量。例如:智商(0.5分)。(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入(0.5分)。11简述
27、相关系数的取值与意义。答:相关系数的取值在-11之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“一”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近O,相关程度越弱;相关系数r-0时,只能说变量之间不存在线性相关,而不能说它们之间不相关 12简要举例说明在分析p 双变量的关系时,t检验和卡方检验的主要区别。答:分析p 双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系。2分t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验。卡方检验
28、主要用于对两个分类变量之间的相关性进展统计检验,判断变量之间是否存在显著关系。例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两独立样本t检验。假如我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异。四、计算题 18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问;(1)是男生体重差异大还是女生体重差异大?为什么? (2)男生中有多少比重的人体重在55千克-65千克之间? 答:答:18.一项关于大学生体重状况的研究发现,男生的
29、平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么? (2)男生中有多少比重的人体重在55千克-65千克之间? (3)女生中有多少比重的人体重在40千克-60千克之间? 答:答:18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95的置信程度,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95的置信程度,计算年龄在20岁以下的网络用户比例的置信区间。
30、注:Zo.025=1.96 答:19某农科院使用4种方法培育稻米,为确定哪种方法消费效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进展分析p 得到下面的方差分析p 表:要求:计算上面方差分析p 表中A、B、C、D、E、F处的值 答:(1)对2022年销售额按由低到高进展排序,求出众数、中位数和平均数。(2)假如按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进展分组,编制频数分布表,并计算累积频数和累积频率。答:19.某汽车消费商欲理解广告费用万元对销售量辆的影响。搜集了过去_年的有关数据,通过分析p 得到:方程的截距为363,回归系数为1.42,回归平方和SSR-1600,残差平方和SSE-450。要求:(1)写出销售量y与广告费用_之间的线性回归方程。(2)假设明年方案投入广告费用为50万,根据回归方程估计明年汽车销售量。(3)计算断定系数R2,并解释它的意义。答:第 13 页 共 13 页