《单选(带答案)(46页).doc》由会员分享,可在线阅读,更多相关《单选(带答案)(46页).doc(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、- 统 计 学 原 理 习 题 集专业:班级: 姓名: 学号: 第一章 导论 一、单选题 1指出下面的数据哪一个属于定类数据 ( D ) A 年龄:10岁,20岁,21岁 B 工资:1500 ,1800元,3600元 C 汽车产量;35万辆,80万辆,150万辆 D 购买商品时的支付方式:现金信用卡,支票 2指出下面的数据哪一个属于定序数据 ( D ) A年龄:18岁,20岁,21岁 R 工资:1 500元,1 800元,3 600元 C 汽车产量: 35万辆80万辆,150万辆 D 员工对企业某项改革措施的态度:赞成中立,反对 3,某研究部门准备在全市200万个家庭中抽取2 000个家庭,推
2、断该城市所有职工家庭的年人均收入。这项研究的总体是 ( B ) A2 000个家庭 B200万个家庭 C2 000个家庭的人均收入 D200万个家庭的人均收入 4某研究部门准备在全市200万个家庭抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的样本是 ( A ) A2 000个家庭 B200万个家庭 C2 000个家庭的人均收入 D,200万个家庭的人均收入 5某研究部门准备在全市200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的参数是 ( D ) A2000个家庭 B 200万个家庭 C2000个家庭的人均收人 D,200万个家庭的人均收
3、入 6 某研究部门准备在全市 200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入这项研究的统计量是 ( C ) A2 000个家庭 B。 200万个家庭C2 000个家庭的人均收入 D200万个家庭的人均收入7一家研究机构从IT从业者中随机抽取500人什为样本进行调查,其中60回答他们的月收入为5 000元以上,50的人回答他们的消费支付方式是用信用卡。这里的“消费支付方式”是 ( A ) A 分类变量 B 顺序变量 C.数值型变量 D 离散变量8 一家研究机构IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在3 000元以上,50的人回答他们的消
4、费支付方式是用信用卡。这里的“月收入”是 ( C ) A 分类变量 B 顺序变量 C 数值型变量 D 离散变量9.指出下面的数据哪一个属于顺序变量 ( C ) A收人 B. 汽车产量 C员工对企业某项改革措施的态度(赞成、中立、反对) D.企业类型10一项调查表明,在所抽取的1 000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜:”。这里的“消费者在网上购物的花费金额”是 ( C ) A分类变量 B顺序变量 C 数值型变量 D. 离散变量1l一项调查表明,在所抽取的1 000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在同上购物的
5、主要原因是“价格便宜”。这里的“消费者在网上购物的原因”是 ( A ) A. 分类变量 B.顺序变量 C数值型变量 D.离散变量12一名统计学专业的学生为了完成其统汁作业,在统计年鉴中找到的2005年城镇家庭的人均收入数据。这一数据属于( C ) A分类数据 R.顺序数据 C截面数据 D.时间序列数据13下列不属于描述统计问题的是 ( A ) A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据14.在下列叙述中采用推断统计的方法是 ( B ) A.用饼图描述某企业职工的学历构成 B.从一个果园中采摘36个橘子,利用这36
6、个橘子的平均重量估计果园中橘子的平均重量 C.一个城市在11月份的平均汽油价格 D.反映大学牛统计学成绩的条形图15.根据样本计算的用于推断总体特征的概括性度量值称作 ( D ) A.参数 B.总体 C.样本 D.统计量16为了估计某城市中拥有汽车的家庭比例,抽取500个家庭的一个样本,得到拥有汽车的家庭比例为35%,这里的35是 ( B ) A.参数值 B.统计量的值 C.样本容量 D.变量17最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。这结论属于( D ) A.对样本的描述 B.对样本的推断 C.对总体的描述 D对总体的推断18,为了估
7、计全国高中学生的平均身高,从20个城市选取100所中学进行调查在该项研究中,样本是 ( D ) A100所中学 B20个城市 C.全国的高中学生 D100所中学的高中学生19为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,研究者感兴趣的参数是 ( C ; A100所中学 B.20个城市 C,全国的高中学生的平均身高 D100所中学的高中学生的平均身高20为估引全国高中学生的平均身高,从20个城市选取100所中学进行调查.在该项研究中,研究者使用的统计量是( D ) A100所中学 B20个城市 C. 全国的高中学生的平均身高 D100所中学的高中学生的平均
8、身高21只能归于某一有序类别的非数字型数据称为 ( B ) A. 分类数据 B.顺序数据 C 数值型数据 D. 数值型变量22按数通过调查或观测而收集到的数据称为 ( A ) A.观测数据 B.试验数据 C.时间序列数据 D.截面数据23在相同或近似相同的时间点上收集的数据称为 ( D ) A观测数据 B.试验数据 C.时间序列数据 D.截面数据24,在不同时间上收集到的数据称为 ( C ) A.观测数据 B.试验数据 C时间序列数据 D截面数据 第二章 数据的收集 一、单选题1为估计某城市愿意乘坐公车上下班的人数的比例,在收集数据时,最有可能采用的数据搜集方法是 ( C ) A.普查 B.公
9、开发表的资料 C.随机抽样 D.实验2某机构十分关心小学生每周看电视的时间。该机构随机抽样300名小学生家长对他们的孩子每周看电视肿时间进行估计。结果表明这些小学生每周看电视的乎均时间为15小时,标准差为5。该机构搜集数据的方式是 ( A ) A.抽样调查 B.观察调查 C.实验调查 D.公开发表的资料3.如果一个样本因人故意操纵而出现偏差,这种误差属于 ( B ) A.抽样误差 B.非抽样误差 C.设计误差 D.试验误差4为了解居民对小区物业服务的意见和看法,管理人员随机抽取50户居民,并上门通过问卷进行调查。这种数据的收集方法称为 ( A ) A.面访式问卷调查 B. 实验调查 C.观察式
10、调查 D. 自填式问卷调查5指出下面的陈述中哪一个是错误的 ( B ) A.抽样误差只存在于概率抽样中 B.非抽样误差只存在于非概率抽样中 C.无论是概率抽样还是非概率抽样都存在非抽样误差 D.在全面调查中也存在非抽样误差 6某居民小区为了解住户对物业服务的看法准备采取抽样调查方式搜集数据。物业管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走,同时有些是新人住的居民户。这种调查产生的误差属于 ( B ) A.随机误差 B.抽样框误差 C.回答误差 D.无回答误差7,某居民小区为了解住户对物业服务的看法准备采取抽样调查方式搜集数据,物业管理部门利用居民户登记名单进
11、行抽样。但现在的小区中,原有的一些居民户已经搬走而没有回答问题。这种凋查产生的误差属于 ( D ) A.随机误差 B.抽样框误差 C.回答误差 D.无回答误差8指出下面的陈述哪个是错误的 ( A ) A.抽样误差是可以避免的 B.非抽样误差是可以避免的 C.抽样误差是不可避免的 D.抽样误差是可以控制的9对于较隐秘的问题,要收集有关的研究数据,较为适合的数据收集方法是 ( D ) A.电话调查 B.邮寄问卷调查 C.座谈会 D.个别深度访问10为调查一定时间内某路段的汽车流量,适合的数据收集方法是 ( B ) A.问卷调查法 B.观察法 C.试验法 D.座谈会第三章数据整理与展示 一、单选题1
12、数据筛选的主要目的是 ( C ) A.发现数据的错误 B.对数据进行排序 C.找出所需要的某类数据 D.纠正数据中的错误2落在某一特定类别或组中的数据个数称为 ( A ) A频数 B.频率 C频数分布表 D.累积频数3把各个类别及落在其中的相应频数全部列出,井用表格形式表现出来,称为( B ) A频数 B. 频数分布 C. 频率 D. 累积频数4一个样本或总体中各个部分的数据与全部数据之比称为 ( C ) A.频数 B.频率 C.比例 D.比率5. 样本或总体中各不同类别数值之间的比值称为 ( D ) A.频数 B.频率 C.比例 D.比率6将比例乘以100得到的数值称为 ( B ) A.频率
13、 B.百分数 C.比例 D比率7.下面哪一个图形最适合于描述结构性问题 ( B ) A条形图 B. 饼图 C. 雷达图 D. 箱线图8.将各有序类别或组的频数逐级累加起来得到的频数称为 ( B ) A.频率 B.累积频数 C.比例 D.比率9下面的哪一个图形适合于比较研究两个或多个总体或结构性问题 ( A ) A环形图 B.饼图 c. 雷达图 D.箱线图10将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为 ( B ) A.单变量值分组 B. 组距分组 C.等距分组 D. 连续分组11组中值是 ( B ) A.一个组的上限与下限之差 B.一个组的上限与下限之间的
14、中点值 C 个组的最小值 D.一个组的最大值12下面的图形中最适合于描述一组数据分布的图形是( C ) A.条形图 B. 箱线图 c直方图 D. 饼图13对于大批量的数据,最适合于描述其分布的图形是 ( C ) A.条形图 B. 茎叶图 C.直方图 D饼图14由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形,称为 ( D ) A.条形图 B.茎叶图 C.直方图 D.箱线图15对于时间序列数据,用于描述其变化趋势的图形通常是 ( D ) A.条形图 B.直方田 C.箱线图 D.线图16为了研究多个的不同变量在不同样本间的相似性,适合采用的图形是 ( C
15、 ) A.环形图 B.茎叶图 C.雷达图 D.箱线图17,10家公司的月销售额数据(万元)分别为:72,63,54,54,29 2625,23,3,20。下列哪种图形不宜用于描述这些数据 ( B ) A.茎叶图 B.雷达图 C.条形图 D.饼图18与直方图相比,茎叶图 ( B ) A未保留原始数据的信息 B.保留了原始数据的信息 C能有效展示数据的分布 D.更适合描述分类数据19下面的哪个图形不适合描述分类数据 ( D ) A条形图 B.饼图 C.环形图 D茎叶图20下面的哪个图形适合描述顺序数据 ( C ) A.直方图 B.茎叶图 C累积频数分布图 B.雷达图21累积频数分布图适合于描述 (
16、 B ) A.分类数据 B.顺序数据 C.数值型数据 D.品质数据22将某企业职工的月收入依次分为2 000元以下、2 000元一3 000元 、3 000元一4000元、4 000元一5 000元、5 000元以上几个组。第一组的组中值近似为 ( C ) A,2 000 B1 000 C1 500 D2 500 23将某企业职工的月收入依次分为2 000元以下、2 000元3 000元,3 000元一4000元、4 000元5 000元、5 000元以上几个组。最后一组的组中值近似为 ( C ) A5 000 B7 500 C5 500 D6 500 24直方图与条形图的区别之一是 ( A
17、) A.育方图的各矩形通常是连续排列的,而条形图是分开排列的 B.条形图的各矩形通常是连续排列的,而直方图则是分开排列的 C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据 D.直方图主要用于描述各类别数据的多少,条形图主要用于描述数据的分布 第四章 数据分布特征的测度 一、单选题: 1一组数据中出现频数最多的变量值称为 ( A ) A.众数 B.中位数 C.四分位数 D平均数 2下列关于众数的叙述中,不正确的是 ( C ) A.一组数据可能存在多个众数 B.众数主要适用于分类数据 c.一组数据的众数是唯一的 D.众数不受极端值的影响 3一组数据排序后处于中间位置上的变量值称为 (
18、 B ) A.众数 B.中位数 C.四分位数 D.平均数 4一组数据排序后处于25%和75位置上的值称为 ( C ) A.众数 B.中位数 C.四分位数 D.平均数 5n个变量值乘积的n次方根称为 ( D ) A,众数 B.中位数 C四分位数 D几何平均数 6非众数组的频数占总频数的比率称为 ( A ) A.异众比率 B.离散系数 C.平均差 D标准差 7.四分位差是 ( A ) A 上四分位敷减下四分位数的结果 B.下四分位数减上四分位数的结果 C. 下四分位数加上四分位数 D.下四分位数与上四分位数的中间值 8各变量值与其平均数离差绝对值的平均数称为 ( B ) A.极差 B.平均差 C.
19、标准差 D.四分位差 9各变量值与其平均数离差平方的平均数称为 ( C ) A.极差 B.平均差 C.方差 D.标准差 l0变量值与其平均数的离差除以标准差后的值称为 ( A ) A.标准分数 B.离散系数 C.方差 D标准差 11如果一个数据的标准分数是一2,表明该数据 ( B ) A.比平均数高出2个标准差 B.比平均数低2个标准差 C.等于2倍的平均数 D.等于Z倍的标准差 l2如果一个数据的标准分数是3,表明该数据 ( A ) A.比平均数高出3个标准差 B.比平均数低3个标准差 C.等于3倍的平均数 D等于3倍的标准差13经验法则表明,当组数据对称分布时,在平均数加减1个标准差的范围
20、之内大约有 ( A ) A68%的数据 B. 95的数据 C. 99的数据 D00的数据14经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有 ( B ) A68的数据 B95的数据 C. 99%的数据 D100的数据15经验法则表明,当一组数据对称分布时,在平均数加减3个标准差的范围之内大约有 ( C ) A68%的数据 B.95的数据 C99%的数据 D.100的数据16离散系数的主要用途是 ( C ) A.反映一组数据的离散程度 B.反映一组数据的平均水平 C,比较多组数据的离散程度 D.比较多组数据的平均水平1 7两组数据相比较 ( C ) A.标准差大的离散程
21、度也就大 B.标准差大的离散程度就小 C.离散系数大的离散程度也就大 D.离散系数大的离散程度就小18偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数 ( A ) A等于0 B等于1 C,大于0 D大于l19如果峰态系数ko,表明该组数据是 ( A ) A.尖峰分布 B.扁平分布 C左偏分布 D右偏分布20如果峰态系数k中位数众数 B.中位数平均数众数 C.众数中位数平均数 D.众数平均数中位数25. 在某行业中随机抽取10个企业,第一季度的利润额(单位:万元)分别是:72,63.1,547,543,29,26.9,25,23.9,23,20。该组数据的中位数为 (
22、 C ) A2846 B3020 C2795 19281226在某行业中随机抽取10个企业,第一季度的利润额(单位:万元)分别是:72,631,547,543,29,269,25,239,23,20该组数据的平均数为 ( D ) A2846 B.3020 C2795 D391927在某行业中随机抽取10个企业第一季度的利润额(单位:万元)分别是:72,631,54,7,54,3,29,26925,23,9,23,20。该组数据的标准差为 ( B ) A2846 B.1954 C. 2 2795 D3819428随机抽取5名学生,他们一年中购买教科书的费用如下(单位:元):200,250,375
23、,125,280。该组数据的方差是 ( A ) A9297 B8 6425 C8315 D6 914029某班学生的平均成绩是80分,标准差是lo分。如果已知该班学生的考试分数为对称分布,可以判断成绩在60分到100分之间的学上大约占 ( A ) A95 B.89% C68 D,99 30某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断成绩在70分到90分之间的学生大约占 ( C ) A95 B89 C68 D99 3l某班学上的平均成绩是8o分,标准差是5分。如果已知该班学牛的考试分数为非对称分布,可以判断成绩在70分至90分之间的学生至少占 ( D
24、 ) A,95 B89 C68 D75 32在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是 ( B ) A.对称的 B.左偏的 C.右偏的 D.无法确定 33对某个高速路段行驶过的1Z0辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时下列哪个车速可以看作是异常值 ( D ) A78公里/小时 B. 82公里/小时 C91公里/小时 D. 98公里/小时 34一组样本数据为3,3,l,5,13,12,11,9,7。这组数据的中位数是 ( D ) A3 B,13 C,7.1 D7 35.测度数据离散程度的相
25、对统计量是 ( D ) A.极差 B.平均差 C标准差 D.离散系数 36.一组数据的离散系数为04,平均数为20,则标准差为 ( D ) A80 B.0,02 C. 4 D8 37一组数据的离散系数为08,标准差为30,则平均数为 ( B ) A50 B375 C18 D0.02 38在测度数据集中趋势的统计量中,不受极端值影响的是 ( D ) A.平均数 B.几何平均数 C.调和平均数 D.中位数 39在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的 ( D ) A.标准差不同 B.方差不同 C.数据个数不同 D.计量单位不同 第五章抽样与参数估计 一、单选题 l从含有
26、N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都 有相同的机会(概率)被抽中,这样的抽样方式称为 ( A ) A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样 2从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为 ( A ) A.重复抽样 B. 不重复拙样 C.分层抽样 D. 整群抽样 3一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止,这样的抽样方法称为 ( B ) A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样 4在抽样之前先将总体的元素划分为若干类然后从各类中
27、抽取一定数量的元素组成一个样本,这样的抽样方式称为 ( B ) A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样 5.先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取个元素,直至抽取n个元素形成一个样本。这样的抽样方式称为 ( C ) A.简单随机抽样 B分层抽样 C.系统抽样 D.整群抽样 6先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为 ( D ) A.简单随机抽样 B分层抽样C.系统抽样 D.整群抽样 7抽样分布是指 ( C ) A.一个样本各观测值的分布 B.总体中
28、各观测值的分布 C.样本统计量的分布 D.样本数量的分布8根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分 布,其分布的均值为 ( A ) A. B. n Cn D/9根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分 布,其分布的方差为 ( C ) A. Bn C. n D. /10中心极限定理表明,如果容量为n的样本来自于任意分布的总体,则样本均值的分布为 ( C ) A.正态分布 B.只有当n30时为正态分布 C.只有当n30时为止态分布 D.非正态分布11从服从正态分布的无限总体中抽取容量为4、16和36的样本,当样本容量增大时,样本均值的标准
29、差 ( D ) A.保持不变 B.无法确定 C.增加 D.减小12总体的均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值和抽样分布的标准误差分别为 ( B ) A50,8 B50,1 C50,4 D. 8, 813在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本的分布服从 ( A ) A.正态分布,均值为12分钟,标准差为03分钟 B.正态分布,均值为12分钟,标准差为3分钟 C.左偏分布,均值为12分钟,标准差为3分钟 D.左偏分布,均值为12分钟,标准差为0,3分钟14假定总
30、体比例为O55,采用重复抽样的方法从该总体中抽取容量为200的样本,则样本比例的抽样标准差为 ( B ) A0,05 B0035 C0045 D005715假设总体比例为04,采用重复抽样的方法从此总体中抽取一个容量为100的简单随机样本,则样本比例的期望为 ( B ) A.03 B. 0 .4 C. 0,5 D. 04516在参数估计中利用t分布构造置信区间的条件是 ( B ) A.总体服从正态分布且方差已知 B.总体为正态分布,方差未知 C.总体不一定是正志分布但须是大样本 D.总体不一定是正态分布,但需要方差已知17根据一个具体的样本求出的总体均值95的置信区间 ( D ) A以95的概
31、率包含总体均值 B. 有5的可能性包含总体均值 C. 一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值18当置信水平一定时,置信区间的宽度 ( A ) A.随着样本量的增大而减小 B.随着置样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成止比19一个95的置信区间是指 ( C ) A.总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95的区间不包含该总体参数2095的置信水平是指 ( B ) A.总体参数落在一个特
32、定的样本所构造的区间内的概率为95 B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95% C.总体参数落在一个特定的样本所构造的区间内的概率为5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5%21当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是( B ) A.正态分布 B.t分布 C. 卡方分布 D.F分布22当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是( A ) A 正态分布 B. t分布 C. 卡方分布 D. F分布23正态总体方差已知时在小样本条件下,总体均均值在l一a置信水平的置信区间可以写为 ( C
33、 ) A B. C; D. 24正态总体方差未知时,在小样本条件下,总体均值在1一a置信水平的置信区间 可以写为 ( B ) A B. C. D. 25.在其他条件相同的情况下,95的置信区间比90%的置信区间 ( A ) A.要宽 B.要窄 C.相同 D.可能宽也可能窄26指出下面的说法哪个是正确的 ( A ) A.样本量越大,样本均值的抽样标准差就越小 B.样本量越大,样本均值的抽样标准差就越大 C.样本量越小,样本均值的抽样标准差就越小 D.样本均值的抽样标准差与样本量无关27将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比率称为( C ) A置信区间 B.显著性水平 C
34、. 置信水平 D.临界值28抽取一个容量为100的随机样本,其均值为81,标准差为12。总体均值的95%的置信区间为 ( B ) A81197 B. 81235 C. 81310 D813.5229从某地区中随机抽出20个企业,得到20个企业总经理的年平均收入为25 964.7元,标准差为42 8078元,构造企业总经理年平均收入的95的置信区间为 ( A ) A,25 964718761.5 B. 25 964721 0343 C25 964725 0343 D25 964730 034330在某个电视节目的收视率调查中,随机抽取由165个家庭构成的样本,其中观看该节目的家庭有101个。用90%的置信水平构造的估计观看该节目的家庭比率的置信区间为 ( D ) A 61%3 B.61%4% C. 615 D.61631在n500的随机样本中,成功的比率为0.20,总