《统计学习题(抽样分布、参数估计).doc》由会员分享,可在线阅读,更多相关《统计学习题(抽样分布、参数估计).doc(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、练习题第1章 绪论(略)第2章 统计数据的描述2.1 某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。调查结果如下:4222434414224443242231214414242332134344331242432423222122442123333334234331323243134342142242334121(1)制作一张频数分布表。(2)绘制一张条形图,反映学历分布。2.2 在一项研究中,某调查公司为了解某品牌变速箱是否存在缺陷,从一家该汽车的维修公司获得该汽车变速箱失效前行驶的实际里程数的
2、资料数据如下:8509239323643427427674425378327753932609896416125459465942196799840001118444733417743711680359817702099285710176925066792941381146409063436957747709864544121352699228681385586599028586169868693463566211626953402324646560553500852883252466681672018934188798(1)对以上数据进行适当的分组并编制频数分布表和累积频数分布表。(2)用直
3、方图来表现数据的分布特征。2.3 为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A8.2695047.517739.2624117.9148948.411348B7.4473688.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。2.4 下面是一个班50个学生的经济学考试成绩:885691796990887182799885347448100
4、75956092836465699964457663696874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。 (2)用茎叶图将原始数据表现出来。2.5 如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。男14916017618021031080951081401401441451501501501601681882102102102101052102102101101681752103564602102102102102103102102102102102102
5、102103753753803803884505606006501203012075210女1203303453743753807009070060140150160210210210210150175175210175210210210400430450120175178180180185185190195196200200210210210210210210210210330330350360360360380400470486500550(1) 按近视度数分别对男女学生进行分组。(2) 用一张条形图将男女两组数据同时表现出来。(3) 分别绘制直方图,并对比男女近视度数的分布特征。2.6
6、为了研究各国第三产业的发展状况,我们需要分析各国的第三产业占其国内生产总值的比重,下表中的数据为33个国家和地区的第三产业占其GDP的比重的数据。单位25.130.136.138.439.9424444.247.348.449.349.551.151.151.254.755.7575860.360.361.662.262.365.265.666.466.768.670.671.571.884.1(1) 请你对该数据进行适当分组(2) 制作直方图。2.7 一家连锁店拥有多家分店,为分析各家分店的销售状况,管理部门收集了两家规模相近的分店的销售额数据,下面是A、B两家分店50天销售额数据的排序(单
7、位:万元):A分店:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B分店:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1)将两个分店的销售额用一个公共的茎制成茎叶图。(2)比较两个分店销售额分布的特点。2.8 下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课
8、程的成绩,考生编号123456789101112英语664439585234747151416451政治696658566840736562485864专业课154252036214824228353919专业课2906285816454737868668075专业课3815645627063768665217473制作箱线图并分析各课成绩的分布特征。2.9 某公司招收推销员,要测定男女推销员的推销能力是否有差别,名随机抽选了8人,经过一段时间销售,取得数据如下:男推销员销售额(千元)女推销员销售额(千元)31351227522451222055194928142944(1) 绘制箱线图比较男
9、女推销员销售额数据的分布。(2) 并用描述数据集中趋势的测度值说明男女推销员销售额的差异。2.10 下表中的数据反映的是1992年到2001年我国职工平均工资和居民消费价格增长指数:年份1992199319941995199619971998199920002001职工工资增长指数()118.5124.8135.4121.7112.1103.6100.2106.2107.9111.0居民消费价格指数()106.4114.7124.1117.1108.3102.899.298.6100.4100.7资料来源 :中国统计年鉴中国统计出版社。试根据上表数据比较我国1992年到2001年间职工工资增长
10、指数与平均居民消费价格指数的平均增长速度。2.11 下表所给数据为某楼盘一年四个季度的出租情况:社区外租套数出租率()租金A51695400B48197450C36492600D42789520请根据上表提供数据计算平均租金和平均出租率。2.12 气象局为研究我国的气温变化,对我国北方两个城市1月份和2月份的气温作了记录。数据如下表:气温()城市A的天数城市B的天数-30-2561-25-20124-20-15209-15-101015-10-5416-5037053451013合计5959(1)计算两城市的气温的均值。(2)计算两城市气温的标准差。(3)比较两城市气温离散程度的大小。第3章
11、概率与概率分布3.1 抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面, 这一事件的概率记作。请说明概率的含义。3.2 某学院历史专业的85名学生年龄和性别数据如下表: 年龄总计性别20或更小超过20男生153045女生202040总计355085从该专业随机选择一名学生,记录下他的性别和年龄。计算以下概率:(1) P(年龄为20岁或更小的男生)。(2) P(男生)。(3) P(年龄为20岁或更小)。(4) P(男生或女生)。3.3 在一所城市中随机抽取600个家庭,用以确定拥有个人电脑的家庭所占的比例。定义如下事件:600个家庭中恰好有265个家庭拥有电脑。:恰好
12、有100个家庭拥有电脑。:特定户主张三家拥有电脑。说明下列各对事件是否为互斥事件,并说明你的理由。 (1)与 (2)与 (3)与3.4 一个轮胎检验员收到1000个轮胎,不合格率为2%,他取出一个容量为5的样本,并记录样本中的不合格轮胎个数。(1) 给出不合格品个数的概率分布。(2) 计算不合格品个数的期望和方差。3.5 一家超市所作的一项调查表明,有80%的顾客到超市是来购买食品,60%的人是来购买其他商品,35%的人既购买食品也购买其他商品。求:(1) 已知某顾客来超市购买食品的条件下,也购买其他商品的概率。(2) 已知某顾客来超市购买其他的条件下,也购买食品的概率。3.6 假定某航空公司
13、预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?3.7 假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损。如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利的,哪7支是亏损的。求:(1) 所有3支能获利的股票都被你选中的概率有多大?(2) 3支可获利的股票中有2支被你选中的概率有多大?3.8 假定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?3.9 考虑某离散型随机变量,若B(100,0.2),试计
14、算这100次贝努里试验中恰好有15次成功的概率。第4章 抽样与抽样分布4.1 已知某树苗培植园内的树苗的树茎直径服从正态分布,从中随机抽取了10株,测得其树茎直径数据如下(单位:厘米):10.18.97.611.310.79.49.910.210.511.7(1)试求该批树苗直径的平均值及标准差。(2)你能否推断该园内树苗直径的具体分布是什么?4.2 设一总体的由5个元素构成,其指标值为。问:(1)该总体的均值和方差是多少?(2)若采用重复抽样的方法从该总体中抽取样本量为2的样本,则样本均值的数学期望和方差是多少?(3)若采用不重复抽样的方法从该总体中抽取样本量为2的样本,计算所有可能样本的及
15、,计算E()并与第二问作比较。4.3 某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(百斤)标准差为200(百斤)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?4.4 某地区工人的平均工资是15元/小时,标准差为4元/小时。若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?第5章 参数估计5.1 一家
16、调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在95的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比例进行区间估计。5.2 为了确定某大学学生配戴眼镜的比例,调查人员欲对该大学的学生进行抽样调查。而根据以往的调查结果表明,该大学有75的学生配戴眼镜。则对于边际误差E分别为(1)5;(2)10;(3)15时,抽取的样本量各为多少较合适?()5.3 为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均
17、值为6.75小时,样本标准差为2.25小时。(1)试对家庭每天平均看电视时间进行区间估计。(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在第一问的水平,问此时需调查多少户才能满足要求?()5.4 据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比例p的区间估计,在置信水平为下,其边际误差E0.08。则:(1)这80名受访者样本中为本地购房者的比例p是多少?(2)若置信水平为,则要保持同样的精度进行区间估计,需要调查多少名购房者。5.5 为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的柜
18、台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为12分钟,样本标准差为s=4.1分钟,则:(1)其95的置信区间是多少?(2)若样本容量为40,而观测的数据不变,则95的置信区间又是多少?第6章 假设检验6.1 电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定的标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命1245小时。能否说该厂的显像管质量显著地高于规定的标准?(1) 给出上题的原假设和被择假设。(2) 构造适当的检验统计量,并进行假设检验,分析可能会犯的错误(取0.05)。
19、(3) 若要拒绝原假设,样本平均寿命至少要达到多少,此时可能会犯哪类错误,大小如何?6.2 由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂家必须确信其所推荐新的生产方法能降低成本。目前生产中所用的生产方法成本均值为每小时200元。对某种新的生产方法,测量其一段样本生产期的成本。(1) 在该项研究中,建立适当的原假设和备择假设。(2) 当不能拒绝时,试对所做的结论进行评述。(3) 当可以拒绝时,试对所做的结论进行评述。6.3 某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。从过去的资料知是0.6克,质检员每2小时抽取25包冲剂称重检验,并作出是否
20、停工的决策。假定产品重量服从正态分布。(1) 建立适当的原假设和备择假设。(2) 在0.05时,该检验的决策准则是什么?(3) 如果12.25克,你将采取什么行动?(4) 如果11.95克,你将采取什么行动?6.4 某厂生产需用玻璃纸作包装,按规定供应商供应的玻璃纸的横向延伸率不应低于65。已知该指标服从正态分布,一直稳定于5.5。从近期来货中抽查了100个样品,得样本均值55.06,试问:(1) 在0.05水平上能否接收这批玻璃纸,并分析检验中会犯哪类错误。(2) 抽查的100个样本的样本平均值为多少时可以接收这批玻璃纸,此时可能犯的错误属于哪种类型?6.5 已知某种零件的尺寸服从正态分布,
21、现从一批零件中随机抽取16只,测得其长度(厘米)如下:15.1 14.5 14.8 14.6 15.2 14.8 14.9 14.614.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7(1)若要求该种零件的标准长度应为15毫米,检验这批零件是否符合标准要求?(0.05)(2)若已知方差为0.09,问该批零件是否符合标准要求。6.6 某灯泡厂灯泡的合格标准为灯泡的使用寿命至少为1000小时,现从该厂生产的一批灯泡中随机抽取15只,测得其寿命(小时)如下:1040 990 964 945 1026 933 987 1036995 948 1014 931 1045 101
22、0 1004假定灯泡寿命服从正态分布,取显著性水平为0.05,试考虑分别用左侧检验和右侧检验来验证该厂声称“灯泡平均使用寿命在1000小时以上”这一说法是否成立?6.7 某洗涤剂厂有一台瓶装洗洁精的灌装机,在生产正常是地,每瓶洗涤洁精的净重服从正态分布,均值为454g,标准差为12g。为检查近期机器是否正常,从中抽出16瓶,称得其净重的平均值为456.64g。(1) 试对机器正常与否作出判断。(取0.01,并假定不变)(2) 若标准差未知,但测得16瓶洗涤洁精的样本标准差为s12g,试对机器是否正常作出判断。(取0.01)6.8 某厂产品的优质品率一直保持在40,近期技监部门来厂抽查,共抽查了
23、15件产品,其中优质品为5件,在0.05水平上能否认为其优质品率仍保持在40%?6.9 为了评价两家旅游服务企业的服务质量,分别在两个企业抽取样本,在A企业随机抽取30名顾客,在B企业随机抽取40名顾客,让他们分别对服务质量进行打分,评分标准是0100分。顾客给出的服务质量评分如下表。企业A企业B70978587647376915762898293648690828392748078995979827085729476897388838778848470797291798476878891937585657479648578838491748466668578837574假设企业A服务质量评分
24、的方差为64,企业B拂去质量评分的方差为100。使用Excel检验两个企业的服务质量是否有显著差异?()6.10 某企业管理人员对采用两种方法组装新产品所需的时间(分钟)进行测试,随机抽取6个工人,让他们分别采用两种方法组装同一种产品,采用方法A组装所需的时间和采用方法B组装所需的时间如下表。假设组装的时间服从正态分布,以的显著性水平比较两种组装方法是否有差别。方法A方法B8.29.55.38.36.57.55.110.99.711.310.89.3第7章 方差分析与试验设计7.1 为检验不同品牌电池的质量,质检部门抽检了3家生产商生产的5#电池,在每个厂家随机抽取5个电池,测得使用寿命(小时
25、)数据如下:试验号电池生产商生产商A生产商B生产商C12345505043403932283034264542384840用Excel输出的方差分析表如下:方差分析:单因素方差分析SUMMARY组计数求和平均方差列 1522244.428.3列 251503010列 3521342.615.8方差分析差异源SSdfMSFP-valueF crit组间 307.8 0.000313.88529组内216.4 总计 14(1)将方差分析表中划线部分所缺的数值补齐。(2)分析三个生产商生产的电池的平均寿命之间有无显著差异()?(3)如果有差异,到底是哪些生产商之间有差异?7.2 某生产厂家开发了一种
26、新的家庭用供水净化器,其元件需要从几个供应商处购买,然后由工厂组装这些元件。为了确定一种最佳的装配方法,以取得最大的生产数量,工厂准备采用A1、A2、A3三种方法进行组装。为比较不同方法的优劣,随机抽取技术水平比较接近的5名工人,然后由这5 名工人分别按三种方法组装产品。表9.1是5名工人一天组装的产品数量(单位:个): 5名工人一天组装的产品数量(个)工人序号组装方法(A)A1A2A312345425044414828363230344142435252试分析组装方法对组装产品的数量是否有显著影响?()7.3 为研究食品的包装和销售地区对其销售量是否有影响,在某周的三个不同地区中用三种不同包
27、装方法进行销售,获得的销售量数据如下:销售地区(A)包装方法(B)B1B2B3A1A2A3455035755065304050取显著性水平,检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响?7.4 5中不同品牌的鲜牛奶在不同的超市上出售。为研究不同品牌的牛奶销售量是否有差异,随机抽取了8家超市,记录了一周中各品牌牛奶的销售量数据(单位:箱。每箱30袋,每袋500克),结果如下: 品牌商场12345678A17173666958607061A27178818978859084A37378768674808176A47375738075717372A56266698160646157取
28、显著性水平,用Excel输出的方差分析表如下:方差分析:无重复双因素分析差异源SSdfMSFP-valueF crit行(品牌)17604 0.00002.7141列(商场)5207 0.00532.3593误差55228 总计283239(1) 在方差分析表中划线部分填上所缺的数值。(2) 分析品牌和商场对牛奶销售量是否有影响?第8章 相关与回归分析8.1 为了了解某班的学习效率,调查了该班中的14名同学的每天的自习时间和他们的数学成绩。如下表:学生编号每天自习时间(小时)x数学成绩y学生编号每天自习时间(小时)x数学成绩y15.29180.95521.96591.76933.780101.
29、26044.386113.17553.172122.97562.677133.47971.364144.887(1)绘制散点图,并判断两个变量之间的关系形态。(2)计算线性相关系数,并对相关系数的显著性进行检验。说明两者之间关系的密切程度。()8.2 下表中所列数据为我国23个城市2001年的经济指标数据。城市固定资产投资总额(亿元)xGDP(亿元)y1工业总产值(亿元)y2152.9589104.820887.1815268.9508485.6173285.1619369.2708104.487584.6394472.1010145.6452100.1338597.3925211.11881
30、24.58266122.7084386.3400332.13197124.3629363.4412355.33528140.5708315.0000251.78899146.7685302.7470258.849410172.4216348.7465396.522811178.7947828.1974640.050312184.2512558.3268803.287713199.25651003.0125953.592114207.76321074.2289787.443815253.05861235.64001103.927516256.9496733.8500482.610517257.8
31、5581066.2000786.701118258.17241085.4284860.867219263.9050673.0627411.003020279.8029728.0774370.028121283.55811236.4727757.186722293.47281316.08461671.746423311.77811120.1156527.6195(1)请分别绘制固定资产投资总额对GDP及工业总产值的散点图,并观察它们之间属于什么关系。(2)分别计算两对变量间的相关系数,看看哪组变量的相关性强,并对相关系数进行显著性检验。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际
32、意义。并计算判定系数,并解释其意义。(4)检验回归方程的线性关系的显著性()。(5)求当固定资产投资总额为400亿元时GDP和工业总产值的置信区间和预测区间。8.3 研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:受教育年数x年薪(万元)y受教育年数x年薪(万元)y83.0073.1262.00106.4030.34138.5451.6441.2194.3040.9430.51114.64(1)作散点图,并说明两变量之间的关系。(2)用最小二乘法估计回归方程的参数,并对参数进行显著性检验。(3)当受教育年数为15年时,试对其
33、年薪进行置信区间和预测区间估计(取)。8.4 计量经济学中的柯布道格拉斯生产函数的有关理论认为一地区的经济增长率同该地区的劳动力增长率和投资增长率成线性相关关系。下表中的数据为某地区的GDP年增长率、就业人数年增长率和投资年增长率。年份GDP年增长率投资增长率劳动力增长率199113.83%0.24%0.33%199215.85%0.57%0.36%199312.79%0.72%0.49%199414.35%0.64%0.59%199515.63%0.95%0.72%199621.23%1.02%0.77%199713.74%1.09%0.64%199820.02%1.31%1.15%1999
34、24.38%2.28%1.29%(1)请以该地区的GDP的年增长率为因变量,以就业人数年增长率或投资的年增长率为自变量建立回归模型,并作相应的检验。(2)再以该地区的GDP的年增长率为因变量,以就业人数年增长率和投资的年增长率为自变量建立回归模型,并作相应的检验。(3)比较以上所作的两个模型的拟合效果。第9章 时间序列分析9.1 我国1998年到2001年房地产行业投资总额如下:指标1998199920002001投资总额(亿元)I3614.23累积增长量(亿元)D 1369.82环比增长率Y13.53%27.29%资料来源:中国统计年鉴2002,北京,中国统计出版社,2002。(1)将上面的
35、表格填完整。(2)计算投资额的年平均增长量。(3)计算投资的定基增长率和平均环比增长率,并根据平均增长率预测2002年和2003年的投资总额。9.2 我国1990年到2001年职工平均工资指数如下表所示:年份平均工资指数(环比)年份平均工资指数(环比)1990112.70%1996112.10%1991112.60%1997103.60%1992118.50%1998100.20%1993124.80%1999106.20%1994135.40%2000107.90%1995121.70%2001111.00%(1)试绘制时间序列图,并描述其变化趋势。(2)采用5期移动平均法描述该时间序列的平
36、均趋势,作趋势图,并与原时间序列图比较。9.3 以下数据为我国GDP的定基发展速度(以1978年GDP为基数),年份GDP指数年份GDP指数1978100.00%1990283.00%1979107.60%1991308.80%1980116.00%1992352.20%1981122.00%1993398.40%1982133.30%1994448.70%1983148.20%1995489.10%1984170.90%1996536.80%1985193.50%1997582.90%1986209.90%1998628.40%1987234.10%1999673.50%1988260.50
37、%2000730.10%1989271.50%2001781.20%资料来源:中国统计年鉴2002,北京,中国统计出版社,2002。(1)根据以上数据绘制时间序列图,并观察其发展趋势。(2)根据时间序列图的形状特点配合适当的曲线进行拟合。9.4 某研究机构调查了某市人均旅游支出的年度数据,如下:年份人均旅游支出年份人均旅游支出198799.831995516.32198894.031996539.861989170.401997665.701990232.811998883.991991269.941999908.571992323.6220001060.811993284.782001140
38、5.231994390.74(1)绘制时间序列图,并说明其变化趋势特点。(2)选择恰当的方程对曲线进行拟合,并用拟合的曲线对2002年的旅游支出进行预测。9.5 下表中的数据为我国餐饮业1997年到2002年各季度的销售额。单位:亿元季度1997年1998年1999年2000年2001年2002年第一季度538.1629.97732.4873.761010.261176.74第二季度567.1639.97715.62847.97981.21132.09第三季度598.1684.87770.64906.231049.951223.17第四季度730830.97958.821109.931293.021520.11资料来源:中国市场统计年鉴,北京,中国统计出版社,1998年2003年。(1)绘制该序列的时间序列图,并观察其变化特点。(2)试对该时间序列进行分解。第10章 统计指数10.1 下表为越南1999年和2000年咖啡种植面积和产量的统计资料:地区亩产量播种面积1999年2000年19