《统计学课后习题答案统计学第三版_高等_袁卫、庞皓、曾五一、贾俊平.pdf》由会员分享,可在线阅读,更多相关《统计学课后习题答案统计学第三版_高等_袁卫、庞皓、曾五一、贾俊平.pdf(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1章绪论1 .什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。3.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了 50罐油漆,每一罐的质量精确到4 位小数。装满的油漆罐应为4.536 kg。要求:(1)描述总体;(2)描述研究变量;(3)描述样本:(4)描述推断。答:(1)总体:最近的个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4
2、.536X50=226.8 kg。4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了 1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A 品牌或B 品牌中哪个口味更好。要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好
3、。第2章统计数据的描述练习题 1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下BECcADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDAcBCDECEBBEcCADCBAEBAcDEABDDCADBCCAEDCBCBCEDBCCBC(1)指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3)绘制一张条形图,反映评价等级的分布。解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序
4、数据。(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家 庭 数(频数)频率A1414B2121C3232D1818E1515合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复 制 到E x ce l表中,点击:图表向导f条形图一选择子图表类型f完成(见E xcel练习题2.1)。即得到如下的条形图:2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123
5、115119138112146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万 125万元为良好企业,105万 115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为1 5 2,最小的为8 7,知数据全距为15287=65:为便于计算和分析,确定将数据分为6组,各组组距为1 0,组限以整10划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,
6、最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按 照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,也可以用E xcel进行排序统计(见E xcel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数4 0,得到各组频率,填入表中第三列:在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下512.5512.54
7、0100.0100-110922.51435.03587.5110-1201230.02665.02665.0120130717.53382.51435.0130140410.03792.5717.5140以上37.540100.037.5合计40100.0(2)按题目要求分组并进行统计,得到分组表如下:某管理局下属40个企分组表按销售收入分组(万元)企 业 数(个)频 率()先进企业1127.5良好企业1127.5一般企业922.5落后企业922.5合计40100.0 3.某百货公司连续40天的商品销售额如下(单位:万元):4125294738343038434046364537373645
8、4333443528463430374426384442363737493942323635根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:全部数据中,最大的为4 9,最小的为2 5,知数据全距为49-25=24;为便于计算和分析,确定将数据分为5 组,各组组距为5,组限以整5 的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值4 9 已落在最大组之中,故将各组均设计成闭口形式;按 照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数天数,(见 Excel练习题2.3)并填入表内,得到频数分布表如下表中的
9、左两列;将各组天数除以总天数4 0,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频 数(天)频 率()2530410.03035615.035401537.54045922.545 50615.0合计 40 100.0直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导一柱形图f选择子图表类型f完成。即得到如下的直方图:(见E xcel练习题2.3)4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如 J_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
10、 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _7007167287196857096916847057187067157127226917086906927077017087296946816956857066617356656687106936976746586986666966987066926917476996826987007107226946907366896966516737497087276886896836857027416987
11、13676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。解:(1)排序:将全部数据复制到E xcel中,并移动到同一列,点击:数 据 排 序 一确定,即完成数据排序的工作。(见E xcel练习题2.4)(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见E xcel练习题2.4)_100
12、只灯泡使用寿命非频数分布_ _ _ _ _ _ _ _ _ _ _按使用寿命分组(小时)灯泡个数(只)频 率()650-66022660 67055670-68066680-6901414690-7002626700-7101818710-7201313720-7301010730-7403333740750合计 100 100制作直方图:将上表(包含总标题,去掉合计栏)复制到E xcel表中,选择全表后,点击:图表向导一柱形图一选择子图表类型一完成。即得到如下的直方图:(见E xcel练习题2.4)100只灯泡使用寿命非频数分布灯泡个数 100只灯泡使用寿命非频数分布频 率(%)(3)制作茎
13、叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:65 1 86667686970717273742 3 3 3 4 5 5 5 8 8 90 0 1 1 1 10 0 1 1 2 20 0 2 2 30 1 2 2 595 5 6 6 6 7 7 8 8 8 8 9 97 8 8 8 91 4 5 6 81 3 4 6 7 91 13 5 61 4 72 2 2 3 3 4 43 4 5 6 6 6 73 5 6 7 76 7 8 9 98 8 9 5.下面是北方某城市12月份各天气温的记录数据:_ _ _ _ _
14、 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _将直方图与茎叶图对比,可见两图十分相似。-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5(1)指出上面的数据属于什么类型;(2)对上面的数据进行适当的分组;(3)绘制直方图,说明该城市气温分布的特点。解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。
15、(2)分组如下:由于全部数据中,最大的为9,最小的为-2 5,知数据全距为9一(-2 5)=34;为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值一25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按 照“上限不在组内”的原则,用划记法(或E xcel排序法,见E xcel练习题2.5)统计各组内数据的个数天数,并填入表内,得到频数分布表如下表;北方某城市12月份各天气温分组天 数(天)-25-208-20-158-15-1010-10-514-5-0140 545 107合计
16、65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到E xcel表中,点击:图表向导f柱形图f选择子图表类型f完成。即得到如下的直方图:(见E xcel练习题2.5)北方某城市1 2月份各天气温天数(天)6.下面是苫考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄 1819 2121 2224 2529 3034 3539 4044 4559%1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2(1)对这个年龄分布作直方图;(2)从直方图分析成人自学考试人员年龄分布的特点。解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导一柱
17、形图一选择子图表类型f完成。即得到如下的直方图:(见E xcel练习题2.6)%(2)年龄分布的特点:自学考试人员年龄的分布为右偏。7.下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1
18、)将两个班的考试成绩用一个公共的茎制成茎叶图;(2)比较两个班考试成绩分布的特点。解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:A班树茎B班数据个数树 叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。8.1997年我国几个主要城市各月份的
19、平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相兴湿度的分布特征。_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _月份 北 京S wi FTii S 西安资料来源:中国统计年鉴1998,中国统计出版社1998,第 10页。解:箱线图如下:(特征请读者自己分析)14970765777727965516724168715775808365416734750776881808158497445039726775847961467
20、0555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272 9.某百货公司6 月份各天的销售额数据如下(单位:万元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295(1)计算该百货
21、公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见 Excel练习题2.9)-8223 0 x=-=-=274.1(万兀)30或点选单元格后,点 击“自动求和”一“平均值”,在 函 数 EVERAGEO的空格中输 入“A l:A30,回车,得到均值也为274.1。在 Excel表中将3 0 个数据重新排序,则中位数位于3 0 个数据的中间位置,即靠中的第15、第 16两个数272和 273的平均数:“,272+273 一、Me=-=272.5(万兀)2
22、由于中位数位于第1 5 个数靠上半位的位置上,所以前四分位数位于第1 第 15个数据的中间位置(第 8 位)靠上四分之一的位置上,由重新排序后的E x c e l 表中第8 位是2 61,第 1 5位是2 72,从而:2 73 2 72QL=261+-=2 61.2 5(万元)4同理,后四分位数位于第1 6 第 3 0 个数据的中间位置(第 2 3 位)靠下四分之的位置上,由重新排序后的E x c e l 表中第2 3 位是2 91,第 1 6位是2 73,从而:Q u=2 91,74?7?-=2 90.75(万元)。4(2)未分组数据的标准差计算公式为:30 _(巧-X)2f=ln-1利用上
23、公式代入数据计算是个较为复杂的工作。手工计算时,须计算3 0 个数据的离差平方,并将其求和,0 再代入公式计算其结果:得 S=2 1.1 74 2。(见 E x c e l 练习题2.9)我们可以利用E x c e l 表直接计算标准差:点选数据列(A 列)的最末空格,再点击菜单栏中“Z”符号右边的小三角“二 选择“其它函数”一选择函数“S T D E V”一“确定”,在出现的函数参数窗口中的N u m be r l 右边的空栏中输入:A 1:A 3 0,一“确定”,即 在 A 列最末空格中出现数值:2 1.1 74 1 2,即为这 3 0 个数据的标准差。于是:5=2 1.1 7(万元)。(
24、见 E x c e l 练习题 2.9)10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为X,产量为人 则总成本为犷;产品名称单位成本(元)总 成 本(元)甲企业乙企业A1 52 1 0 03 2 55B2 03 0 0 01 50 0C3 01 50 01 50 0-V V 总成本由于:平均成本=4 二=餐含,而已知数据中缺产量/的数据,总产量又 因 个 别 产 品 产 量 片 春从 而 1=27,于是得:Y x f甲企业平均成本2100+3000+15002100 3000 1500-+-+-=1 9.4 1 (元),1
25、52030 人“丁3 田 E V 3255+1500+1500,一、乙企 也平均成本=一/-左;而一TE7而=18.29(兀),Ext 3255 1501 0 1510 0 x-15-20-30对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。11.在某地区抽取的120家企业按利润额进行分组,结果如F:按利润额分组(万元)企 业 数(个)200 30019300 40030400 50042500 60018600以上11合计120计 算 120家企业利润额的均值和标准差。解:设各组平均利润为x,企业数为
26、了,则组总利润为以;由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:组中值 企 业 数(个)总利润才女利泗欲zT里(刀兀)Xfxf200 300250194750300 4003503010500400 5004504218900500 600550189900600以上650117150合计12051200于是,120家企业平均利润为:-2切 _ 51200 4,*一、x=-426.67(万兀);E/120分组数据的标准差计算公式为:Z(x,-x)2 /手动计算须列表计算各组数据离差平方和(x426.67)人 并 求 和,再代入计算公式:列表计算如下组中值X企 业 数(个)/
27、-“一 426.67)25019593033.489135030176348.6674504222860.133855018273785.200265011548639.1779合计 120 1614666.668表格中(x426.67方的计算方法:方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)*(a3-426.67)*b 3,回车,得到该行的计算结果;点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时.,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x426.67)V计算完毕;于是得标准差
28、:(见E xcel练习题2.11)J1614666.668V -1 2 0-1=116.48(万元)。点击第三列的合计单元格后,点 击 菜 单 栏 中 的 号,回车,即获得第三列数据的和。方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个X,120个数据生成后,点选A列的最末空格,再 点 击 菜 单 栏 中 符 号 右边的小三角“二 选 择“其它函数”一选择函数“STDEV”一“确定”,在出现的函数参数窗口中的N umberl右边的空栏中输入:A 1:A 30,一“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见E
29、 xcel练习题2.11)于是得标准差:s=116.4845(万元)。12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了 1000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?解:(1
30、)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?(2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之
31、间?解:(I)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:因为女生的离散系数为5 s 5V=0.1x 50男生体重的离散系数为S JV=0.0 8x 6 0对比可知女生的体重差异较大。(2)男生:_ 6 0 公斤,百、x=2 7.2 7 (磅),2.2 公斤=227(磅);女生:5 0 公斤=2 2.7 3 (磅),,=黑2(磅);X=l 2 6 8%;9 5%。(3)(4)14.对1 0 名成年人和1 0 名幼儿的身高(厘米)进行抽样调查,结果如下:成年组 1 6 6 1 6 9 1 7 2 1 7 7 1 8 0 1 7 0 1 7 2 1 7 4 1 6 8 1 7
32、 3幼儿组 6 8 6 9 6 8 7 0 7 1 7 3 7 2 7 3 7 4 7 5(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)利 用 Ex c e l 进行计算,得成年组身高的平均数为1 7 2.1,标准差为4.2 0 2,从而得:成年组身高的离散系数:匕=4匕 2=0.0 2 4;又得幼儿组身高的平均数为7 1.3,标准差为2.4 9 7,从而得:幼儿组身高的离散系数
33、:匕=上2 4 97=0.0 3 5 ;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取 1 5 个工人,让他们分别用三种方法组装。下面是1 5 个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C1 6 41 2 91 2 51 6 71 3 01 2 61 6 81 2 91 2 61 6 51 3 01 2 71 7 01 3 11 2 61 6 51 3 01 2 81 6 41 2 91 2 71 6 81 2 71 2 61 6 41
34、2 81 2 71 6 21 2 81 2 71 6 31 2 71 2 51 6 61 2 81 2 61 6 71 2 81 1 616 616 512 513 212 612 5(1)你准备采用什么方法来评价组装方法的优劣?(2)如果让你选择种方法,你会作出怎样的选择?试说明理由。解:(1)下表给计算出这三种组装方法的一些主要描述统计量:评价优劣应根据离散系数,据上得:方法A方法B方法C平均16 5.6平均12 8.7 3平均12 5.5 3中位数16 5中位数12 9中位数12 6众数16 4众数12 8众数12 6标准偏差2.13标准偏差1.7 5标准偏差2.7 7极差8极差7极差1
35、2最小值16 2最小值12 5最小值116最大值17 0最大值13 2最大值12 82 13方法A 的离散系数VA=0.0 12 9,165.6方法B的离散系数VB=5=o.oi3 6128.73方法C的离散系数V c=2 77 =0.0 2 2 1;125.53对比可见,方法A 的离散系数最低,说明方法A 最优。(2)我会选择方法A,因为方法A 的平均产量最高而离散系数最低,说明方法A 的产量高且稳定,有推广意义。16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了
36、 2 0 0 种商业类股票和2 0 0 种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计测度值来反映投资的风险?(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?-30 0 30 60-30 0 30 60收 益 率 收 益 率(a)商业类股票(b)高科技类股票解:(1)方差或标准差;(2)商业类股票;(3)(略)。17.F图给出了 2 0 0 0 年美国人口年龄的金字塔,其绘制方法及其数字说明与【例 2.10】相同
37、,试对该图反映的人口、政治、社会、经济状况进行分析。频数2000年美国人口年龄结构金字塔-2 0-1 09 5-9 9(0 1-0 5)9 0-9 4(0 6-1 0)8 5-8 9(1 1-1 5)8 0-8 4(1 6-2 0)7 5-7 9(叫 2 5)7 0-7 4(20)=1 -P g 0)=1 -0.99842=0.00158(3)支付保险金额的均值=50000义演=50000X20000X 0.0005(元)=50(万元)支付保险金额的标准差=50000义 型)=50000 X(20000 X 0.0005 X 0.9995严=158074(元)10.对上述练习题3.09的资料,
38、试问:(1)可否利用泊松分布来近似计算?(2)可否利用正态分布来近似计算?(3)假如投保人只有5000人,可利用哪种分布来近似计算?解:(1)可以。当很大而p 很小时,二项分布可以利用泊松分布来近似计算。本例中,X=wp=20000 x0.0005=10,即有X P(10)。计算结果与二项分布所得结果几乎完全一致。(2)也可以。尽管p 很小,但由于非常大,叩和利-切都大于5,二项分布也可以利用正态分布来近似计算。本例中,np=20000 X 0.0005=10,np(1-p)=20000 X 0.0005 X(1-0.0005)=9.995,即有X N(10,9.995)。相应的概率为:P(X
39、 10.5)=0.51995,P住 20.5)=0.853262。可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。(3)由于p=0.0005,假如片5 0 0 0,则 p=2.5 5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业
40、生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。解:(1)P(X 150)=P(Z -1.6667)=0.04779合格率为 1-0.04779=0.95221 或 95.221%。(2)设所求值为K,满足电池寿命在200土K 小时范围内的概率不小于0.9,即有:(|X 200K)=P|Z|=j 卷 N0.9K即:P Z 0.95,K/30-1.64485,故 K249.3456。3012.某商场某销售区域有6 种商品。假如每1 小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数
41、的最可能值是多少?(2)若该销售区域仅配有2 名服务员,则因服务员不足而不能提供咨询服务的概率是多少?解:设X=同一时刻需用咨询服务的商品种数,由题意有X B(6,0.2)(D X 的最可能值为:筋=(n+l)p=7X 0.2=l(取整数)2(2)尸(X 2)=1 P(X 2)=1 0.240.86-4*=o=1-0.9011=0.0989第 4 章 抽样与抽样分布练习题(全免)1.个具有=6 4 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。(1)给出元的抽样分布(重复抽样)的均值和标准差描述亍的抽样分布的形状。你的回答依赖于样本容量吗?计算标准正态z统计量对应于5=15.5的
42、值。(4)计算标准正态z统计量对应于亍=23的值。解:已 知 n=6 4,为大样本,U =20,o=16,在重复抽样情况下,x 的抽样分布的均值为a.20,2 b.近似正态 c.-2.25 d.1.502 .参考练习4.1求概率。(Dx 23;于25;(4).三落在16和 22之间;于14。解:a.0.0228 b.0.0668 c.0.0062 d.0.8185 e.0.00133.一个具有=100个观察值的随机样本选自于 =3 0、b =16的总体。试求下列概率的近似值:(1).(土228);(22.1 WMW 26.8);尸GW 28.2):(4)尸(5 2 27.0)解:a.0.8 9
43、 4 4 b.0.0 2 2 8 c.0.1 2 9 2 d.0.9 6 9 94.一个具有n=9 0 0 个观察值的随机样本选自于=1 0 0 和。=1 0 的总体。你预计了的最大值和最小值是什么?你认为三至多偏离多么远?为了回答b你必须要知道吗?请解释。解:a.1 0 1,9 9 b.i c.不必5,考虑一个包含x的值等于0,1,2,9 7,9 8,9 9 的总体。假设X的取值的可能性是相同的。则运用计算机对下面的每个 值产生5 0 0 个随机样本,并对于每一个样本计算亍。对于每一个样本容量,构造方的5 0 0 个值的相对频率直方图。当值增加时在直方图上会发生什么变化?存在什么相似性?这里
44、=2,=5,=1 0,=3 0 和=5 0。解:趋向正态6.美国汽车联合会(AAA)是一个拥有9 0 个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1 9 9 9 年 5月,AAA通过对会员调查得知一个4 口之家出游中平均每日餐饮和住宿费用大约是2 1 3 美 元(旅行新闻Travel N ews,1 9 9 9 年 5月 1 1 日)。假设这个花费的标准差是1 5 美元,并且AAA所报道的平均每日消费是总体均值。又假设选取4 9 个 4 口之家,并对其在1 9 9 9 年 6月期间的旅行费用进行记录。描 述 三(样本家庭平均每I I 餐饮和住宿的消费)的抽样分
45、布。特别说明三服从怎样的分布以及亍的均值和方差是什么?证明你的回答;对于样本家庭来说平均每I I 消费大于2 1 3 美元的概率是什么?大于2 1 7 美元的概率呢?在 2 0 9 美元和2 1 7 美元之间的概率呢?解:a.正态分布,2 1 3,4.5 9 1 8 b.0.5,0.0 3 1,0.9 3 87 .技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为=4 0 6 克、标准差为b=1 0.1 克。监控这一过程的技术人者每天随机地抽取3 6 袋,并对每袋重量进行测量。现考虑这3 6 袋奶粉所组成样本的平均重量亍。(1)描述元的抽样分布,并给出工和b q 的值,以及概率分布的形
46、状;(2)求P W 4 0 0.8):(3)假设某一天技术人员观察到了=4 0 0.8 ,这是否意味着装袋过程出现问题了呢,为什么?解:a.4 0 6,1.6 8,正 态 分 布 b.0.0 0 1 c.是,因为小概率出现了8.在本章的统计实践中,某投资者考虑将1 0 0 0 美元投资于=5种不同的股票。每种股票月收益率的均值为=10%,标准差6 =4%。对于这五种股票的投资组合,投资者每月的收益率是不二2%。投资者的每月收益率的方差是b:=力=3.2,它是投资者所面临风险的一个度量。(1)假如投资者将1 0 0 0 美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?
47、请解释;假设将1 0 0 0 美元投资在另外1 0 种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。解:a.增加 b.减少9.某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840 牛顿,标准差1 5 牛顿。国际击剑管理组织(F I E)希望这些夹克的最低级别不小于80 0 牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了 5 0 个夹克作为一个随机样本进行定级,并计算元,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能己
48、经发生变化。如果该生产过程仍旧正常,则三的样本分布为何?假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值亍W830牛顿的概率是多少?在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?(4)现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了 45牛顿。在这种情况下方的抽样分布是什么?当无具有这种分布时,则于W830牛顿的概率是多少?解:a.正态 b.约等于0 c.不 正 常 d.正态,0.061 0.在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类
49、:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变 化(例如,产品的设计很差)。一个去除了质量变化的所有特殊原因的生产过程被称为是想定的或者是正统力控制中的.剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便 可 减 少 变 化(Deming,1982,1986;De Vor,Chang,和Sutherland,!992)5.通常的做法是将产品质量的特征绘制到控制图匕然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选 =5 块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含
50、碱量的均值于描绘在下图中。假设这个过程是在统计控制中的,则亍的分布将具有过程的均值,标准差具有过程的标准差除以样本容量的平方根,今。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于的上下3 b q 的位置。假如于落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。当生产过程是在统计控制中时、肥皂试验样本中碱的百分比将服从=2%和cr=l%的近似的正态分布。升5 4 上控制修3 过段均值/1 下控 网0 2 4 6 10 12 14 16 1S 20 22 24时间/小时 假设=4,则上下控制极限应距离多么远?假如这个过程是在控制中,则亍落在控制极限之外的