《第四篇 数理统计模型.doc》由会员分享,可在线阅读,更多相关《第四篇 数理统计模型.doc(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、211第四篇 数理统计模型数理统计学的理论和方法与人类活动的各个领域在不同程度上都有关联,数理统计学是研究收集数据、分析数据并据以对所研究的问题作出一定的结论的科学和艺术,数理统计学所考察的数据都带有随机性(偶然性)的误差,一些随机现象的特征可以通过对统计数据的整理与加工得到体现,数理统计的应用基础是抽样分布,特别是正态总体的抽样分布是统计推断的理论基础。在数理统计的应用实例中,通过对应用问题建模主要培养统计数据的处理和分析以及根据统计数据进行统计推断的方法,根据统计数据进行相关分析和回归分析的方法。应用数理统计方法解决问题首先要对统计数据进行处理和加工,熟悉相关的抽样分布。与统计数据的处理和
2、抽样分布相关的应用实例有:统计数据的整理与加工,彩电色彩的质量分布,根据统计数据估计吉尼(Gini)系数,正态总体样本方差服从卡方分布并且与样本均值相互独立,正态总体样本标准差不是总体标准差的无偏估计量等。S数理统计的主要任务是统计推断,包括统计估计和统计检验,是根据统计数据对未知的随机现象进行统计推断,在质量管理与控制等方面有着重要的应用。与统计估计相关的应用实例有:参数估计方法在捕鱼问题中的应用,平均值的质量控制图,概率论在产品质量验收抽样方案确定中的应用。与统计推断相关的应用实例有:实际推断原理小概率事件原理,改变包装能使销售量增加吗?成对比较与成组比较,葡萄酒质量的评价,刀具寿命的“正
3、态拟合”,保险实务中损失分布的统计分析等。相关分析是用来分析变量间关系与方向程度的方法,回归分析是用来分析自变量与应变量之间的数量关系,二者既有联系又有区别,在研究变量之间的非确定性关系中有重要的作用。关于相关分析与回归分析的应用实例有:手掌“生命线”的长度并不反映人的寿命,一元线性回归在季节波动预测中的应用,输电线路有功潮流值与发电机组出力的多元线性回归等。2124.1 统计数据的整理与加工上海证券交易所将每天各种股票的交易价格概括为一个综合指数,称为“上证指数”,如果今天的上证指数为,而上一个交易日的上证指数为,则称为上证iy1iy1iiiyyx指数的涨跌值。下面的数据是上海证券交易所19
4、95年头50个交易日上证指数涨跌的观测值(摘自新民晚报):)50, 2 , 1(ixi13.93,-6.92,-6.13,-14.79,-15.70,-2.83,-11.01,-4.28,-9.03,-0.87,5.70,-21.92,-0.48,-17.80,-5.87,8.20,-2.67,-28.87,-1.23,1.26,19.61,-11.98,7.46,-0.73,-5.27,-4.47,-4.61,1.20,6.18,53.50,-5.51,2.84,-7 .3012.01,7.70,3.89,16.37,39.08,16.66,-12.15,-15.22,-0.06,2.01,
5、-30.1915.64,7.28,13.64,-8.07,6.50,21.75。经计算,样本均值,样本36.41501 iix44.113975012 iix 5018272. 0501iixx方差,样本标准差为。总起来看,这段时9026.23150491501222 iixxS2284.15S间,股市不太景气,平均每个交易日下跌0.8272点。应用EXCEL中数据分析,进行描述性统计,输出结果见表4.1.1。表4.1.1 50个交易日上证指数涨跌的观测值的描述性统计平均值-0.8272标准差15.2283区域84.2观测数50标准误差2.1536方差231.9026最小值-30.7最大(1)
6、53.5中位数-1.95峰度2.8306最大值53.5最小(1)-30.7众数无偏度1.0575求和-41.36置信度(95.0%)4.3278为了研究这段时间上海证券交易所股市的变化动态,要对统计数据进一步研究。由于上证指数的涨跌值是一个连续型随机变量,因而我们采用分组方法进行整理,见表X4.1.2。表4.1.2 分组整理数据区间频数in频率if累积频率iF41.4710.021.00 由整理的数据,我们可以作出频数(频率)直方图和累积频率直方图(见图 4.1.1) 。把频率直方图中各个小矩形顶边的中点连接起来,就得到频率分布曲线,它的极限就是随机变量的概率密度函数。由累积频率所描述的累积频
7、率曲线,它称为样X)(xf)(xFn本分布函数或经验分布函数,它的极限就是随机变量的分布函数。由此我们可以X)(xF研究随机变量的分布规律,为证券投资决策提供可靠的理论依据。X图 4.1.1 频率直方图与累积频率折线图评注评注1理论依据根据样本作描述性统计,作频率直方图观察密度函数的大致类型,作累积频率折线图,研究分布函数。2应用与推广样本的分布完全是由总体的分布来决定的。但在数理统计中,总体的分布往往是未知的,一般做法就是要通过样本找到一个分布来近似代替总体的分布;或者说根据样本对总体进行统计推断。因此,对样本数据进行必要的处理和分析,作描述性统计是一些基本做法。参考文献参考文献茆诗松等.概
8、率论与数理统计M.中国统计出版社.2000.7.4.2 彩电色彩的质量分布SONY 牌彩电有两个产地:日本与美国。两地的工厂是按同一设计方案和相同的生产线生产同一牌号 SONY 电视机,连使用说明书和检验合格的标准都是相同的。譬如彩电的彩色浓度 Y 的目标值为,公差m214(允许的波动)为 5,当 Y 在公差范围内该彩电的彩色浓度为合格,否则判5, 5mm为不合格。图 4.2.1 彩电质量分布图两地产的 SONY 牌彩电在美国市场上都能买到,到 70 年代后期,美国消费者购买日本产的 SONY 彩电的热情高于购买美国产的 SONY 彩电。这是什么原因呢?1979 年 4月 17 日日本朝日新闻
9、刊登了这一问题的调查报告,报告指出:日产的彩色浓度服1Y从正态分布,而美产的彩色浓度为均匀分布。这两个不同 235,mN2Y)5, 5(mmU的分布表示着两个不同的总体,如图 4.2.1。这两个总体的均值相同,都为,但方差不m同。,78. 235)(21 YVar67. 1)(1Y,33. 81210)(22YVar89. 2)(2Y可见,日产的彩色浓度方差小于美产的彩色浓度的方差。如果规定彩色浓度在内为等品,在内为等品,在),(mm2,2(mmmm内为等品,在内为等品,3,22,3(mmmm,33,(mm从而在级品数量上日产 SONY 是美产 SONY 的两倍,如表 4.2.1,这就是美国消
10、费者乐于购买日产 SONY 的主要原因。表 4.2.1 美产和日产各等级彩电的比率等级美产33.3%33.3%33.3%0日产68.3%27.1%4.3%0.3%为什么两个工厂按同一个设计方案、相同设备生产同一种电视机,其彩色浓度会有不同的分布呢?关键在于管理者,美国 SONY 生产厂的管理者按彩色浓度合格范围-6-4-2246日产 SONY-0.10.10.20.30.40美产 SONY215要求操作,在他看来,只要彩色浓度在此范围内,不论它在区间的什么位置5, 5mm 都认为合格,因而造成彩电浓度落在这个区间内任一相同长度小区间内的机会是相同的,从而形成均匀分布。但日产 SONY 的管理者
11、认为,彩色浓度的最佳位置在)5, 5(mmU上,他要求操作者把彩色浓度尽量向靠近,这样一来,彩色浓度在周围的机会就mmm多,而远离的机会就少,最后导致服从正态分布。m 235,mN评注评注1理论依据随机变量的方差反映了随机变量关于其数学期望的离散程度。方差越小,质量越稳定。2应用与推广随机变量的方差在质量控制方面有着重要的应用。尽管日产 SONY 牌彩有 0.3%的等品,但其等品率远远超过美产 SONY 牌彩电。在质量管理与质量控制过程中,往往根据产品质量指标的标准差为依据。参考文献参考文献茆诗松等.概率论与数理统计M.中国统计出版社.2000.7.4.3 根据统计数据估计吉尼(Gini)系数
12、收入的差异是反映社会收入分配是否公平的重要指标。一般说来,鼓励自由竞争会扩大收入差异,但是政府可以通过税收政策和对低收入者的补助来缩小收入的差异。下面介绍的洛伦兹(Lorenz)曲线是反映收入差异的一种图形描述,它可以用来对各国的收入差异程度进行比较或对政府的某项政策对收入分配带来的影响作出评价。现有30个工人家庭月收入(元)的数据,从低到高列表如表4.3.1。表4.3.1 30个工人家庭月收入的数据 单位:元编号收入编号收入编号收入编号收入编号收入1165071900132100192430252860217008192014215020250026292031800919401522002
13、12550273000418201019801622502226802832205183011202017230023280029358061880122080182350242820304010表4.3.2 每组家庭的户数和收入的累积值及百分比累积值组号户数累积百分比组内收入收入累积收入累积百分比2161(16户)20%106801068014.99% 2(712户)40%118402252031.61% 3(1318户)60%133503587050.35% 4(1924户)80%157805165072.50% 5(2530户)100%1959071240100%把这30个家庭按顺序分成
14、相等户数的5组,然后统计出每组家庭的收入总数以及户数和收入的累积值及百分比累积值如表4.3.2所示:若用横坐标表示户数累积百分比,纵坐标表示收入累积百分比,则最低收入组6户占总户数的20%,该组家庭的总收入占全部家庭总收入的14.99%,将坐标点(20%,14.99%)描在图上A点;最低收入户和偏低收入户共12户,占总户数的40%,它们的收入之和占30户家庭总收入的31.61%,将坐标点(40%,31.61%)描在图上B点,类似地得到C点(60%,50.35%) ,D点(80%,72.50%) ,E点(100%,100%) 。将这些点连成一条光滑的曲线,便得到洛伦兹曲线,它是一条向下凸的曲线,
15、如图4.3.1。 图4.3.1 绝对公平线与洛伦兹曲线图如果所有家庭的收入全部相等,则洛伦兹曲线为,这条线称为绝对平等线,所xy 以洛伦兹曲线描述了收入的不平等状况。由于收入是按从小到大的顺序排列的,所以洛伦兹曲线位于直线的下方,它越接近直线,收入就越平均;越向下方凸出,xy xy 则收入分配越不平均。记洛伦兹曲线为:,那么,与围成的弓形的面积越大的话,)(xLy xy )(xLy 则洛伦兹曲线越向下凸出,从而表明收入越不平均。为此,我们用该弓形面积与)(xLy ,和轴所围成的三角形面积(该三角形的面积等于)之比值xy 1xx21 1010)(2121)(21dxxLdxxL g作为一种度量收
16、入分配不平等的指标,称为吉尼(Gini)系数。可见,吉尼系数越接近于0,收入分配越公平,反之就越不公平。217吉尼(Gini)是意大利统计学家,他在1922年发表的有关收入集中指数的研究中指出了吉尼系数。由于吉尼系数与货币的选择无关,因此它特别适用于对不同国家不同时期的收入分配状况的比较。根据洛伦兹曲线,政府制定累进税收体系,使完税后的曲线与公平线接近一些,使吉尼系数更小一些,缩小收入的差距,使社会财富的分配更趋于公平。评注评注1理论依据根据人口和收入的样本进行统计分析,可以绘出洛伦兹曲线,进一步可以估计吉尼系数。2应用与推广根据经济统计数据,可以进行相关的统计分析。由此可以利用统计数据计算或
17、者估计诸如增长速度、吉尼系数、弹性系数等,为进一步分析奠定基础。参考文献参考文献缪柏其.管理统计学M.中国科学技术大学出版社.2002.9.4.4 正态总体样本方差服从卡方分布 并且与样本均值相互独立设是来自正态总体的一个样本,为样本均值,nXXX,.,21),(2N niiXnX11为样本方差。则: niiXXnS122)(11(1)) 1()(1) 1(212 222 nXXSnnii(2)与相互独立。22) 1( Sn X证明:考虑对样本作线性变换nXXX,.,21 XnXXXnZXnnnXXXnnZXXXXZXXXZXXZnnnnn).(11(1).() 1(1.433)(431322
18、)(32121 21211211432133212211 由于相互独立,且均服从正态分布,则可以证明nXXX,21),(2N), 0(21212 211NXXZ ), 0(322)(3212 3212NXXXZ ), 0(1(1).() 1(12 1211NXnnnXXXnnZnnn ),().(12 21nNXnXXXnZnn 218并且经过计算可知:,这说明相互独立。njijiZZCovji,.,2 , 1,0),( nZZZ,.,21 212 2212 2 12 22211)(1) 1( nniiniiniiZZXnXXXSn 211 niiZ 相互独立,且均服从正态分布,从而仍相互独1
19、21,., nZZZ), 0(2N121,., nZZZ立,均服从标准正态分布。所以,可以表示成个相互独立服从标准) 1 , 0(N22) 1( Sn 1 n正态分布的随机变量的平方和,因此。) 1() 1(2 22 nSn 又由于相互独立,及nnZZZZ,.,121 21122) 1( niiZSn nZnX1 故与相互独立22) 1( Sn X评注评注1理论依据正态总体样本的独立性,相互独立的正态随机变量的线性函数仍然服从正态分布,分布的构造。2 2应用与推广很多教科书上都有这个结论,但是都没有给出理论证明,而这个结论在正态总体的抽样分布中是极为重要的。同时,通过这个证明,充分表达了是个2
20、1122) 1(niiZSn 1n相互独立的标准正态分布随机变量的和,因此其自由度是。由于与相互独1n22) 1( SnX立,为进一步构造服从自由度为的 分布奠定基础,nXt1nt参考文献参考文献茆诗松等.概率论与数理统计M.中国统计出版社.2000.7.4.5 正态总体样本标准差S 不是总体标准差的无偏估计量设是来自正态总体nXXX,.,21219的一个样本,为样本均值,为样本方差。),(2N niiXnX11 niiXXnS122)(11众所周知,对任何总体来说样本方差是总体方差的无偏估计量,正态总体更不2S2 例外。但样本标准差却不是总体标准差的无偏估计量。S证明:由于,若令,则的概率密
21、度) 1() 1(2 22 nSn22) 1( SnY。 1(2nY函数为000 2121)(212121yyey n ypynn从而 dyey ndyypyYEynn 0212212121)(dyey nnn ynn 02122 2212122 2122nn另一方面,,所以有 SEnSnEYE11 nCnnnYEnSE1212 121所以,样本标准差却不是总体标准差的无偏估计量。S如果进行修正,则可以得到的无偏估计量,其中SCn22121 nn nCn评注评注1.理论依据正态总体样本的抽样分布,分布与分布的有关性质。2 被积函数是参数分别为和的伽玛分布的概率密度函数,积分等于 1。2n212
22、202.应用与推广无论总体服从什么分布,修正的样本方差是总体方差X niiXXnS122)(11的无偏估计量,但是样本标准差不是总体标准差的无偏估计量。只)(XDS)()(XDX 有在正态总体的情况下才有确定性的修正方法,使得是总体标准差的无偏估计量,SCn 对于非正态总体,情况极为复杂,一般不对其进行讨论。参考文献参考文献茆诗松等.概率论与数理统计M.中国统计出版社.2000.7.4.6 参数估计方法在捕鱼问题中的应用设湖中有鱼条,现捕出条,做上记号后放回湖中(假设记号不会消失),一段时间Nr后让湖中的鱼(做上记号的和没做记号的)混合均匀,再从湖中捕出 条,其中有s)(rs 条标有记号。试根
23、据这些信息,估计湖中鱼数的值。t)0(rt N1.根据概率的统计定义:湖中有记号的鱼的比例应是(概率) ,而在捕出的条中Nrs有记号的鱼为 条,有记号的鱼的比例是 (频率)。设想捕鱼是完全随机的,每条鱼被tst捕到机会都相等,于是根据用频率来近似概率的道理,便有即 st NrtrsN 故 (取最接近的整数) 。trsN 2.用矩估计法:设捕出的 条鱼中,标有记号的鱼为,因为服从超几何分布,而s11超几何分布的数学期望是。捕 条鱼得到有标记的鱼的总体平均数,而现在只NrsE)(1s捕一次,出现 条有标记的鱼,故由矩估计法,令总体一阶原点矩等于样本一阶原点矩,t即,于是也得(取最接近的整数) 。t
24、NrstrsN 3.根据二项分布与最大似然估计:若再加上一个条件,即假定捕出的鱼数与湖中的s鱼数的比很小,即,这样的假定对实际来说一般是可以满足的,这样我们可以NNs 认为每捕一条鱼出现有标记(“成功”)的概率为,且认为在 次捕鱼(每次捕一条)Nrp s中不变。把捕 条鱼近似地看作重贝努里试验,于是,根据二项分布,条鱼中有psss条鱼有标记的,就相当于次试验中有 次成功。故tsttst t ststt ssNr NrCppCtP 1)1 ()(221tstt ssrNrCN)(1同样地,我们取使概率达到最大,为此我们将作为非负实数看待,求N)(tPsN关于的最大值。为方便,求关于的最大值。于是
25、)(tPsN)(lntPsN)ln()(lnlnln)(lnrNtsrtCNstPt ss令 0)()(lnrNts Ns dNtPds同样可得(取最接近的整数) 。trsN 4.根据超几何分布与最大似然估计法:设捕出的 条鱼中,标有记号的鱼为,则是s11一个随机变量,显然只能取 0,1,2,,l 。1),min(rsl 今先考虑条中有 条有标记的鱼的概率,即。因湖中鱼数设为条,捕出si)(1iPN条,故s),min(, 2 , 1 , 0,)(1rslliCCCiPs Nis rNi r 因而捕出条出现 条有标记的鱼的概率为st(1)()(1NLCCCtPs Nts rNt r 根据最大似然
26、估计法,今捕条出现有标记的鱼 条,那么参数应该使得stN达到最大,即参数的估计值使得)()(1NLtPNN)(max)(NLNL N由比值 ts rNs Ns Nts rN ts rNt rs N s Nts rNt r CCCC CCC CCC NLNLNR 1111 ) 1()()()!1()!()!1( )!( !)!1( !)!1( )!()!()!(tsrNtsrN sNsNsNsN tsrNtsrNNtNsNrNrsNsNrN tsrNNsNrN 22)()(看出,当时,这表明如果,时,是的下降函数; Ntrs 1)(NR0ttrsN )(NLN当时,这表明,时,是的上升函数。于是
27、Ntrs 1)(NR0ttrsN )(NLN时, 达到最大值. 但由于是整数,故取trsN )(NLN(取最接近的整数)trsN 222如果,就加大 。若仍有,可认为。0ts0tN评注评注1.理论依据二项分布、超几何分布的概率计算,矩估计与极大似然估计。应用参数估计的思想和方法分析、处理问题。2.应用与推广此例说明,对同一个问题可以采用不同的方法解决;例如,估计一个城市的人口总数,也可以用同样的方法去考虑。参考文献参考文献孙荣恒.趣味随机问题M.科学出版社.2004.10.4.7 平均值的质量控制图在工业质量控制中,常需要每隔一定时间就检验一次同样的假设。例如,在制造0H某种弹簧的过程中,需要
28、控制弹簧的自由长度具有平均值厘米。设弹簧的自由长5 . 1度(总体)服从正态分布,且标准差,为检验生产过程是否正常,每隔一定时间02. 0(例如一小时)取样件,根据抽测的自由长度的平均值来检验假设5 . 1:0H厘米。nx为简化这项工作及便于了解生产过程的统计规律性,制作了如图4.7.1的图表。图4.7.1中的纵坐标是的大小,中心线x在5 . 10,控制上限和控制下限分别在,每个样本平均值都n30n30画在图上,用黑点表示。如果都落在控制x线之间,则表明生产过程处于正常的控制之下;否则,就要检查原因,适当地调整机器,显著性水平不超过0.003。图4.7.1中的控制限中的3就是取0027. 0得
29、到的。n3这是根据规则得到的检验方法。如果总体,则3),(2NX。在中抽取容量为的样本9973. 0199865. 021)3(23XPXn,则样本均值,。当总体方差已知时,在nXXX,21),(2nNX) 1 , 0( NnX 21.441.451.461.471.481.491.51.511.521.531.5412345678910111213控制下限 中心线 控制上限 样本均值图 4.7.1 质量控制图223显著水平之下,假设的接受域是:。那么,如果以0027. 000:H330nX 为检验统计量的的接受域为:。所以,作出的控制图以XnXn3300,作为控制下限与控制上限。n30n30
30、如果每隔一小时的时间间隔内采样(容量为5)的样本平均值如下:1.510,1.495,1.521,1.505,1.524,1.488,1.465,1.529,1.520,1.4441.531,1.502,1.490,1.531,1.475,1.478,1.522,1.491,1.491,1.482由及作出样本容量的样本平均值控制图,可以作出质量控制图,如5 . 1002. 05n图4.7.2。评注评注1.理论依据正态总体均值的置信区间,根据样本构造置信上限与置信下限,从而作出质量控制图。2.应用与推广根据正态分布与数理统计的知识,进行质量管理与质量控制是概率统计应用的一个很重要的方面。特别是用在
31、质量控制的 3法则,目前在全球最先进的企业都采用 6管理法,已经形成一种企业管理文化。而正态总体参数的统计推断,广泛应用在全面质量管理;还广泛应用于金融风险分析与管理,如等。)(RiskatValueVaR参考文献参考文献盛骤等.概率论与数理统计(第四版)M.高等教育出版社.2008.6.4.8 概率论在产品质量验收抽样方案确定中的应用1.应用背景应用背景 质量控制是质量管理的重要组成部分,它是用统计方法检验和控制产品的质量,其1.441.451.461.471.481.491.51.511.521.531.5413579111315 1719下控制限 中心线 上控制限 样本均值图 4.7.2
32、 根据样本绘制的质量控制图224内容包括验收控制和工序控制。验收控制主要研究如何合理地制订产品质量检验抽样方 案,这是一种把关性质量控制。工序控制指生产过程中对产品质量进行检验、监控,以 便及时发现问题,采取措施,保证生产正常进行,这是一种预防性质量控制。 2.提出问题提出问题一批产品出厂之前常常要进行质量验收,一般采用抽样检验法,即从一大批产品中随机抽取件,用这件产品的质量信息推断整批产品的质量,以确定这批产品是否合格。nn 因此,在抽样之前需确定抽样方案,即样本容量和接受这批产品的准则(或判断这批产品质量的准则) 。3.分析问题与建立概率模型分析问题与建立概率模型假设有批量为的产品需要验收
33、,N从中随机抽取了件产品。接)(Nnn受一批产品的最简单的准则是:当抽得的不合格产品件数不超过时,Xd就接受该批产品,认为该批产品质量合格;否则,就拒绝该批产品,认为该批产品质量不合格。因此,检验方案简记为,其中已知,),(dnNN为抽检产品的个数,称为合格品nd判定数。显然,当确定了,检验方案dn,就确定了(如图 4.8.1 所示) 。那么如何确定呢?dn,若该批产品的不合格率为,则接受该批产品的概率(简称接受概率)为: p(4.8.1) dkkXPdXPL0)()(对可以用不同的方法计算,即)(dXPL(4.8.2) 。poissonnppNnNeknpNnNppCCCCdXPLdknpk
34、dkknkk ndkn Nkn pNk Np101 . 01 . 0/!)(1 . 0/)1 ()(000)1 (当样本容量较大时,由中心极限定理知:n)1 (pnpnpXU近似服从标准正态分布,因此有) 1,0(N )1 ()1 ()(pnpnpd pnpnpdUPdXPL(4.8.)检验方案检验方案 ( N,n,d)若若 Xd,则该批,则该批 产品不合格产品不合格从一批产品中随机抽取从一批产品中随机抽取 n 件件 产品,检查出有产品,检查出有 X 件不合格产品。件不合格产品。若若 Xd,则该,则该 批产品合格批产品合格图图 4.8.1 一次抽样方案一次抽样方案225p11L(p)0图图 4
35、.8.2 OC 曲线曲线显然,接受概率是的函数,记为(称为接受概率曲线,或抽样特性曲Lp)(pLL 线,也称为 OC(Operating Characteristic Curve)曲线) 。当时,;当0p1)(pL时,;是的递减函数(如图 4.8.2 所示) 。 1p0)(pL)(pLL p由于抽样的随机性,有可能拒绝一批高质量的产品,这时生产方将受到损失,犯这类错误(第一类错误)的概率记为,称为 生产风险;也有可能接受一批低质量的产品,这时使用方将受到损失,犯这类错误(第二类错误)的概率记为,称为使用风险。在制订抽样检验方案时,总是希望犯两类错误的概率都很小。为此,只有增大样本容量。n但是选
36、择得太大将使检验成本大大增加,n这样做通常是不可行的。一种折衷的办法是生产方和使用方都承担一定的风险,高质量产品(较小)使用方以高概率接受,以保护生产者的利益;低质量产品(较大)使pp用方以低概率接受,以保护使用方利益。因此,需要确定,称为合格品质) 10(00 pp量水平,当时,认为该批产品质量高,接受概率要大,如要求(0pp )(pL1)(pL由生产方与使用方协商确定,就是显著性水平,一般取 0.01,0.05,0.1) ;还需要确定一个,称为极限质量水平,当时,认为该批产品质量低,接受概)01 (011ppp1pp 率要小,如要求(也是由生产方与使用方协商确定,一般取)(pL)(pL0.
37、05,0.1,0.2) 。于是由下式确定:dn,(4.8.4) 10 )(1)( pppLpppL 由于是的递减函数(如图 4.8.3 所示) ,所以可由)(pLL pdn,(4.8.5) )(1)(10 pLpL确定,即(4.8.6))1 (1)1 (111000pnpnpdpnpnpd由此可见,要制订一个抽样检验方案,应事先给定四个参数:生产风险,使用风险,双方可接受的合格品质量水平与极0p图图 4.8.3 一次抽样一次抽样 OC 曲线示意曲线示意 图图1p0p11-pL(p)01226限质量水平。然后由(4.8.6)式求出。1pdn,(4.8.7) 2 01110001110020111
38、00)1 ()1 ()1 ()1 ()1 ()1 (pppppupppuppuppudppppuppun4.举例举例现要验收一批产品,如果该批产品的次品率,就接受这批产品;如果,04. 0p1 . 0p就拒绝这批产品。并且要求当时不接受这批产品的概率为 0.1,当时接受04. 0p1 . 0p这批产品的概率为 0.1。试为验收者制订验收抽样方案。解:由题意知:代入(4.8.7)式,可得:得,1 . 0,1 . 0,04. 010pp112n,于是,取。抽样方案是:抽查 112 件产品,如果抽得的不合格品数1345. 7d8d,则接受这批产品,否则拒绝这批产品。8X5.问题的扩展问题的扩展也可以
39、用上述方法确定计量质量指标抽样检验方案。假设一批产品的某质量指标,从中有放回地抽取件产品,得到它们的),(2NXn质量指标为,记表示这件产品质量指标的平均值。由不同的nXXX,21 niiXnX11n质量要求可提出接受这批产品的不同判断准则。例如,要求质量指标值越大越好,那么需确定参数,当时,接受该批产品,否则拒绝该批产品。因而检验抽样方案可用ccX 表示。由正态独立变量的性质知: 。因此接受产品的概率为),(cn nNX2 ,(4.8.8) nccXPLL)(1)()(与前面讨论方法类似,为了同时使生产风险、使用风险都较小,需要给出产品合格的质量指标均值水平与极限质量指标均值水平以及生产风险
40、与使用风险0)(101,这时取满足),(cn(4.8.9) ncLncL)(1)(1)(1)(1 10 0解方程组(4.8.9) ,得227(4.8.10) uuuucuun01210)(举例:举例:对一批钢材的强度进行抽样检验,要求其强度越大越好,并且已知强度服从正态分布,标准差=4kg/mm2。现在生产方与使用方商定,=46kg/mm2, =43kg/mm2。试制订一个抽样检验方案。1 . 0,05. 001解:设(kg/mm2)表示该批钢材的强度。由题意知,查表得X)4 ,(2NX,。根据公式(4.8.10)式计算得:, 。65. 105. 0 uu28. 11 . 0 uu16n31.
41、44c所以,抽样检验方案是抽取 16 根钢材分别测得其强度,平均值记为,当时接x31.44x受该批产品,否则拒绝该批产品。6.进一步讨论的问题进一步讨论的问题1.仍假设一批产品的某质量指标,从中有放回地抽取件产品,得到它),(2NXn们的质量指标为,记。质量指标值越小越好,那么需确定参数nXXX,21 niiXnX11,当时,接受该批产品,否则拒绝该批产品。这时,如何确定一次抽样检验方案ccX ?),(cn2.如果质量指标值不能太大,也不能太小,那么需确定参数,当)(,2121cccc时,接受该批产品,否则拒绝该批产品。这时,如何确定一次抽样检验方案21cXc?),(21ccn 注:本实例依据
42、杨虎教授负责的重庆市级精品课程概率论与数理统计网站的内容,略有修改.评注评注1.理论依据通过二项分布、超几何分布、正态分布计算相关事件的概率;产品质量验收抽样方案的确定。2.应用与推广通过产品质量验收抽样方案确定问题的数学建模全过程,使学生了解概率论在产品质量管理中的应用,可以将这种方法应用到实际的产品质量检验之中。参考文献参考文献周纪芗等.质量管理统计方法M.中国统计出版社. 1999.杨虎:概率论与数理统计M.重庆大学出版社,2007.6.2284.9 实际推断原理小概率事件原理在心灵感应试验中,两个试验者甲和乙分别坐在两个房间里。裁判给试验者甲 4 红4 黑 8 张扑克,每发一张另一位试
43、验者乙要说出是什么颜色的扑克。他知道一共发了 4红 4 黑 8 张扑克。问:(1)如果在一次试验中,乙说对了至少 6 张牌,他是否有心灵感应?(2)如果做了 10 次试验,至少有 5 次乙说对了 6 张或 6 张以上,他是否有心灵感应?如果做了 10 次试验,至少有 6 次乙说对了 6 张或 6 张以上,他是否有心灵感应?分析:(1)如果两人没有心灵感应,则试验者乙至少能猜对 6 张的概率为:2429. 070174 84 44 43 43 4 CCCCC这个概率不算小,虽然乙猜对了,不能说明乙有心灵感应。(2)如果把这种试验独立做 10 次,以 X 表示乙猜对 6 张或 6 张以上(6 张或
44、 8 张)的次数,在两人没有心灵感应的情况下,随机变量,故)2429. 0,10( BX%7 . 6067. 07571. 02429. 0510510 10 kkkkCXP%7 . 1017. 07571. 02429. 0610610 10 kkkkCXP因此在 10 次试验中,即使有 5 次猜对 6 张或 8 张,也不能说他们两人有心灵感应,因为 0.067 不能算是小概率事件。如果 6 次猜对 6 张或 8 张,这个事件发生的概率仅为0.017,应该是一个小概率事件, “概率很小的事件在一次试验中实际上是不可能发生的”,则可以说明他们有心灵感应。如果一个事件发生的概率小于 0.05,我们把这个事件称为小概率事件。在一般场合下,我们假定概率很小的事件在一次试验中不会发生,这个原理称为小概率事件原理小概率