《概率统计答疑.pdf》由会员分享,可在线阅读,更多相关《概率统计答疑.pdf(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、释疑解难释疑解难 第一部分第一部分 随机事件与概率随机事件与概率 问问 1.1:样本空间有什么性质?答:答:样本空间有以下两个性质:(1)每次试验必有属于样本空间中的某个样本点发生;(2)样本空间中的任意两个不同的样本点不会在同一次试验中出现。问 1.2:问 1.2:如何判定在一次特定试验下事件A是否发生?答:答:事件A在该次试验发生当且仅当包含在A中的样本点在该次试验下发生。例如掷一枚骰子的随机试验,事件A为出现偶数点,则当且仅当掷骰子的结果出现 2 点,4 点或 6 点之一时,事件A在该次试验出现。由此可见,一事件在一次试验中是否发生,只有当做了这次试验之后才能判定,在试验之前是无法预知的
2、(必然事件与不可能事件是少数的二个例外)。问问 1.3:并事件与交事件有何差别?答:答:我们以两个事件为例,A与B的并事件 是由三部分样本点组成,即()同时属于BAA及B;()只属于A;()只属于B(见下图 1.1)。而A与B的交事件则仅仅由上述第()部分那些样本点组成。BA BA()()()BBA A 图 1.1 1 2 n n 12 (甲)并联线路(乙)串联线路 图 1.2 下面是一个实际例子:有线路甲、乙,甲是并联线路,乙是串联线路(见图1.2)。记为元件i导通,而事件iAni,1?=A为线路导通,今要求分别对甲乙两种线路用诸或iAiA表示事件 A。对线路甲,只要1号到号元件中有一个导通
3、线路就导通。因而欲使线路甲不通,必须从1号元件到n号元件每一个都不通,也就是说nnAA,1?同时发生。因而nAAA?1=;对线路乙,只有1号元件到号元件均导通,线路乙才能导通。因而只要1号到号元件中有一个不通,则线路乙不通,所以,nnnAAA?1=。问 1.4:问 1.4:以下两种陈述有何差别?()有一个发生;A,1?nA()恰有一个发生;nAA,1?答:答:在陈述()()中都包含了只发生一个的情况;但在陈述()排除了中有个或 2 个以上同时发生的情况,而对陈述()并未将这些情况排除在外。事实上我们可表述如下:;nAA,1?nAA,1?2nnAAAA?11,=有一个发生nnnnnAAAAAAA
4、AAAA1121211,=?恰有一个发生。问 1.5:对于“有放回抽取”与“无放回抽取”这两种情况,在计算概率时有何差别?答:有放回和无放回抽取这两种情形,使用的计数公式是不同的,因而概率计算是不同的。如:从 1 到 n 个数字中有放回地连续抽取 m 个,一共有个不同的可能结果;而如改成无放抽取,则共有mn(1n n)(nm1)+个可能结果。在应用中须判明究竟有放回还是无放回,这一点是重要的。问 1.6:问 1.6:在古典概型的概率计算中,把握等可能性是难点之一。现见一例:掷两枚骰子,求事件=A点数之和等于 5的概率。下面的解法是否正确?如不正确,错在哪里?解法:因试验可能结果只有二个,一是点
5、数之和为 5,另一个是点数之和不等于 5,而事件A只含有其中的一种,因而2/1)(=AP.答:答:此解法是错误的,这种解法是对样本空间进行了不正确的划分,分割出的二部分不是等可能的,因而不能据此进行计算。正确的解法如下:掷二枚骰子的样本空间可形象地表为:6,2,1,:),(?=jiji,对子表示二枚骰子分别出现的点子数,因而一个对子即对应着一个样本点,一共含有个这样的对子,每个对子出现的可能性都等于 1/36。而事件),(ji3662=A只含有,这样四个对子。因而 )1,4(),3,2(),4,1()2,3(9164)(2=AP 问 1.7:问 1.7:今有某超市抽奖销售,设共有张券,其中只有
6、一张有奖,问若每人只能抽一张,第个人抽到有奖的概率是多少?试就有放回、无放回两种方式回答该问题。nk答:答:在有放回情形,第个人抽与第 1 个人抽情况相同,因而所求概率为kn1;在无放回情形,样本点总数为)1()1(+knnn?,而有利样本点数为)1)1(1()2)(1(+knnn?1,所求概率为 nknnnknnn1)1()1()1()2)(1(=+?.值得注意的是:两种不同的抽样方式得到的解答是一样的;而且此概率值与抽样次数k无关。这表明通常抽奖设计为无放回抽取可简化抽奖活动的程序,且对每个参加活动的人来说都是机会均等的。问 1.8:问 1.8:概率为 0 的事件是否必定为不可能事件?答:
7、答:不是。反例如下:今向区间随机投点,事件)1,0(A为“落点恰好在 1/2处”,显然事件A非不可能事件,但.0)(=AP 问 1.9:问 1.9:对于任意事件,(或者)必定成立?BA,)()|(BPABP)()|(BPABP答:答:不一定。例如袋中有 10 张彩票,只有二张有奖,今从中不放回抽取(每次抽一张)2 次,记=A第一次抽到有奖彩票,=B第二次抽到有奖彩票,则 5/1)()(=BPAP,而)(91)|(BPABP=问 1.10:问 1.10:条件概率与概率有何不同?)|(ABP)(ABP答:答:条件概率中地位不同,且已知)|(ABPBA,A已发生作为条件;在概率中,同时发生,地位相同
8、,没有前提条件。在应用问题中必须区别是求还是求。例如从 6 个正品 2 个次品的袋中,不放回抽取 2 次,)(ABPBA,)|(ABP)(ABP=A第一次为正品,=B第二次为次品,求(1)第二次才取到次品的概率;(2)已知第一次取到正品,B发生的概率。那么,第一问是求,而第二问是求.)(ABP)|(ABP第二部分 一维随机变化及其分布 第二部分 一维随机变化及其分布 问 2.1:问 2.1:引入随机变量有何意义?答:答:随机变量的引入是概率论发展走向成熟的一个标志,它弥补了随机试验下的随机事件种类繁多,不易一一总结它们取值规律的缺陷,因为如果知道随机变量的分布,随机试验下任一随机事件的概率也随
9、之可以得到;另则引入随机变量后,可以使用数学中的微积分工具讨论随机变量的分布。问 2.2:问 2.2:随机变量的分布函数、分布律、密度函数有何联系与区别?答:答:随机变量的分布函数刻划了随机变量的取值规律,不管是连续型还是离散型或既不是连续型又不是离散型随机变量都可用分布函数来描述其取值规律;而分布律只能描述离散型随机变量的取值规律;密度函数只能描述连续型随机变量的取值规律。它们的联系在于对离散型随机变量 X,当知道了 X 的分布律,可通过求概率(()xXPx取任意的值)求得 X 的分布函数()xF;反之也一样。对连续型随机变量 X,当知道了 X 的密度函数()xf,可通过积分()()(+=x
10、dxxfxFx,)求得分布函数()xF;反之,当知道了分布函数()xF,可通过对求导,即(对一切的连续点处)求得密度函数()xF()()xfxF=()xf()xf。问 2.3:问 2.3:二项分布的背景是什么?答:答:做 次重复独立的试验,在每次试验中事件 A 发生的概率为np,如果记随机变量 X 为 次试验中事件 A 发生的次数,则称随机变量 X 服从二项分布。在实际生活中有很多问题都可归结为二项分布。例有一张试卷印有十道题目,每个题目都为四个选项的选择题,四个选项中只有一项是正确的。某位学生在做每道题时都是随机的选择,X 表示该学生十道题中答对的题数,则 X 服从n(pnB,)41,10=
11、pn(每道题答对的概率)的二项分布。概率()056.043010=XP为该学生得零分的概率。问 2.4:问 2.4:设随机变量 X 的分布律为 X-1 0 1 概率21 41 41 所求的分布函数为()=xF 4141210 110011xxxx 问这样的求法正确吗?错在哪里?答:答:这样的求法不正确,首先该弄清楚分布函数的定义即()()(xFxXPxF,=)表示事件xX 的概率,因此当01 x时,概率()()()43412101=+=+=XPXPxXP,当时,事件1xxX 为必然事件,因此,它也可用()1=xXP()()()()1414121101=+=+=+=XPXPXPxXP 求得。综合
12、后正确的分布函数为 0,11,12()3,041,1xxF xxx01 =问 2.5:问 2.5:正态分布有哪些特点?什么是“3”原则?答:答:设()2,X,即密度函数()()+=xexfx,21222()xf的图像见图 4.1,从()xf的图中可看到关于()xf对称,当=x时,取最大值()xf21,而这个值随增大而减少,事实上在数字特征这一章中可知为 X 的均值,为 X 的标准差,因此正态分布描述这样一种随机变量,它取的值关于对称,且取在平均值附近范围的可能性较大,取远离处的范围内的可能性较小。服从正态分布的随机变量的取值可能性大小直观上可用“两头小,中间大”来形容。自然界中很多随机现象都有
13、这一特点,因此正态分布在概率论中占有很重要的地位。x 图 4.1 21()xf所谓“3”原则是比较定量地说明正态分布的“两头小,中间大”的特点,具体为()()()()()9974.019987.021323333333=+=+=XPXP 从以上计算中可看到服从正态分布()2,的随机变量 X 取在3的范围内的概率几乎达到 1。这就是“3”原则。问 2.6:问 2.6:设连续型随机变量 X 的密度函数为()=xf ,0,2x.;10其他 x 则 X 的分布函数为()=xF xxdxxdx000201100 xxx =002x1100 xxx 这样的计算是否正确,错在哪里?答:答:这样的计算是错误的
14、,这是因为()xf是一个分段函数,分布函数中的被积函数的形式依赖于变上限()()=xdttfxFx。具体表现为当时,当时,0 x()=000dtxF10 x()()()()=+=+=xxxxtdtdttfdttfdttfxF020020,当时,1x()()=xdttfxF()()()102011001100=+=+=xxdttdtdtdttfdttfdttf。综合有()=xF 102x1100且()()()()(),YXh yFyP g XyP Xh yfx dx=此时()()()().YYXfyFyfh y h y=当()g x为单调递减函数时,可得()0,h y 且 ()()()(),()
15、YXFyP g XyP Xh yfx dxh y+=此时()()()(),YYXfyFyfh yh y=即()()().YXfyfh yh y=在使用这条性质时,一定要注意()yg x=为单调函数且可导。第三部分 二维随机变量及其分布 第三部分 二维随机变量及其分布.问 3.1:问 3.1:为什么要引入二维随机变量概念?答:答:有时对随机试验的结果可相应地建立两个随机变量,如考察学生的数学课程成绩 X 与物理课程成绩 Y,那么就必须建立二维随机变量()YX,,并进一步讨论它们的分布以及两个变量之间的联系。当然可能还有这样的疑问:能否分别通过讨论 X 与 Y 的分布来寻找它们的联系?这个问题的答
16、案将在下一个题中给出。问 3.2:问 3.2:由两个一维随机变量 X、Y 的分布能否确定一个二维随机变量的分布?答:答:不一定。当 X 与 Y 独立时,由 X、Y 的两个一维分布可定出(的联合分布,当 X 与 Y 不相互独立时,一般不能得出上面的结论。下面通过一个例子说明。)YX,设()(),222121YX,则由性质知 X 的边缘分布()211,,Y 的边缘分布()222,,我们发现对于不同的有共同的边缘分布,因而也说明两个一维正态分布一般不能唯一确定一个二维分布。但当知道了(的联合分布,可以确定二个边缘分布,这也说明了)YX,()YX,的联合分布不仅包含了二个一维随机变量的信息,还包含了它
17、们之间联系的信息。问 3.3:问 3.3:在计算二维随机变量落在区域内的概率D()()DYXP,时,为什么很少直接通过联合分布函数来求得?(yxF,)答:答:那 是 因 为 联 合 分 布 函 数 只 能 直 接 求 得 类 似 随 机 事 件的概率,即 2121,yYyxXx()()()()(111221222121,yxFyxFyxFyxFyYyxXxP+)=.对计算落在不是矩形形状区域内的概率时不易找到一个直接用联合分布函数来表示的显式,一般,在计算二维离散型随机变量(YX,)D()YX,落在区域内的概率时,通常通过其联合分布律来完成;在计算二维连续性随机变量落在区域内 的 概 率 时,
18、通 常 用 其 联 合 密 度 函 数DD()yxf,来 完 成,即 可 用来完成。()()()=DdxdyyxfDYXP,问 3.4问 3.4:什么是卷积公式?在使用卷积公式中要注意些什么?答:答:随机变量XY与独立,且(),(XY)Xfx Yfy,称随机变量ZXY=+的密度函数的表达式()()()ZXYfzfx fzx+=dx为卷积公式。此公式给出了XY+这种简单随机变量函数的分布。在卷积公式中,往往(),()XYfxfy是分段函数。因此,须分段求积分,且分段积分的上、下限可能会与有关,必须小心处理。z 第四部分 随机变量的数字特征 第四部分 随机变量的数字特征 问 4.1:问 4.1:数
19、学期望、方差及协方差、相关系数的实际意义是什么?答:答:数学期望又称为均值,它反映了随机变量平均取值的大小,它是一个数,而不再有随机性。方差表达了X的取值与其数学期望的偏离程度,若X取值比较集中,则较小,反之,若取值比较分散,则()XD()XD较大,因此()XD刻画了 X 取值分散程度。协方差和相关系数都是 X 与 Y 之间相互关系的一种度量。两者的区别是协方差的单位是 X 和 Y 的单位的乘积,当 X、Y 使用不同的量纲时,其意义不是很明确。而根据相关系数(YX,cov)=YXYXYX,cov,的定义,消除了方差的影响,是一个无量纲的纯量,相关系数的大小直接反映了 X 与 Y 的相关程度。问
20、 4.2:问 4.2:数学期望定义中的条件:级数绝对收敛或积分绝对收敛的作用是什么?答:答:以级数为例,在求数学期望时,加项的次序变换应不影响求和结果,但当级数为无穷级数时只有当()=1iiipxXE=1iiipx收敛时,才能保证求和与加项次序无关,所以这一条件是不可少的,但对于通常随机变量而言,该条件一般都是满足的。但也存在一些随机变量,它的数学期望并不存在,如 X 服从柯西分布,即密度为()()211xxf+=,()+lim()1.nnP X =作 为 一 例 子 考 虑,若iX独 立 同 分 布 服 从(,1)N,那 么 有111(,),niXNnnn 当它的方差n趋于零;如果一个随机变
21、量的方差为 0,那么它就以概率 1 恒为常数,因此我们可认为P11niXn,通过切比雪夫不等式马上可以得到。更一般的结论可从切比雪夫大数定律得到。注意 三个大数定律的条件有所不同,切比雪夫大数定律中对iX的要求不高,只要iX两两不相关,且方差一致有界,即有P11()niiXn0;如在第 i 次贝努利试验中事件 A 发生的次数P1.nAiiinnXEXpn=p=A又所以,这就是贝努利大数定律。辛钦大数定律则要求iX独立同分布且,iEX=就有 P1.niiXn=问 5.2问 5.2 中心极限定理在解决实际问题中有何作用?答:答:由大数定律我们知道对于独立同分布随机变量序列iX而言,当P11ninX
22、En 时X,即11niiPXEXn ,但是如何计算该概率的大小仍未解决.而在实际问题中,这类问题经常出现,如测量某一物体的尺寸,通常总是测量 n 次后将测得的值相加再除以 n 作为尺寸的估计,那么它与真值之间的差异在某一范围内的概率是令人感兴趣的。由于这类问题的普遍性,概率界花费了近一个世纪对其进行研究、并成了讨论的中心,所以这类定理成为“中心极限定理”,直到今天,这类问题仍是讨论的课题(当然在更复杂情况下),我们所介绍的是最简单但也是最实用的一种情况,即当iX是独立同分布的随机变量序列,其方差存在时的有关结论。从随机变量和的分布计算可知,要计算1niiX=的分布是非常不容易的,从而11nii
23、PXEXn=的计算也是不易的,而列维-林德伯格中心极限定理告诉我们,只要iX独立同分布,iEX=,2,iDXn=那么当时,1niiXnn=渐近服从分布,这样(0,1)N1121ninPXn.立即可求得。当iX独立同分布且服从2(,),N 那么()21,niXN nn.所以()1(0,1)niiXnnN=服从分布。也就是说,只要 n 充分大,独立同分布的随机变量序列不管服从何种分布,前 n项和的分布与它服从正态分布的结果是十分接近的。中心极限定理在实际中有广泛的应用。在利用中心极限定理解决实际问题时,关键的一点是能否将Y看成 n 个独立同分布的随机变量iX的和。如果可以,那么计算(P aYb)的
24、概率只须先求出的值,然后再利用中心极限定理进行计算。,iEX DXi第六部分 数理统计的基本概念 第六部分 数理统计的基本概念 问 6.1:问 6.1:数理统计的研究对象和目的是什么?答:答:“数理统计学”是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带随机性影响的数据,它的具体含义包括以下几层意思:1)能否假定数据有随机性,是区别数理统计方法与其他数据处理方法的根本点。数据的随机性来源有两种:a)问题中涉及的研究对象为数很大,只能抽取部分样品加以研究,如测定 10000 支灯管的寿命,只能抽取其中 100 支进行测试(测试结束,着 100 支灯管就失去了使用价值),而这 100
25、 支灯管的抽取是带随机性的。b)数据的随机性来源于测量误差或者试验的随机误差,如考察产品的质量,温度和压力是重要因素。但当温度和压力取为定值时,质量仍因大量其他因素的影响,如原材料的差异,使用的设备和操作人员的经验差异等而有一定的波动,试验结果仍包含有随机误差。2)所谓“用有效的方法收集数据”可归结为 a)建立一个数学上易于处理的尽可能简单的模型描述所得的数据。b)要使数据包含尽可能多的与研究问题有关的信息。例如对上海市居民收入的状况进行研究时,我们应调查多少户居民比较合适,太少了没有代表性,太多了费用昂贵,究竟确定几户合适就要用统计方法。另外若确定了选取 1000 户,如何选取?如果只从高收
26、入人群调查,就失去了代表性。数据谈不上有效性;如果用纯随机化方法抽取,则数据就有一定的代表性,本教材讨论的正是这种模型。是否有更有效的方法,例如高收入人群占 30%、低收入人群占 70%,那么我们从高收入人群中随机抽 300户,而从低收入人群中随机抽 700 户,这时的数据确实更为有效等等。由此产生了数理统计的两个分支“抽样理论”和“试验设计”。3)“有效地使用随机数据”的含义即将抽得的随机数据用有效的方式去集中,提取与研究问题有关的信息,并利用它对提出问题作出一定的结论这种结论称为“统计推断”。但统计推断并不是绝对精确和可靠的,这正是数据随机化带来的影响,然而推断应进可能的“可靠”。本教材中
27、讨论的“点估计,区间估计和检验”正是统计推断中的重要内容。显著性水平,置信水平等相应的概率大小正反映这些统计推断方法的“可靠性”的大小。“统计推断”中有许多统计方法来源于实践中产生的“统计思想”,如“极大似然法”,“矩法”等,它有一定的合理性,但又不是是“绝对精确”。只有理解了这些统计思想才会对统计方法深入理解。只有对“可靠性”大小的正确理解才能对研究的结论作出正确的阐述。问 6.2:问 6.2:为什么要提出统计量?答:答:样本表现为一大批的数字,很难直接用来解决我们所要研究的具体问题,所以常常需要把样本数据整理加工成若干个简单明了的数字特征,当样本数据确定后,统计量的值即可以知道了.所以统计
28、量综合了样本的信息,是统计推断的基础.问 6.3问 6.3 三大分布的作用是什么?答:答:2分布,分布,F分布都是从正态总体中衍生出来的,几种常用的统计量的分布都与这三大分布有关,所以这三大分布在正态总体的统计推断中起着重要的作用。第七部分 参数估计 第七部分 参数估计 问 7.1:问 7.1:最大似然估计的统计思想是什么?答:答:似然函数();,21nxxxL?是的函数,表示由参数产生样本值的“可能性”大小。将样本观察看成“结果”,nxxx,21?是产生结果的“原因”,()L则是度量产生该结果的各种“原因”的机会。因此,的一个合理的估计应使这种机会(即()L)达到最大的那个值。若记为,则应满
29、足()()LL=max。问 7.2:问 7.2:什么是一个好的点估计?答:答:一个基于样本的特定的估计值决不会精确地等于总体参数的真值,所以问某一个值是否是好的估计值是没有意义的。而可以问的是计算估计值的方法是不是一个好方法。为了确定一个方法的好坏,需要对多次重复同一个研究所得的结果进行比较。尽管所有的样本都来自于同一个总体,但这些样本所得到的结论各不相同,这一现象是由抽样的随机性引起的。一个好的估计方法的标准可以这样被定义:如果在无数个样本上应用该估计方法,得到的估计的均值等于总体参数的真值,则这种估计即是该参数的无偏估计。其次,许多重复抽样所得的估计值不应该离真值太远,“无偏估计”的方差恰
30、好反映了估计值与真值的偏差程度,显然方差越小,该估计作为真值的估计愈精确,由此给出了有效性的定义。无偏性是对一种估计方法的基本要求。而相合性也是对估计的另一种基本要求。相合性的定义就是要求当试验次数 n 不断增加,估计量按概率收敛于真值,即与真值相差无几。而事实上当n时样本提供的信息量越来越大,对真值的估计应该越来越精确,估计量与真值相差无几才合理。问 7.3 问 7.3 置信区间的确定受哪些因素的影响?答:答:影响置信区间确定的因素有两个:精度和可靠度.估计精度的一种描述方法是置信区间长度的大小。置信区间长度越短则估计越精确。例如给出一个未知的总体百分比的置信区间是从 0%100%,这种区间
31、估计是没有什么现实意义的,如果给出置信区间是从 30%70%,则对这个未知的参数有了一些了解。如果给出置信区间是从 49%53%,则对这个未知参数的认识就十分“精确”了。置信区间可靠度的一种描述方法是置信水平。置信水平表示的是一个概率值,它表示的是在多次抽样得到的区间中大概有多少个包含了参数的真值,即如果你做了 100 次的抽样,大概有 95 次找的区间包含真值,有 5 次找到的区间不包含真值。显然 95%置信水平的置信区间比 90%的可靠度高。一般来说,当样本容量 n 给定后,90%置信水平的置信区间长度要比 95%置信水平的短。例如正态总体22(,),N 当已知时,的双侧置信区间长度为0.
32、950.9752.nn:HH11=unXR.其二类错误概率,见图所示,其中右边曲线所围图形表示成立时1HX的分布,而左边则是成立时0HX的分布。显然,当小时,变大;反之亦然。11ZnO X 问 8.2:问 8.2:未被一个显著性检验所拒绝的原假设是否一定成立?0H图 12.1 答:答:不一定。为一个水平显著性检验所拒绝的假设,平均来说每 100次,作出拒绝结论,做错了的大约只有0H0H100次。因而有一定的可靠度,但未被拒绝时,犯第二类错误的概率并未受到控制,因此接受而犯错误的可能性无法预料。另一方面,仅仅凭一次试验的结果没有被拒绝的假设,从人们的心理上是不放心的,一般需要继续做试验,重新取得
33、数据作检验,根据多次试验的结果再作结论。0H问 8.3:问 8.3:同一问题及同一批数据,如使用不同的显著水平,其检验结果是否不同?答:答:不同的显著水平下,检验的结论可能是不同的。例如可能在水平05.0=下是不能拒绝的,而在水平10.0=下被拒绝。问 8.4:问 8.4:一个显著水平的检验的第一类错误概率与水平,这两个概念有何差别?答:答:这是两个不同的概念,第一类错误概率与具体的检验有关,同一问题可以有不止一个水平检验,他们具有不同的第一类错误概率,但是有一个共同点,就是第一类错误概率都不超过。水平则是所有可能的水平检验的第一类错误概率的上界。因此水平与具体检验无关。问 8.5:问 8.5:为什么不能称备选假设为对立假设?答:答:注意到某些原假设与备选假设并不是非此即彼,例如0H1H00=:H,01:H.此处0只是 0=的对立陈述的一部分,而非全部。究竟备选假设选择对立陈述中的哪一部分,取决于收集数据的目的。