《数据模型与决策-21(概率分布)cqdv.pptx》由会员分享,可在线阅读,更多相关《数据模型与决策-21(概率分布)cqdv.pptx(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据、模型与决策数据、模型与决策丁邦俊13818068959 第二讲第二讲 离散概率分布离散概率分布离散概率基础离散概率基础 n n概率第一定律概率第一定律概率第一定律概率第一定律:任何事件的概率都是任何事件的概率都是任何事件的概率都是任何事件的概率都是0 0和和和和1 1之间的数之间的数之间的数之间的数.n n例例例例 将一枚均匀的硬币抛出,观察是正面向上还是将一枚均匀的硬币抛出,观察是正面向上还是将一枚均匀的硬币抛出,观察是正面向上还是将一枚均匀的硬币抛出,观察是正面向上还是反面向上,由完备性和对称性,这两个结果出现的反面向上,由完备性和对称性,这两个结果出现的反面向上,由完备性和对称性,
2、这两个结果出现的反面向上,由完备性和对称性,这两个结果出现的可能性相等,即可能性相等,即可能性相等,即可能性相等,即n nP P(出现正面)(出现正面)(出现正面)(出现正面)=0.5=0.5;P P(出现反面)(出现反面)(出现反面)(出现反面)=0.5=0.5n概率:是指不确定的结果出现的可能性。概率:是指不确定的结果出现的可能性。n例例 从一副扑克牌(通常去掉大小猴)中任取一张,从一副扑克牌(通常去掉大小猴)中任取一张,取到的是取到的是A,这种可能性就是概率。,这种可能性就是概率。n概率第二定律概率第二定律:如果事件如果事件A和事件和事件B是互斥的是互斥的,那么那么P(A或或B)=P(A
3、)+P(B)n举例:从一副扑克牌中随机抽取一张,记举例:从一副扑克牌中随机抽取一张,记A=“方快方快10”,B=“K”,那么,事件,那么,事件A和事件和事件B是互斥的,于是互斥的,于是是nP(A或或B)=P(A)+P(B)=1/52+4/52=5/52离散概率基础离散概率基础 离散概率基础离散概率基础n n概率第三定律概率第三定律概率第三定律概率第三定律:符号符号符号符号A|BA|B表示事件表示事件表示事件表示事件B B发生的情况下发生的情况下发生的情况下发生的情况下出现了事件出现了事件出现了事件出现了事件A,A,则则则则 P(A|B)P(A|B)n n例:例:例:例:从一副扑克牌中随机抽取一
4、张,记从一副扑克牌中随机抽取一张,记从一副扑克牌中随机抽取一张,记从一副扑克牌中随机抽取一张,记 A=A=“该牌是任何花色该牌是任何花色该牌是任何花色该牌是任何花色K K”,B=B=“该牌是花牌(该牌是花牌(该牌是花牌(该牌是花牌(J J、QQ、K K)”则则则则 P(A|B)=P(A B)/P(B)=离散概率基础离散概率基础 中国学生(C)外国学生(I)合计男生(M)251540女生(W)451560合计7030100n例例 一个班级学生情况统计如下,求一个班级学生情况统计如下,求 P(C|M)n解:解:P(C|M)=离散概率基础离散概率基础 中国学生(C)外国学生(I)合计男生(M)0.2
5、50.150.4女生(W)0.450.150.6合计0.700.301n这个班学生的概率分布为这个班学生的概率分布为n另解:另解:P(C|M)=离散概率基础离散概率基础 n n同理,可求P(M|C)=25/70n n第三定律也可以写成:n n或:n n这就是概率的乘法公式。n n公式中的符号“”也可省去。离散概率基础离散概率基础n n概率第四定律概率第四定律概率第四定律概率第四定律:如果如果如果如果A A、B B是相互独立的事件是相互独立的事件是相互独立的事件是相互独立的事件P(A|B)=P(A)P(A|B)=P(A)n举例:举例:从一副扑克牌中随机抽取一张,记从一副扑克牌中随机抽取一张,记
6、A=“该牌是一张该牌是一张5”,B=“该牌是梅花该牌是梅花”“AB”=“该牌是梅花该牌是梅花5”所以,所以,P(A)=P(A|B)则则 P(A)=4/52=1/13 P(A|B)=P(A和和B)/P(B)=离散概率基础离散概率基础n n第四定律也可以写成:n n或:n n即:独立的两个事件乘积的概率等于概率的乘积。n n这也叫概率的乘法公式。如何计算决策树中的概率如何计算决策树中的概率n nCaroline JanseCaroline Janse是一家消费品公司市场销售经理,她是一家消费品公司市场销售经理,她正在考虑是否生产一种无泡沫的新型自动洗碗清洁正在考虑是否生产一种无泡沫的新型自动洗碗清
7、洁剂。为了使得该问题简化,我们假设市场要么是疲剂。为了使得该问题简化,我们假设市场要么是疲软的,要么是坚挺的。如果市场是坚挺的,那么公软的,要么是坚挺的。如果市场是坚挺的,那么公司将赢利司将赢利18001800万美元,如果市场是疲软的,那么公万美元,如果市场是疲软的,那么公司将亏损司将亏损800800万美元,万美元,根据经验和直觉的综合考虑,根据经验和直觉的综合考虑,卡罗林估计市场是坚挺的概率为卡罗林估计市场是坚挺的概率为30%30%n n在决定是否生产之前,她可以对无泡沫市场进行一在决定是否生产之前,她可以对无泡沫市场进行一项全国性的调查测试,费用将达到项全国性的调查测试,费用将达到2402
8、40万美元。万美元。n n这种市场调查测试不可能完全准确预测新产品市这种市场调查测试不可能完全准确预测新产品市场,也就是说,它可能会误导新产品市场。过去场,也就是说,它可能会误导新产品市场。过去的这类调查结果表明:如果市场是疲软的的这类调查结果表明:如果市场是疲软的(weakly)(weakly),那么有,那么有10%10%的可能性测试结果对市场是肯定的的可能性测试结果对市场是肯定的(Yes)(Yes),同样,如果市场是坚挺的,同样,如果市场是坚挺的(strong)(strong),那么有,那么有20%20%的可能性测试结果对市场是否定的的可能性测试结果对市场是否定的(No)(No)。n n卡
9、罗林可以决定要么不生产无泡沫产品,要么在卡罗林可以决定要么不生产无泡沫产品,要么在决定是否生产之前,进行调查测试;要么不进行决定是否生产之前,进行调查测试;要么不进行调查测试,直接进行生产。调查测试,直接进行生产。n n利用第一讲的方法,我们对Caroline问题构造了如下的决策树:ACG不生产市场调查测试否定的调查结果不生产不调查,生产市场坚挺市场疲软BF生产不生产D生产市场坚挺市场疲软E市场坚挺市场疲软0.30.71800-800-240-10401560-10401560-240p1=?p2=?p3=?p4=?p5=?p6=?答案p1=0.310p2=0.690p3=0.774p4=0.
10、226p5=0.087p6=0.913肯定的调查结果n n解:记 S=市场坚挺,W=市场疲软 Y=调查结果是肯定的 N=调查结果是否定的P(W)=1-P(S)=1-0.3=0.7,n n由已知:P(S)=0.30,n nP(Y|W)=0.1,P(N|S)=0.20P(Y和W)=P(Y|W)P(W)=0.1*0.7=0.07,P(Y|S)=1-P(N|S)=1-0.20=0.80,P(N|W)=1-P(Y|W)=1-0.10=0.90.n nP P1 1=0.31=0.31n nP P2 2=0.69=0.69n nP P3 3=P(S|Y)=P(SQ)/P(Y)=0.24/0.31=0.774
11、=P(S|Y)=P(SQ)/P(Y)=0.24/0.31=0.774n nP P4 4=P(W|Y)=P(W Q)/P(Y)=0.07/0.31=0.226=P(W|Y)=P(W Q)/P(Y)=0.07/0.31=0.226n nP P5 5=P(S|N)=P(S N)/P(N)=0.06/0.69=0.087=P(S|N)=P(S N)/P(N)=0.06/0.69=0.087n nP P6 6=P(W|N)=P(W N)/P(N)=0.63/0.69=0.913=P(W|N)=P(W N)/P(N)=0.63/0.69=0.913市场坚挺(S)市场疲软(W)合计市场调查是坚挺的(Y)0.
12、240.070.31市场调查是疲软的(N)0.060.630.69合计 0.30 0.701.00ACG不生产市场调查测试否定的调查结果不生产不调查,生产市场坚挺市场疲软BF生产不生产D生产市场疲软E市场坚挺市场疲软0.30.71800-800-240-10401560-1040-240p1=0.31p2=0.69P3=0.774p4=0.226P5=0.087p6=0913肯定的调查结果1560市场坚挺972.4-813.8-240972.4135.84-20135.84 Caroline Caroline的最佳策略是:的最佳策略是:n n首先选择市场调查测试;n n当市场调查测试给出肯定的
13、结果时,她选择生产;当市场调查测试给出否定的结果时,她选择不生产;n n这一决策的EMV是$135.84。随机变量及其分布随机变量及其分布 斯隆学院的学生暑期工作的收入资料假定被收斯隆学院的学生暑期工作的收入资料假定被收集到了,去年的情况是这样的(指第一年的集到了,去年的情况是这样的(指第一年的MBAMBA学生的收入):学生的收入):总的工资(12周)获得此类工资的学生所占百分比$21,6005%$16,80025%$12,00040%$6,00025%$05%随机变量及其分布随机变量及其分布 上面的表格就是斯隆学院的学生暑期工作的周收入上面的表格就是斯隆学院的学生暑期工作的周收入(假假设为设
14、为X)X)的分布的分布 随机变量:一个概率模型中可以用数值表随机变量:一个概率模型中可以用数值表 示一个不确示一个不确定的量。用大写的字母定的量。用大写的字母X X、Y Y、W W 等表示等表示如:如:X=X=“斯隆学院的学生暑期工作的周收入斯隆学院的学生暑期工作的周收入”Y=Y=“一个硬币抛一个硬币抛2 2次,出现的正面数次,出现的正面数”W=W=“上海市明年上海市明年7 7月份的降雨的毫米数月份的降雨的毫米数”随机变量及其分布随机变量及其分布n n随机变量的分布需要指出其取值和相应的概率,通常用表格或函数表示n n表格法:X=Bill参加校园招聘计划的收入X21600 16800 1200
15、0 6000 0 Pr0.050.250.400.250.05n n函数法:设Y=“一个硬币抛2次,出现的正面数”,p=抛一次硬币出现正面的概率二项分布二项分布每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率 p 对每次试验结果是相同,进行n次重复试验,出现“成功”的次数的概率分布称为二项分布设设X X为为n n次次重重复复试试验验中中事事件件A A出出现现的的次次数数,X X 取取x x 的的概概率率为为二项分布(二项分布(Excel)计算二项分布的函数是 BINOMDIST(k,n,p,cumulative),它有两种形式例 生产过程的质量控制 假如一个生产过程的产品为合
16、格品的概率是0.83,为废品的概率是0.17,现在假设生产5个这样的产品,求其中至少有一个是废品的概率。解 p=二项分布的应用二项分布的应用案例分析:航空公司机票超售问题整概率分布的体指标整概率分布的体指标n n平均值n n方差与标准差概率分布的整体指标概率分布的整体指标n n平均值:也称期望,定义为随机变量的取值与相应平均值:也称期望,定义为随机变量的取值与相应的概率相乘,再将所有乘积求和的结果,公式是:的概率相乘,再将所有乘积求和的结果,公式是:n n例:例:X=BillX=Bill参加校园招聘计划的收入参加校园招聘计划的收入X21600 16800 12000 6000 0 Pr0.05
17、0.250.400.250.05这个数字含义非常清楚,它就是Bill能够获得期望收入期望值与轮盘赌期望值与轮盘赌长期来看,庄家必赢概率分布的整体指标概率分布的整体指标n n方差:定义为随机变量与其期望偏差的平方的期望方差:定义为随机变量与其期望偏差的平方的期望公式是:公式是:n n例:例:X=BillX=Bill参加校园招聘计划的收入参加校园招聘计划的收入X21600 16800 12000 6000 0 Pr0.050.250.400.250.05这个数字特别大,其单位是平方美元,与X的单位不一致,它的算术平方根是3458.60美元,与X的单位一致,人们更喜欢使用,并称它为标准差随机变量的线
18、性函数随机变量的线性函数n n考虑到Bill参加校园招聘计划有一定的成本(与接收John的机会相比,有时间成本),假如该成本是600美元,那么Bill暑期打工12周的实际收入R1为:n nR1=X-600n n如果换成月收入,那么Bill暑期打工每月的实际收入R2为n nR2=R1=X-200,这是随机变量X的线性函数随机变量的线性函数随机变量的线性函数n n我们可以求出我们可以求出R R2 2的分布:的分布:R1 21000 16200 11400 5600-600 Pr0.050.250.400.250.05R1 7000 5400 3800 1866-200Pr 0.050.250.40
19、0.250.05n n我们也可以求出我们也可以求出R R1 1的分布:的分布:n n有了有了R R1 1的分布,我们自然能够求出的分布,我们自然能够求出R R1 1的期望和标的期望和标准差,并且可以用下面的简化公式。准差,并且可以用下面的简化公式。随机变量的线性函数随机变量的线性函数n n例例 R R1 1的期望和标准差分别是:的期望和标准差分别是:协方差与相关性协方差与相关性n n实例:太阳镜和雨伞的销售量实例:太阳镜和雨伞的销售量概率pi太阳镜的销售量xi雨伞的销售量yi0.135410.1578100.058100.130130.216420.0529220.13510.114260.1
20、52110.054623n n问题:太阳镜和雨伞的销售量之间有问题:太阳镜和雨伞的销售量之间有 关系吗?关系吗?协方差与相关性协方差与相关性n nX X与与Y Y的相关性定义为的相关性定义为n n其中分子其中分子COVCOV(X,YX,Y)叫做)叫做X X与与Y Y的协方差,定义为的协方差,定义为n n例例 太阳镜的销售量与雨伞的销售量的相关性为:太阳镜的销售量与雨伞的销售量的相关性为:联合概率分布与独立性联合概率分布与独立性n n两个事件A与B的独立性是指 P(AB)=P(A)P(B)n n考虑随机变量(X,Y)的概率,记(X,Y)的取值为(xi,yi),相应的概率为pi,将它们列出一个表,
21、就是(X,Y)的联合分布n n例例 记记X=X=“抛一枚均匀硬币出现的正面数抛一枚均匀硬币出现的正面数”Y=Y=“抛一枚均匀硬币出现的正面数减去反面数抛一枚均匀硬币出现的正面数减去反面数”n n则则X X可能的取值是可能的取值是0 0、1 1;Y Y的可能取值是的可能取值是-1,1-1,1联合概率分布与独立性联合概率分布与独立性n nX X与与Y Y的联合分布为:的联合分布为:XY-11010.500.50合计合计0.50.510.50.5联合概率分布与独立性联合概率分布与独立性n n两个变量相互独立,当且仅当n n对所有x、y都是成立的。n n例例 (1 1)上面抛硬币的例子中,)上面抛硬币
22、的例子中,X X与与Y Y独立。独立。(2 2)太阳镜的销售量与雨伞的销售量不独立。)太阳镜的销售量与雨伞的销售量不独立。您能验证一下吗?您能验证一下吗?n n提示:(提示:(1 1)需要写出四个式子验证。)需要写出四个式子验证。(2 2)只要找到一个式子不成立即可。)只要找到一个式子不成立即可。n nP(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1P(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1不相关就是指没有任何关系,比如两个股票,一个涨跌不影响另一个涨跌。两个随机变量的和两个随机变量的和n n在投资市场里,通常要考虑资产组合配置,这
23、就在投资市场里,通常要考虑资产组合配置,这就涉及到随机变量和的概念,最简单的情况是两个涉及到随机变量和的概念,最简单的情况是两个随机变量之和随机变量之和n n假设假设X X、Y Y是两个随机变量,是两个随机变量,Z=Z=a aX+X+b bY Y,其中,其中a a、b b是已知常数,那么是已知常数,那么从该表达式可以看出:(1)若COV(X,Y)0,则Var(aX+bY)a2 Var(X)+b2 Var(Y)(2)若COV(X,Y)0,则Var(aX+bY)a2 Var(X)+b2 Var(Y)由此可见,选择负相关的两个资产组合投资,可以降低风险。见P91案例两个随机变量的和两个随机变量的和n
24、 n例例 假设假设ABAB两个资产的投资收益率分别为两个资产的投资收益率分别为8%8%和和15%15%,方差分别是方差分别是100100元和元和400400元,且它们的协方差为元,且它们的协方差为-150-150,现,现在将在将1 1万元投资万元投资ABAB两个资产,求最佳分配比例。两个资产,求最佳分配比例。n n解解 设投资资产设投资资产A A、B B的比例分别为的比例分别为x x、1-x1-x,则资产组合,则资产组合的方差为的方差为由此可见,当x=68.75%时组合风险达到最小,此时总收益是68.75%*10000*8%+31.25%*10000*15%=1018.75即平均收益率是10.
25、1875%由资产组合确定最佳投资比例由资产组合确定最佳投资比例0.6875股票价格的离散程度反映了股票价格的离散程度反映了投资的风险投资的风险 资产组合收益的平均大小资产组合收益的平均大小 资产组合收益的风险资产组合收益的风险 两股票正相关两股票正相关 基本上同时上升和同时下跌基本上同时上升和同时下跌 投资组合投资组合 两股票正相关两股票正相关 两股票负相关两股票负相关投资组合投资组合 两股票负相关两股票负相关 投资组合投资组合l l正相关股票的投资组合,均值等于这些股票的均值的和,方差大于这些股票的方差的和;l l负相关股票的投资组合,均值等于这些股票的均值的和,方差小于这些股票的方差的和。投资组合理论投资组合理论 美国经济学家哈里.马珂维茨1990年以投资组合理论获得诺贝尔经济学奖。投资组合理论就是在任意给定的预期收益下具有最小风险的投资组合,或者在任意给定的风险水平下具有最大预期收益的投资组合。案列分析案列分析3n n案例分析1:Netway计算机公司服务人员配置n n案例分析2:航空公司食品供应策略n n案例分析3:San Carlos的泥土滑动问题谢谢 谢谢 !