《概率分布与统计推断.ppt》由会员分享,可在线阅读,更多相关《概率分布与统计推断.ppt(95页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率分布与统计推断现在学习的是第1页,共95页一、随机变量的概率分布一、随机变量的概率分布1.随机变量及其概率分布随机变量及其概率分布(1)随机变量:随机变量是定义在样本空间)随机变量:随机变量是定义在样本空间的实的实函数,常用函数,常用X,Y,Z等表示。等表示。它有两个特点:变异性与随机性。它有两个特点:变异性与随机性。按取值情况分类:离散型、连续型。按取值情况分类:离散型、连续型。(2)分布函数:)分布函数:设设X为随机变量,为随机变量,x为任意实数,称为任意实数,称F(x)=PXx为随为随机变量机变量X的概率分布函数或累积概率函数,的概率分布函数或累积概率函数,简称分布函数。简称分布函数
2、。现在学习的是第2页,共95页若随机变量若随机变量X的分布函数的分布函数F(x),则对任意则对任意x1与与x2(x1x2),Px1X x2=F(x2)F(x1)。若若X为连续型随机变量,为连续型随机变量,F(x)是是X的分布函数,的分布函数,则存在非负函数则存在非负函数f(x),对任意对任意x,有有称称f(x)为随机变量为随机变量X的概率密度。的概率密度。现在学习的是第3页,共95页2.常见的概率分布:常见的概率分布:(1)离散型:)离散型:概率密度(分布律)概率密度(分布律)二项分布二项分布 几何分布几何分布 泊松分布泊松分布现在学习的是第4页,共95页(2)连续型:)连续型:均匀分布:概率
3、均匀分布:概率密度函数密度函数指数分布:概率指数分布:概率密度函数密度函数现在学习的是第5页,共95页-4-2024600.050.10.150.20.250.30.350.4正态分布:正态分布:密度函数:密度函数:标准正态分布:标准正态分布:N(0,1)密度函数:密度函数:现在学习的是第6页,共95页2分布:分布:若随机若随机变变量量X1,X2,Xn相互独立,都服从相互独立,都服从标标准正准正态态分分布布N(0,1),则则随机随机变变量量服从自由度服从自由度为为n的的 分布,分布,记为记为:的均值为的均值为n,方差为,方差为2n.现在学习的是第7页,共95页 t-分布分布若若XN(0,1),
4、且相互独立,且相互独立,则则随机随机变变量量服从自由度服从自由度为为n的的t分布,分布,记为记为Tt(n),t分布:分布:t(20)的密度函数曲线和的密度函数曲线和N(0,1)的密度函数的密度函数曲线形状相似曲线形状相似.时时,现在学习的是第8页,共95页 F-分布分布且相互独立,且相互独立,则则随机随机变变量量服从自由度服从自由度为为(n1 n2)的的F分布,分布,记为记为FF(n1 n2)。F(10,50)密度函数曲线:密度函数曲线:现在学习的是第9页,共95页3.常见概率分布的常见概率分布的MATLAB命令命令运算功能符:运算功能符:pdf:概率密度,概率密度,cdf:分布函数分布函数,
5、inv:逆分布函数,逆分布函数,stat:均值与方差,均值与方差,rnd:产生随机数产生随机数概率分布符:概率分布符:分布均匀几何超几何指数正态2tF二项泊松字符unifgeohypeexpnormchi2tfbionpoiss (当需要一种分布的某一类函数时,将以上所列(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可量(可以是标量、数组或矩阵)和参数即可.)现在学习的是第10页,共95页例例1.1 (1)x,y=expstat(2),求出参数为求出参数为2的指数分布的指
6、数分布的均值与方差。的均值与方差。(2)a=2,3 x,y=expstat(a),(3)a=2,3;3,4 x,y=expstat(a),构成参数为构成参数为2和参数为和参数为3的的指数分布的均值数组与方指数分布的均值数组与方差数组。差数组。构成参数为构成参数为2和参数为和参数为3参参数为数为3和参数为和参数为4的指数分的指数分布的均值矩阵与方差矩阵。布的均值矩阵与方差矩阵。现在学习的是第11页,共95页(4)x=normcdf(2,1,0.5),正态分布正态分布XN(1,0.52)累计概率累计概率F(2)(5)c=0:0.2:1 x=normcdf(c,1,0.5),正态分布正态分布XN(1
7、,0.52)累计概率累计概率F(0),F(0.2),F(1)(6)n=10;a=;for j=1:n a(j)=unifrnd(0,1)end 现在学习的是第12页,共95页例例1.2 设设(1)若若 求求P1.8X2.9(2)若若 PX0称为右偏态,称为右偏态,此时数据位于均值右边的比位于左边的多;此时数据位于均值右边的比位于左边的多;g1 0称为左偏态,情况相反;称为左偏态,情况相反;而而g1接近接近0则可认为分布是对称的则可认为分布是对称的.峰度峰度:正态分布的峰度为正态分布的峰度为3,若,若g2比比3大很多,说明样本大很多,说明样本中含有较多远离均值的数据,因而峰度可用作衡量中含有较多
8、远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一偏离正态分布的尺度之一 现在学习的是第26页,共95页 k阶阶原点矩原点矩:k阶阶中心矩中心矩:(4)样样本的矩本的矩:现在学习的是第27页,共95页将将样样本本观观察察值值依大小次序排列,得区间依大小次序排列,得区间现现的次数的次数ni 频频数。数。频频率率:统计样统计样本本观查值观查值在每个小区在每个小区间间中出中出2.频频数和数和频频率:率:等分该区间,等分该区间,输输出出频频数表:数表:n,y=hist(x,k),k为为等分区等分区间间数。数。输输出出频频数直方数直方图图:hist(x,k)设设来自来自总总体体X的一的一组样组样本
9、本为为:X1,X2,Xn现在学习的是第28页,共95页3.计算统计量的计算统计量的MATLAB命令命令均均值值:mean(x),中位数中位数:median(x),标标准差准差:std(x),方差方差var(x),偏度偏度:skewness(x),峰度:峰度:kurtosis(x),原点矩原点矩:kurtosis(x,k),中心矩中心矩:moment(x,k).现在学习的是第29页,共95页例例2.1 为设计为设计公交公交车车门车车门的高度,随机抽的高度,随机抽查查了了100名成年男子的身高名成年男子的身高(单单位位cm):):x=182,176,168,175,166,171,172,169,
10、172,171,172,181,177,172,178,181,166,173,184,177,180,176,176,170,178,168,181,178,171,177,186,180,157,185,174,171,169,192,186,159,161,193,182,187,180,173,167,174,162,163,187,186,184,175,173,174,168,172,183,181,174,162,187,175,174,169,175,174,175,182,183,169,182,170,179,172,173,174,166,175,165,178,165,
11、182,173,174,190,176,182,179,183,167,165,174,181,186,165,172,173,178求出身高数据的均求出身高数据的均值值、中位数,、中位数,标标准差、峰度,准差、峰度,绘绘出出频频数直方数直方图图,若,若车门车门高度是按成年男子与高度是按成年男子与车门顶车门顶碰碰头头的机会不超的机会不超过过1%设设计计,求,求车门车门最低高度是多少?最低高度是多少?现在学习的是第30页,共95页 x=182,176,.;T=mean(x),median(x),std(x),kurtosis(x)得得:T=175.2000,174.5000,7.3691,2.7
12、241hist(x,7)现在学习的是第31页,共95页设车门设车门高度高度为为h,成年男乘客身高是随机,成年男乘客身高是随机变变量量X,h=norminv(0.99,175.2,7.3691)得得:h=1.9234车门最低高度为:车门最低高度为:1.9234现在学习的是第32页,共95页计算:计算:即求即求h使:使:可用数值积分的方法求得;可用数值积分的方法求得;取取h=185,190,195,计算上述积分,找出积分计算上述积分,找出积分值大于值大于0.99的所对应的的所对应的h。现在学习的是第33页,共95页Matlab中关于数值积分的命令:中关于数值积分的命令:(1)quad函数:基于变步
13、长函数:基于变步长simpson法计算积分。法计算积分。该函数调用格式:该函数调用格式:I,n=quad(fname,a,b,Tol,trace)其中:其中:fname是被积函数名是被积函数名 a,b是积分上下限是积分上下限 Tol是精度控制值,省却时取是精度控制值,省却时取0.001 Trace:控制是否显示展现积分过程,取控制是否显示展现积分过程,取0不展现不展现 I:积分值:积分值 n:被积函数调用次数:被积函数调用次数现在学习的是第34页,共95页如:求积分如:求积分ac=inline(sin(x)./x,x)s=quad(ac,pi/4,pi/2)如:求椭圆周长如:求椭圆周长现在学习
14、的是第35页,共95页h=185:1:195;p=;ab=inline(1/(7.3691*(2*pi)0.5)*exp(-(x-175.2).2/(2*7.38912),x)for i=1:11 h(i);p(i)=0.5+quad(ab,175.2,h(i);endA=h;p现在学习的是第36页,共95页A=185.0000 0.9087 186.0000 0.9292 187.0000 0.9461 188.0000 0.9596 189.0000 0.9704 190.0000 0.9787 191.0000 0.9851 192.0000 0.9898 193.0000 0.9933
15、 194.0000 0.9959 195.0000 0.9977现在学习的是第37页,共95页Matlab中关于数值积分的命令:中关于数值积分的命令:(2)quad8函数:函数:用用8 8样样条牛条牛顿顿-柯特斯法柯特斯法计计算算积积分。分。函数函数调调用格式:用格式:I,n=quad8(I,n=quad8(fnamefname,a,b,Tol,trace),a,b,Tol,trace)TolTol是精度控制是精度控制值值,省却,省却时时取取该该函数可更精确的求定函数可更精确的求定积积分。分。(3)trapz函数:用梯形法计算积分,函数:用梯形法计算积分,适用于被积函数为离散数据时,适用于被积
16、函数为离散数据时,求函数的定积分。求函数的定积分。该函数调用格式:该函数调用格式:I=trapz(x,y)现在学习的是第38页,共95页例例2.2 某地为了发展旅游产业及美化环境,规划将一片水某地为了发展旅游产业及美化环境,规划将一片水域改造成一个景观湖,需测算该水域的面积,并计划沿湖域改造成一个景观湖,需测算该水域的面积,并计划沿湖修建一条观光道路。已在水域边界上测量了修建一条观光道路。已在水域边界上测量了n个点的坐标个点的坐标(见表),现要求解决下列问题:(见表),现要求解决下列问题:(1)做出该水域的平面图做出该水域的平面图(2)求出该水域面积的近似值求出该水域面积的近似值(3)求出该水
17、域边界的周长求出该水域边界的周长现在学习的是第39页,共95页表:表:湖的湖的边边界点界点实测实测坐坐标标X215.028.652.061.875.492.9105.9Y138.518.612.45.810.623.836.838.8Y238.578.586.881.598.6114.2160.6172.8X121.1140.8157.2180.5216.8248.5279.8310.4Y125.428.718.838.650.520.45.432.8Y2176.6165.5158.6155.6186.8252.4268.8276.7X335.0360.6378.5400.1420.5448.
18、5470.5493.1Y151.956.872.866.655.565.590.5170.4Y2275.4258.2235.2228.9198.5195.5188.1170.4现在学习的是第40页,共95页A=2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20
19、.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,252.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4;x=A(1,:),A(4,:),A(7,:);y1=A(2,:),A(5,:),A(8,:);y2=A(3,:),A(6,:),A(9,:);plot(x,y1,x,y2)axis equal现在学习的是第
20、41页,共95页A=2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,252.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5
21、,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4;x=A(1,:),A(4,:),A(7,:);y1=A(2,:),A(5,:),A(8,:);y2=A(3,:),A(6,:),A(9,:);x1=fliplr(x);y21=fliplr(y2);x0=x,x1;y0=y1,y21plot(x0,y0)axis equalfill(x0,y0,b)Mianji=trapz(x,y2-y1)现在学习的是第42页,共95页Mianji=7.333
22、1e+004现在学习的是第43页,共95页三、数据的处理三、数据的处理1.数据矩阵的建立与常用的统计操作命令数据矩阵的建立与常用的统计操作命令(1)由)由word文档建立数据矩阵文档建立数据矩阵(2)由)由excel文档建立数据矩阵文档建立数据矩阵(3)常用的统计操作命令)常用的统计操作命令 mean(A):求矩阵求矩阵A的各列的均值的各列的均值 var(A):求矩阵求矩阵A的各列的方差的各列的方差 std(A):求矩阵求矩阵A的各列的标准差的各列的标准差 rang(A):求矩阵求矩阵A的各列的极差的各列的极差 cov(A):求矩阵求矩阵A的各列的协方差矩阵的各列的协方差矩阵 corrcoef
23、(A):求矩阵求矩阵A的各列的相关系数矩阵。的各列的相关系数矩阵。现在学习的是第44页,共95页2.向量的距离与夹角余弦向量的距离与夹角余弦(1)设两个)设两个n维向量维向量称为向量称为向量x与与y的欧氏距离。的欧氏距离。称为向量称为向量x与与y的绝对距离。的绝对距离。称为向量称为向量x与与y的闵可夫斯基的闵可夫斯基距离。距离。现在学习的是第45页,共95页称为向量称为向量x的的2-范数。范数。称称 向量向量x与向量与向量y的夹角余弦的夹角余弦现在学习的是第46页,共95页(2)距离与夹角余弦的)距离与夹角余弦的matlab命令命令 pdist(X)计算矩阵计算矩阵X每一行向量之间的欧氏距离。
24、每一行向量之间的欧氏距离。pdist(X,cityblock)计算计算X每一行向量之间的绝对距离。每一行向量之间的绝对距离。pdist(X,cosine)计算计算X每一行向量之间的夹角余弦。每一行向量之间的夹角余弦。(注:实为(注:实为1-夹角余弦)夹角余弦)dist(X,Y)计算矩阵计算矩阵X每一行向量与矩阵每一行向量与矩阵Y的每一列的每一列 向量之间的欧氏距离。向量之间的欧氏距离。mandist(X,Y)计算矩阵计算矩阵X每一行向量与矩阵每一行向量与矩阵Y的每一列的每一列 向量之间的绝对距离。向量之间的绝对距离。sort(A):对列矩阵对列矩阵A的列元素从低到高排序。的列元素从低到高排序。
25、现在学习的是第47页,共95页例例3.1:2002年城镇居民家庭平均每人全年购买的主要商品数据如表所年城镇居民家庭平均每人全年购买的主要商品数据如表所示,试比较哪两年数据差异最小,哪两年差异最大。示,试比较哪两年数据差异最小,哪两年差异最大。项目19851990199519992000粮食134.76130.729784.9182.31鲜菜144.36138.7116.47114.94114.74食用油5.766.47.117.788.16猪肉16.6818.617.2416.9116.73牛羊肉2.023.282.443.093.33家禽3.243.423.974.925.44鲜蛋6.847
26、.259.7410.9211.21水产品7.087.699.210.349.87食糖2.522.141.681.811.70数据来源:数据来源:2002年中国统计年鉴年中国统计年鉴,数据单位:,数据单位:kg现在学习的是第48页,共95页A=134.76,130.72,97,84.91,82.31;144.36,138.7,116.47,114.94,114.74;5.76,6.4,7.11,7.78,8.16;16.68,18.6,17.24,16.91,16.73;2.02,3.28,2.44,3.09,3.33;3.24,3.42,3.97,4.92,5.44;6.84,7.25,9.7
27、4,10.92,11.21;7.08,7.69,9.2,10.34,9.87;2.52,2.14,1.68,1.81,1.70;C=pdist(A,cosine);d1=pdist(A);d2=pdist(A,cityblock);B=C,d1,d2 P,i=sort(B)现在学习的是第49页,共95页B=0.0001 7.3999 15.1000 0.0029 47.1182 74.5700 0.0090 58.1931 92.3200 0.0109 60.5658 96.0100 0.0026 40.5372 63.8700 0.0087 51.8723 80.9800 0.0107 54
28、.3039 84.6500 0.0019 12.3734 18.6700 0.0029 15.0238 22.5000 0.0001 2.7608 4.9900夹角余弦夹角余弦欧氏距离欧氏距离绝对距离绝对距离现在学习的是第50页,共95页P=0.0001 2.7608 4.9900 0.0001 7.3999 15.1000 0.0019 12.3734 18.6700 0.0026 15.0238 22.5000 0.0029 40.5372 63.8700 0.0029 47.1182 74.5700 0.0087 51.8723 80.9800 0.0090 54.3039 84.650
29、0 0.0107 58.1931 92.3200 0.0109 60.5658 96.0100排序后的夹角余弦、欧氏距离、绝对距离排序后的夹角余弦、欧氏距离、绝对距离现在学习的是第51页,共95页i=10 10 10 1 1 1 8 8 8 5 9 9 9 5 5 2 2 2 6 6 6 3 7 7 7 3 3 4 4 4次序:次序:结论:结论:(1)1999年与年与2000年的年的数据差异最小。数据差异最小。(2)1985年与年与2000年的年的数据差异最大。数据差异最大。现在学习的是第52页,共95页3.数据属性的处理数据属性的处理(1)评价指标的无量纲化)评价指标的无量纲化评价指标通常分
30、为效益型、成本型、固定型等,效益型指评价指标通常分为效益型、成本型、固定型等,效益型指标值越大越好、成本型指标值越小越好、固定型指标值既标值越大越好、成本型指标值越小越好、固定型指标值既不能太大也不能太小为好。不能太大也不能太小为好。对方案进行综合评价,必须先进行指标的无量纲化处理。常对方案进行综合评价,必须先进行指标的无量纲化处理。常见的处理方法有极差变换、线性比例变换见的处理方法有极差变换、线性比例变换 设设有有m项评项评价指价指标标的指的指标标矩矩阵为阵为现在学习的是第53页,共95页用用I1,I2,I3分分别别表示效益型,成本型和固定型指表示效益型,成本型和固定型指标标集合,集合,用极
31、差变换法建立无量纲的效益型矩阵用极差变换法建立无量纲的效益型矩阵B=(bij),:现在学习的是第54页,共95页用线性比例法建立无量纲的效益型矩阵用线性比例法建立无量纲的效益型矩阵D=(dij):现在学习的是第55页,共95页例例3.2:(湖泊的水质的评价)近年来我国湖泊水质富营养化的问题日:(湖泊的水质的评价)近年来我国湖泊水质富营养化的问题日益严重,正确评价湖水的水质情况,有利于今后开展对湖水的污染治益严重,正确评价湖水的水质情况,有利于今后开展对湖水的污染治理和保护工作。下表理和保护工作。下表2所列为我国所列为我国12个湖泊评价参数实测数据,表个湖泊评价参数实测数据,表1所列为我国对湖泊
32、水质评价标准,试建立模型对我国的所列为我国对湖泊水质评价标准,试建立模型对我国的12个湖泊的水质个湖泊的水质进行评价,确定各个湖水质的等级。进行评价,确定各个湖水质的等级。极贫营养贫营养中营养富营养极富营养总磷/(mg/L)660耗氧量(mg/L)27.1透明度/m37 12 2.4 0.55 0.17总氮/(mg/L)4.6表表1 1 湖泊水湖泊水质评质评价价标标准准现在学习的是第56页,共95页总磷/(mg/L)耗氧量(mg/L)透明度/m总氮/(mg/L)杭州西湖13010.300.352.76武汉东湖10510.700.402.0青海湖201.44.50.22巢湖306.260.251
33、.67滇池2010.130.500.23鄱阳湖1001.51.250.9太湖1398.69 0.8251.04洞庭湖1419.510.851.11洪泽湖1177.061.651.26阳澄湖409.71.3152.664洪湖457.831.651.33湖北武湖1078.11.521.075表表2 2:全国:全国1212个湖泊的个湖泊的实测实测数据数据现在学习的是第57页,共95页问题问题分析:如何分析:如何归类归类?以距离最近原以距离最近原则进则进行行归类归类。指指标标的量的量纲纲不同,数据的大小不同,数据的大小级别级别不同。不同。对对数据数据统统一量一量纲纲,使用使用线线性比例性比例变换变换(
34、1212个湖泊的个湖泊的实测实测数据矩数据矩阵阵)现在学习的是第58页,共95页A=130,10.30,0.35,2.76;105,10.70,0.40,2.0;20,1.4,4.5,0.22;30,6.26,0.25,1.67;20,10.13,0.50,0.23;100,1.5,1.25,0.9;139,8.69,0.825,1.04;141,9.51,0.85,1.11;117,7.06,1.65,1.26;40,9.7,1.315,2.664;45,7.83,1.65,1.33;107,8.1,1.52,1.075;B=A(:,1)./max(A(:,1),A(:,2)./max(A(
35、:,2),min(A(:,3)./A(:,3),A(:,4)./max(A(:,4)C=1,4,23,110,660;0.09,0.36,1.80,7.10,27.1;37,12,2.4,0.55,0.17;0.02,0.06,0.31,1.20,4.6;D=C(1,:)./max(C(1,:);C(2,:)./max(C(2,:);min(C(3,:)./C(3,:);C(4,:)./max(C(4,:)mjd=mandist(B,D)px,i=sort(mjd);pp=i现在学习的是第59页,共95页B=0.9220 0.9626 0.7143 1.0000 0.7447 1.0000 0
36、.6250 0.7246 0.1418 0.1308 0.0556 0.0797 0.2128 0.5850 1.0000 0.6051 0.1418 0.9467 0.5000 0.0833 0.7092 0.1402 0.2000 0.3261 0.9858 0.8121 0.3030 0.3768 1.0000 0.8888 0.2941 0.4022 0.8298 0.6598 0.1515 0.4565 0.2837 0.9065 0.1901 0.9652 0.3191 0.7318 0.1515 0.4819 0.7589 0.7570 0.1645 0.3895现在学习的是第6
37、0页,共95页D=0.0015 0.0061 0.0348 0.1667 1.0000 0.0033 0.0133 0.0664 0.2620 1.0000 0.0046 0.0142 0.0708 0.3091 1.0000 0.0043 0.0130 0.0674 0.2609 1.0000现在学习的是第61页,共95页mjd=3.5851 3.5523 3.3594 2.6003 0.4011 3.0805 3.0478 2.8548 2.0957 0.9057 0.3942 0.3614 0.1990 0.5907 3.5920 2.3891 2.3563 2.1634 1.4043
38、1.5971 1.6581 1.6254 1.4324 1.0780 2.3281 1.3617 1.3289 1.1360 0.8387 2.6245 2.4640 2.4313 2.2383 1.4913 1.5222 2.5713 2.5385 2.3456 1.6164 1.4149 2.0839 2.0511 1.8581 1.4142 1.9024 2.3318 2.2990 2.1061 1.5849 1.6544 1.6705 1.6378 1.4448 1.0009 2.3157 2.0561 2.0233 1.8303 1.3605 1.9302现在学习的是第62页,共95
39、页pp=5 4 3 2 1 5 4 3 2 1 3 2 1 4 5 4 5 3 2 1 4 3 2 1 5 4 3 2 1 5 4 5 3 2 1 5 4 3 2 1 4 3 5 2 1 4 5 3 2 1 4 3 2 1 5 4 3 5 2 1等级杭州西湖5武汉东湖5青海湖3巢湖4滇池4鄱阳湖4太湖4洞庭湖5洪泽湖4阳澄湖4洪湖4湖北武湖4现在学习的是第63页,共95页每股收益(元)每股净资产(元)每股现金流量净资产收益率(%)主营收入增长率(%)主营利润增长率(%)资产负债比率(%)海尔0.3965.6601.6507.2723.0946.2147.73海信0.3046.860-0.130
40、4.54-4.5090.4052.79奥柯玛0.0151.6700.2300.885611.68-46.5978.85长虹0.0363.510-0.3301.040419.4626.5367.55苏泊尔0.2504.4960.1305.6135.9527.0527.47小天鹅0.2105.050-1.1604.3349.018.1759.75TCL0.0532.4830.1542.1412.23275.4665.73美的0.2205.1200.0405.0496.13172.0064.55美菱0.0725.195-0.7901.383113.41-50.0363.36格力0.3325.0601
41、.1206.7868.9154.8475.49例例3.3:(经营业绩的评价)下表为:(经营业绩的评价)下表为2011年第一季度年第一季度10家家电类的上市家家电类的上市公司的部分财务指标数据,要求根据这些数据对这公司的部分财务指标数据,要求根据这些数据对这10家公司的经营业家公司的经营业绩做出合理的综合排名。绩做出合理的综合排名。现在学习的是第64页,共95页 输入原始数据矩阵输入原始数据矩阵X(1)用极差变换法建立无量纲的效益型矩阵)用极差变换法建立无量纲的效益型矩阵B=(bij),:B=(X(:,1:6)-ones(10,1)*min(X(:,1:6),max(X(:,7)-X(:,7).
42、/(ones(10,1)*range(X)现在学习的是第65页,共95页(2)求出理想最佳和最劣方案向量)求出理想最佳和最劣方案向量U和和V U=max(X(:,1:6),min(X(:,7)V=min(X(:,1:6),max(X(:,7)(3)计算相对偏差矩阵)计算相对偏差矩阵R和和T R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X)T=abs(X-ones(10,1)*V)./(ones(10,1)*range(X)(4)求客观权向量)求客观权向量w r0=normc(R)t0=normc(T)w=sum(r0.*t0)/sum(sum(r0.*t0
43、)(5)计算得分、排序)计算得分、排序 df=B*(w)a,n=sort(df)现在学习的是第66页,共95页X=0.396,5.660,1.650,7.27,23.09,46.21,47.73;0.304,6.860,-0.130,4.54,-4.50,90.40,52.79;0.015,1.670,0.230,0.8856,11.68,-46.59,78.85;0.036,3.510,-0.330,1.0404,19.46,26.53,67.55;0.250,4.496,0.130,5.61,35.95,27.05,27.47;0.210,5.050,-1.160,4.33,49.01,8
44、.17,59.75;0.053,2.483,0.154,2.14,12.23,275.46,65.73;0.220,5.120,0.040,5.04,96.13,172.00,64.55;0.072,5.195,-0.790,1.3831,13.41,-50.03,63.36;0.332,5.060,1.120,6.78,68.91,54.84,75.49;B=(X(:,1:6)-ones(10,1)*min(X(:,1:6),max(X(:,7)-X(:,7)./(ones(10,1)*range(X)U=max(X(:,1:6),min(X(:,7)V=min(X(:,1:6),max(X
45、(:,7)R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X)T=abs(X-ones(10,1)*V)./(ones(10,1)*range(X)现在学习的是第67页,共95页r0=normc(R)t0=normc(T)w=sum(r0.*t0)/sum(sum(r0.*t0)df=B*(w)a,n=sort(df)aa=flipud(a)nn=flipud(n)现在学习的是第68页,共95页 1 10 8 5 2 6 7 9 4 3 0.6942 0.6006 0.5989 0.5675 0.5158 0.3858 0.3418 0.2332 0.2195
46、 0.1079得分排名1海尔0.694212海信0.515853奥柯玛0.1079104长虹0.219595苏泊尔0.567546小天鹅0.385867TCL0.341878美的0.598939美菱0.2332810格力0.60062现在学习的是第69页,共95页四、参数估计四、参数估计总总体体X的分布函数的分布函数去估去估计计某些未知参数或数字特征。某些未知参数或数字特征。参数估参数估计问题计问题:(一一)点估点估计计:构造统计量构造统计量作作为为参数参数 的估的估计值计值。1.矩估矩估计计法:用法:用样样本的本的k阶阶矩估矩估计总计总体的体的k阶阶矩,矩,得到得到k个方程求出个方程求出k个
47、参数个参数现在学习的是第70页,共95页例例4.1设总设总体体X的概率密度的概率密度为为:试试求求 的矩估的矩估计计。解:解:样样本本1阶阶矩:矩:总总体的体的1阶阶矩:矩:现在学习的是第71页,共95页2.极大似然估极大似然估计计法:法:设总设总体体X的概率密度的概率密度为为为总为总体体X的一的一组样组样本,本,为这组样为这组样本的本的观观察察值值,构造似然函数:,构造似然函数:由由 求出求出现在学习的是第72页,共95页(二二)区区间间估估计计:求未知参数的范:求未知参数的范围围,构造两个统计量构造两个统计量使得:使得:则则称随机区称随机区间间为为参数参数的置信度的置信度为为1-的置信区的
48、置信区间间。MATlAB统计统计工具箱中,参数估工具箱中,参数估计计的命令:的命令:fit 如:如:a=expfit(X):指数分布参数的点估计值,指数分布参数的点估计值,a,b=expfit(x,alpha):指数分布参数的区间估计值。指数分布参数的区间估计值。alpha:显著性水平显著性水平现在学习的是第73页,共95页例例4.2 有一批糖果,从中随机抽取有一批糖果,从中随机抽取16代,称得其重量代,称得其重量(克)(克)为为:506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496。设设袋装糖果的袋装糖果的质质量近似服
49、从正量近似服从正态态分布,分布,试试求求总总体均体均值值和和标标准差的置信度准差的置信度为为0.95的置信区的置信区间间。x=506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496;a,b,ar,br=normfit(x,0.05)现在学习的是第74页,共95页 五、假设检验五、假设检验 对总体对总体X的分布律或分布参数作某种假设,的分布律或分布参数作某种假设,根据抽取的样本观察值,用数理统计的分析方法,根据抽取的样本观察值,用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设检验这种假设是否正确,从而决
50、定接受假设或拒绝假设.(一)单个正态总体均值检验(一)单个正态总体均值检验1.已知总体已知总体X服从正态分布,方差服从正态分布,方差2已知,已知,对其均值对其均值的检验。的检验。设设X1,X2,Xn为总为总体体X的一的一组样组样本,本,现在学习的是第75页,共95页(1)双边检验:)双边检验:原假设原假设:备择假设:备择假设:构造统计量:构造统计量:给定显著性水平给定显著性水平 ,由由 计算临界值计算临界值 ,得拒绝域得拒绝域现在学习的是第76页,共95页(2)单边检验:)单边检验:原假设:原假设:备择假设:备择假设:(或(或 )构造统计量:构造统计量:给定显著性水平给定显著性水平 ,由由 计