《数学建模方法之概率统计分析法幻灯片.ppt》由会员分享,可在线阅读,更多相关《数学建模方法之概率统计分析法幻灯片.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数学建模方法之概率统计分析法第1页,共41页,编辑于2022年,星期六l主成分分析 因子模型l马氏链模型 统计回归模型l排队论模型 概率模型第2页,共41页,编辑于2022年,星期六第一篇 主成分分析l在实际经济工作中,我们经常碰到多变量或多指标问题,例如,企业经济效益的评价,地区经济发展情况比较。由于变量或指标较多,且变量或指标之间存在一定的相关性,人们自然希望用较少的变量或指标代替原来较多的变量或指标,而且可尽量保存原有信息,利用这种降维的思想产生了主成分分析方法第3页,共41页,编辑于2022年,星期六l主成分分析法:就是设法将原来的具有一定相关性的变量或者指标,重新组成一组新的相互无关
2、的少数几个综合变量或指标,以此代替原来的变量或指标。简单的说就是降维。l应用:综合评价(系统评估)第4页,共41页,编辑于2022年,星期六例:对我国上市公司的经济效益进行综合评判。上市公司资金利税率x1产值利税率x2百元销售成本利润x3百元销售收入利税x4流动资金周转次数x5主营利润增长率x6qinghua5.418.052.092.431.307.51beida7.218.544.515.261.4310.44hualian8.389.524.275.071.7010.49xinya6.319.973.634.591.297.21yanzhong8.971.431.731.181.105.
3、22shuiyun3.746.470.330.390.985.24cengxin3.635.79-1.09-1.291.174.71qingshan14.475.977.621.371.2010.56pudong8.188.203.414.011.7512.13第5页,共41页,编辑于2022年,星期六l主成分分析步骤:1.将数据标准化,标准化后的数据矩阵仍记X阵。2.求矩阵X的相关系数阵 3.求R的全部特征根i及相应的特征向量()。4.根据前k个主分量累计贡献率大小(),确定主成分(因子)个数。l根据具体指标内容和指标变量系数大小解释主成分含义。l用每个主成分的贡献率作权数,给出多指标综合评
4、价值。第6页,共41页,编辑于2022年,星期六l Eigenvalues of the Correlation Matrixl Eigenvalue Difference Proportion Cumulativel 1 4.04767016 3.03734802 0.6746 0.6746l 2 1.01032214 0.30248369 0.1684 0.8430l 3 0.70783845 0.55300190 0.1180 0.9610l 4 0.15483655 0.10037328 0.0258 0.9868l 5 0.05446327 0.02959385 0.0091 0.9
5、959l 6 0.02486942 0.0041 1.0000第7页,共41页,编辑于2022年,星期六第8页,共41页,编辑于2022年,星期六lObs Prin1 Prin2 Prin3 Prin4 Prin5 Prin6l 1 -0.38118 -0.32367 -0.04450 0.30363 0.00430 0.06437l 2 0.57795 -0.35416 0.49279 0.55119 -0.18726 0.17414l 3 0.69219 -0.21588 0.40557 0.40041 -0.10461 0.05393l 4 0.22635 -0.39419 0.2752
6、1 0.63296 0.13851 -0.06481l 5 -0.82981 -0.40293 0.47330 -0.42964 -0.55401 -0.35020l 6 -1.19410 -0.40627 -0.36848 0.14000 0.02221 0.01063l 7 -1.63568 -0.26394 -0.67179 -0.15189 0.01702 -0.03769l 8 0.95195 -0.46156 1.61851 -0.92520 0.08394 0.25530l 9 0.46501 -0.14888 0.19070 0.16273 -0.30327 0.20883l
7、10 -1.45693 -0.18670 -0.55658 -0.17088 -0.10267 -0.00922l 11 -0.29401 3.71727 -0.02727 -0.02382 -0.06419 0.03517l 12 0.08041 0.22542 1.71694 0.12718 0.45539 -0.26668l 13 -2.11628 -0.16312 -0.90179 -0.16784 0.14422 -0.03334l 14 -0.94513 -0.31477 -0.39513 0.09760 0.11375 -0.03132l 15 6.74015 -0.06989
8、-1.12895 -0.16618 0.04080 -0.11394l 16 -0.88090 -0.23673 -1.07853 -0.38025 0.29589 0.10482第9页,共41页,编辑于2022年,星期六用于系统评估的方法:关键问题是如何科学的客观地将一个多指标问题转化为单指标问题l第一种方法:用第一主成分得分y=F1.必须要求:所有系数均为正 第二种方法:将主成分F1,F2,Fm进行线性组合,系数为方差贡献率第10页,共41页,编辑于2022年,星期六l yi di yi zhu cheng fen pai xv 13:30 Saturday,July 17,1999 35
9、l l name Prin1 x1 x2 x3 x4 x5 x6 l l laigang -2.11628 2.17 5.70 -2.11 -2.57 1.34 3.21 l cengxin -1.63568 3.63 5.79 -1.09 -1.29 1.17 4.71 l xinbai -1.45693 4.27 5.35 -0.71 -0.83 1.38 5.68 l shuiyun -1.19410 3.74 6.47 0.33 0.39 0.98 5.24 l guangsha -0.94513 4.65 7.80 0.53 0.65 1.18 5.82 l chanhong -0.
10、88090 5.65 10.63 -0.92 -1.19 1.08 8.84 l yanzhong -0.82981 8.97 1.43 1.73 1.18 1.10 5.22 l Qinghua -0.38118 5.41 8.05 2.09 2.43 1.30 7.51 l guoji -0.29401 8.07 8.69 0.73 0.89 10.75 10.16 l zonghang 0.08041 9.66 6.27 6.69 2.63 3.05 1.64 l xinya 0.22635 6.31 9.97 3.63 4.59 1.29 7.21 l pudong 0.46501 8
11、.18 8.20 3.41 4.01 1.75 12.13 l beida 0.57795 7.21 8.54 4.51 5.26 1.43 10.44 l hualian 0.69219 8.38 9.52 4.27 5.07 1.70 10.49 l qingshan 0.95195 14.47 5.97 7.62 1.37 1.20 10.56 l xiaxin 6.74015 25.95 33.52 6.96 15.38 1.51 36.89 l 第11页,共41页,编辑于2022年,星期六统计软件SAS(关于主成分分析)l数据的输入(介绍两种方法)data 数据名(haimen);i
12、nput name$x1 x2 x3 x4 x5 x6;card;qinghua 50122 run;外部文件转化为SAS数据集:已知c盘根目录下文件名test.dat为的数据文件 张三 男 82 95 64 78 data 数据名(chengji);infile c:test.dat;input name$sex$chinese maths english chemisty;run;第12页,共41页,编辑于2022年,星期六主成分分析lProc princomp n=6 out=out1;var x1-x6;run;proc print data=out1;var prin1-prin6;
13、run;第13页,共41页,编辑于2022年,星期六数据预处理l一致性处理:越大越差、越大越好l归一化处理(去量纲):(x-max(xi)/极差,x/max(xi),标准化处理 (x-均值)/方差第14页,共41页,编辑于2022年,星期六第二篇 因子模型l因子分析是统计中一种重要的分析方法,他的主要特点在于能探索不易观测或不能观察的潜在因素。它在社会调查、气象、地质等方面有广泛应用。第15页,共41页,编辑于2022年,星期六l若有n个学生,每个学生考五门课,考试成绩反映了学生的素质和能力,理解能力,逻辑能力,记忆能力,对文字符号概念的反应速度,能否从学生的学习成绩去寻找出反映这些能力的量。
14、第16页,共41页,编辑于2022年,星期六因子模型为:其中:为原指标,称为 的公共因子或潜因子,为 的特殊因子 可将上式写成矩阵表示形式:称为因子载荷阵 第17页,共41页,编辑于2022年,星期六l因子分析步骤:l 前四步骤与主成分步骤相同,在此略。5.求初始因子载荷阵A。6.若公因子的含义不清楚,不便于实际解释时,将初始因子阵作旋转处理,直到达到要求。7.根据因子载荷大小说明因子具体含义。l将因子表示成原指标变量线性组合,估计因子得分。l用每个因子的贡献率作权数,给出多指标综合评价值。第18页,共41页,编辑于2022年,星期六l因子载荷阵 的统计意义l模型中载荷矩阵 中的元素 称为因子
15、载荷。因子载荷 是 与 的协方差,也是 与 的相关系数,它表示 依赖 的程度。可将 看作第i个变量在第j个公共因子上的权,的绝对值越大,表明 与 的相依程度越大,或称公共因子对于的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。第19页,共41页,编辑于2022年,星期六l变量共同度 因子载荷矩阵中第i行元素之平方和记为 ,即 ,称为变量 的共同度。它是全部公共因子对 的方差所做出的贡献,反映了全部公共因子对变量 的影响。越大表明 对于F的每一分量 的共同依赖程度大。第20页,共41页,编辑于2022年,星期六 l公共因子 的
16、方差贡献l将因子载荷矩阵的第j列的各元素的平方和记为 ,即 ,称为公共因子 对x的方差贡献。就表示第j个公共因子 对于的每一分量 所提供方差的总和,它是衡量公共因子相对重要性的指标。越大,表明公共因子 对x的贡献越大,如果将因子载荷矩阵的所有 都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。第21页,共41页,编辑于2022年,星期六因子载荷阵A(主成分法)一般设 为样本相关阵R的特征根,为对应的标准正交化特征向量。则因子载荷阵A的一个解为:第22页,共41页,编辑于2022年,星期六因子旋转 建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个公共因子的意义,以便对
17、实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,我们就可以利用因子载荷阵的不唯一性这一特点对得到的因子模型进行旋转使得变换后的公共因子和载荷阵有明显的实际意义。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。接近于1的表明公因子与的相关性很强,在很大的程度上解释了的变化;接近于0的表明与的相关性很弱。第23页,共41页,编辑于2022年,星期六例:对我国上市公司的经济效益进行因子分析Proc factor method=principal n=2 rotate=v
18、arinmax all;Var x1-x6;Run;第24页,共41页,编辑于2022年,星期六Factor1=0.95056x1+0.89158x2+0.75108x3+0.9565x4 +0.24829x5+0.9247x6Factor2=0.0091x1-0.30529x2+0.49587x3-0.01446x4+0.89379x5-0.34281x6第25页,共41页,编辑于2022年,星期六马氏链模型:系统在每个时期所处的状态是随机的,且这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率,与以前无关,此称为马氏性或无后效性。具有此种性质
19、的随机序列称为马氏链。马氏链模型在经济学、社会学、生态学、遗传学等许多领域有着广泛地应用。第26页,共41页,编辑于2022年,星期六设随机序列X(n),n=0,1,2,的离散状态空间E为1,2,,下面定义马尔科夫链。定义1 设随机序列X(n),n=0,1,2,的离散状态空间为E,若对于任意m个非负整数和任意自然数k,以及任意,满足 =则称X(n),n=0,1,2,为马尔科夫链。第27页,共41页,编辑于2022年,星期六第28页,共41页,编辑于2022年,星期六第一节马氏链模型数学表述马氏链:设随机变量序列 ,其状态空间 ,若 则随机变量序列称为马氏链转移概率(比例频率)时齐的齐次的第29
20、页,共41页,编辑于2022年,星期六第二节:钢琴销售的存储策略l一家商店根据以往的经验,知道平均每周只能售出1架钢琴,先在经理制定的存储策略为:每周末检查库存量,仅当库存量为零时,才定购三架钢琴以供下周销售;否则,不定购。试估计在这种策略下失去销售机会的可能性有多大,以及每周的平均销售量是多少?第30页,共41页,编辑于2022年,星期六第三节 基因遗传 生物的外部表征是由生物体内相应的基因决定,基因分优势基因和劣势基因两种,分别用d和r表示,则有三种基因类型,即 D(dd)H(dr)R(rr)优种 混种 劣种第31页,共41页,编辑于2022年,星期六生物繁殖时,一个后代随机的继承父亲两个
21、基因中的一个,母亲两个基因中的一个,形成自己的基因所以父母的基因类型就以一定的概率决定了每一后代的基因类型。父母基因后代基因 DDRRDHDRHHHRD 1 0 0 0 0 0 1 0 1 0 0 HR第32页,共41页,编辑于2022年,星期六 随机交配、近亲繁殖 假设在某一生物群体中雄性与雌性的比例是相等的,且在雄性中D,H,R的比例与在雌性中D,H,R的比例相等。第33页,共41页,编辑于2022年,星期六l随机交配:对每一个雌性(或雄性)个体,都以D,H,R的数量比例为概率,与一个雄性(或雌性)个体交配,后代按照前述规则形成他的基因类型 设D(dd):H(dr):R(rr)=a:2b:
22、c 且 a+2b+c=1 记p=a+b,q=b+c,则群体中优势基因d与劣势基因r的数量比例为d:r=p:q 且p+q=1 第34页,共41页,编辑于2022年,星期六转移矩阵第35页,共41页,编辑于2022年,星期六第四节 等级结构 在社会系统中常常按照人们的职务或地位划出许多等级。例如:大学教师分为教授、讲师、助教。我们希望建立一个模型来描述等级结构的变化状况,并根据已知条件和当前的结构预报未来的结构,以及寻求为了达到某个理想的等级结构而应采取的措施。引起等级结构变化的因素有两种:系统内部等级间的转移提升或降级;系统内外的交流,即调入或退出第36页,共41页,编辑于2022年,星期六基本
23、量:l成员按等级的分布向量:其中 为第t年属于等级i的人数,为系统第t年的总人数 成员按等级的比例分布向量:其中 ,成员按等级的分布向量其中为第t年属于等级i的人数 第37页,共41页,编辑于2022年,星期六转移矩阵 ,其中 表示每年从等级i转移到等级j的成员在等级i中占的比例,退出比例向量 ,表示每年从等级i退出系统的成员在等级i中占的比例,第38页,共41页,编辑于2022年,星期六调入比例向量:其中 表示每年调入等级i的人数在总调入人口中占的比例,记第t年调入人口总数 ,则第t年调入等级i为的人数为 :其中,第39页,共41页,编辑于2022年,星期六基本方程:l总人数:每个等级的转移方程:从t到t+1年总人数的增长量记为 其中 第40页,共41页,编辑于2022年,星期六t1234567r(t)0.50.6390.7470.8270.8830.9220.9490.50.3610.2530.1730.1170.0780.05100000000.1a(t)0.10.1650.2070.2350.2530.2640.2720.10.1650.2070.2350.2530.2640.2720.80.6700.5860.5310.4950.4720.457第41页,共41页,编辑于2022年,星期六