《(本科)第12章 马尔科夫预测ppt课件.pptx》由会员分享,可在线阅读,更多相关《(本科)第12章 马尔科夫预测ppt课件.pptx(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、课程主讲人:第12章 马尔科夫预测医学大数据分析医学大数据概述高等教育出版社CONTENTS目 录1基本概念2状态转移矩阵3稳态概率4马尔科夫预测1基本概念基本概念 安德雷马尔可夫(18561922) 俄国数学家,师从切比雪夫,主要研究领域在概率和统计方面。他的研究开创了随机过程这个新的领域,以他的名字命名的马尔可夫链在现代工程、自然科学和社会科学各个领域都有很广泛的应用。基本概念-随机过程 定义:设(,F,P)为概率空间,T是给定的参数集(时间参数集)。对每个tT都有一个随机变量X(t,)与之对应,则称随机变量簇 X(t,) , tT 是概率空间上的随机过程。 X(t,)记为X(t)。 :样
2、本空间; 正面,反面 F: 事件,样本空间的子集; P: 概率 P()=1基本概念-无后效性马尔可夫性 当随机过程在t时刻所处的状态已知时,在t+1时刻所处的状态仅与t时刻的状态有关,而与t时刻以前的状态无关。此特性称为随机过程的。 过去只影响现在,而不影响将来。 P将来|现在、过去=P将来|现在状态空间状态空间8状态状态1状态状态2状态状态nt1t1时刻时刻 t2t2时刻时刻 tntn时刻时刻 时间参数集时间参数集 状态状态时间时间离散离散连续连续离散离散马尔科夫链马尔科夫链马尔科夫序列马尔科夫序列连续连续可列马尔科夫过程可列马尔科夫过程马尔科夫过程马尔科夫过程四类马尔科夫过程2、状态与状态
3、变量 状态:客观事物可能出现或存在的状况。 商品:畅销、滞销 机器运转:正常、故障 同一事物不同状态之间必须相互独立:不能同时存在两种状态。 状态会发生变化的。 高风险-低风险321基本概念-马尔可夫链定义:随机过程X(t)在tn时刻的状态为Xn=X(tn),且Xn可能取得的状态必为a1 a2 an之一,其中AI=a1 a2 an 为有限的状态空间, 随机过程只在t1 t2 tn 可列个时刻发生状态转移。若随机过程在tn+1时刻变成 任一状态aj的概率,只与过程在tn时刻的状态ai有关,而与过程在 tn时刻以前的状态无关,则称此随机过程为马尔可夫链,简称马氏链。PX(tn+1)= aj| X(
4、tn) = ai ,X(tn-1)= an-1 ,X(t0)= a0= PX(tn+1)= aj| X(tn) = ai2状态转移矩阵基本概念-状态例如流行病等级分为:“高风险”、“中风险”、“低风险”基本概念-状态转移概率矩阵基本概念-状态转移概率矩阵状态转移概率矩阵概率矩阵是由概率向量作为行向量所构成的方阵称为概率矩阵基本概念-K步状态转移概率矩阵基本概念-K步状态转移概率矩阵定义 :若系统在时刻 处于状态 ,经过 步转移,在时刻 处于状态 。那么,对这种转移的可能性的数量描述称为 步转移概率。记为: 并令 nNNnNnNnNnnnNnnnPPPPPPPPPP212222111211 ni
5、jnPixjxP 00tinntjn举例例:设某流行病发病情况分为“高风险”和“低风险”两种状态,现有24个季度的数据,请求出发病的初始概率向量、一步状态转移矩阵和二步转移矩阵,并预测后两个季度后的发病情况。季季度度123456789101112状状态态高高低高低低高高高低高低季季度度131415161718192021222324状状态态高高低低高高低高低高高高举例举例3稳态概率平稳分布平稳分布 若随机过程某时刻的状态概率向量 P(k) 为平稳分布,则称过程处于平衡状态。 一旦过程处于平衡状态,则经过一步或多步状态转移之后,其状态概率分布保持不变,也就是说,过程一旦处于平衡状态后将永远处于平
6、衡状态。对于所讨论的状态有限(即N个状态)的马尔可夫链,平稳分布必定存在。平稳分布 如存在如存在非零向量非零向量 X=(x1,x2, ,xN),使得:,使得: X P = X 其中:其中:P为一概率矩阵为一概率矩阵 则称则称 X 为为 P 的固定概率向量。的固定概率向量。 特别地,设特别地,设 X=(x1,x2, ,xN) 为一为一状态概率向量状态概率向量, P为为状态转移概率矩阵,若状态转移概率矩阵,若 X P = X即:即:称称 X 为该马尔可夫链的一个为该马尔可夫链的一个平稳分布平稳分布 性质?性质?11, 2,.,Niijjix pxjN 若随机过程某时刻的状态概率向量 P(k) 为平
7、稳分布,则称过程处于平衡状态。 (X P = X) 一旦过程处于平衡状态,则经过一步或多步状态转移之后,其状态概率分布保持不变,也就是说,过程一旦处于平衡状态后将永远处于平衡状态。 对于所讨论的状态有限(即N个状态)的马尔可夫链,平稳分布必定存在。 特别地,当状态转移矩阵为正则概率矩阵时,平稳分布唯一。 正则概率矩阵?正则概率矩阵正则概率矩阵 定义:如果 P 为概率矩阵,且存在 m0,使 Pm 中诸元素皆非负非零。则称 P 为正则概率矩阵。例如:均为正则概率矩阵。P1为正则概率矩阵是明显的(m = 1)P2是正则概率矩阵也也易于论证:即存在(m = 2),使 P2 的元素皆非负非零。120 .
8、40 .601(1)0 .60 .40 .40 .6PP及2201010 .40 .60 .40 .60 .40 .60 .2 40 .7 6P 正则概率矩阵正则概率矩阵 是非正则概率矩阵。 正则概率矩阵的这一性质很有实用价值。110(2)0.50.5P稳态分布稳态分布 设存在稳态分布设存在稳态分布 =( 1, 2, , N),则由于下式恒成,则由于下式恒成立:立:令令k就得就得 l 即有限状态马尔可夫链的稳态分布如存在,那么它也是平即有限状态马尔可夫链的稳态分布如存在,那么它也是平稳分布。稳分布。l 当马尔科夫链的状态转移概率矩阵为正则概率矩阵时稳态当马尔科夫链的状态转移概率矩阵为正则概率矩
9、阵时稳态分布存在,且稳态分布和平稳分布相同且均唯一。分布存在,且稳态分布和平稳分布相同且均唯一。()(1)PkPkPP稳态分布应用举例 根据例12-1所得状态转移矩阵,求平稳分布和稳态分布,并预测该流行病的发展趋势。应用举例从求得结果可以看出,该马尔可夫链的平稳分布,也是稳态分布。该马尔可夫链的平稳分布,也是稳态分布。从得到的结果可知,该流行病处于“高风险”的可能性为61%,处于“低风险”的可能性为39%。4马尔科夫预测步骤:步骤:马尔可夫链预测法的应用流行病流行病预测预测问题提出:问题提出:某市某市1995年至年至2010年肾综合征年肾综合征出血热(出血热(HFRS)的)的发病率情况:发病率
10、情况:年份年份19951996199719981999200020012002发病率发病率(1/10万万)2.956.2810.287.017.3613.7833.9335.87年份年份20032004200520062007200820092010发病率发病率(1/10万万)33.428.3830.533.7939.730.3939.733.59问题求解:问题求解:首先根据资料将发病率划分为四个状态,统计各首先根据资料将发病率划分为四个状态,统计各数据的状态数据的状态归属得归属得下表下表 某市某市HFRSHFRS流行状况流行状况年份年份发病率发病率(1/10(1/10万万) )状态状态年份年
11、份发病率发病率(1/10(1/10万万) )状态状态199519952.952.951 12003200333.4033.404 4199619966.286.281 12004200428.3828.383 31997199710.2810.282 22005200530.5030.504 4199819987.017.011 12006200633.7933.794 4199919997.367.361 12007200739.7039.704 42000200013.7813.782 22008200830.3930.394 42001200133.9333.934 4200920093
12、9.7039.704 42002200235.8735.874 42010201033.5933.594 4状态状态1234发病率取值范围发病率取值范围X1010X2020X30X30各各状态出现的频率(初始概率状态出现的频率(初始概率)状态状态发病率取值范围发病率取值范围初始概率初始概率1X104/16210X202/16320X301/164X309/16由上表可得各状态的转移频率即状态转移概率的估由上表可得各状态的转移频率即状态转移概率的估计值,从而得模型的一步转移概率矩阵:计值,从而得模型的一步转移概率矩阵:875.0125.00010005.0005.0005.05.0)19(7)1
13、9(1001000210021004242P计算二步计算二步转移矩阵:转移矩阵:8906.01094.00000.00000.08750.01250.00000.00000.04375.00625.02500.02500.02500.00000.02500.05000.02)2(PP8889.01111.00000.00000.08887.01113.00000.00000.06162.00713.01250.01875.04570.00430.01875.03125.04)4(PP得模型的极限概率分布(稳态分布得模型的极限概率分布(稳态分布):):(0,0,1/9,8/9)分析预测:分析预测
14、: 由于出生状态向量由于出生状态向量P0(1/4,1/8,1/16,9/16),乘以一步转移状,乘以一步转移状态概率矩阵知,态概率矩阵知, 状态状态4概率最大,所以预测概率最大,所以预测2011年仍处于状态年仍处于状态4,即,即发病率大于发病率大于30万同样,从万同样,从二步转移二步转移矩阵知,依然是状态矩阵知,依然是状态4的概率最的概率最大,所以预测大,所以预测2011和和2012年年该市的该市的HFRS发病率将持续在大于发病率将持续在大于30万万(高发区)水平,这提醒我们应该对此高度重视,采取相应对策(高发区)水平,这提醒我们应该对此高度重视,采取相应对策THANKS本讲结束高等教育出版社