《极值理论在风险价值度量中的应用23916.docx》由会员分享,可在线阅读,更多相关《极值理论在风险价值度量中的应用23916.docx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、极值理论在风险价值度量中的应用1、引言自20世纪70年代以来,金融市场的波动日益加剧,一些金融危机事件频繁发生,如1987年的“黑色周末”和亚洲金融危机,这使金融监管机构和广大的投资者对金融资产价值的暴跌变得尤为敏感。金融资产收益率的尖峰、厚尾现象也使传统的正态分布假定受到严重的质疑,因此如何有效地刻画金融资产收益率的尾部特征,给出其渐进分布形式,及各种风险度量模型的准确估计方法和置信区间,依此制定投资策略,确定国家监管制度,成为风险度量和管理所面临的巨大挑战。目前,对金金融资产产损失的的估计方方法主要要包括历历史模拟拟、参数数方法和和非参数数方法。历历史模拟拟是一种种最简单单的方法法,它利利
2、用损失失的经验验分布来来近似真真实分布布,但是是该方法法不能对对过去观观察不到到的数据据进行外外推,更更不能捕捕获金融融资产收收益序列列的波动动率聚类类现象,而而受到大大量的批批评。参参数方法法假设收收益符合合某种特特定的分分布如:正态分分布、tt分布等等,再通通过分布布与样本本的均值值、方差差的匹配配对参数进行行估计,或或者是假假设收益益符合某某种特定定的过程程如:模模型、模型,该该方法可可以在一一定程度度上解释释尖峰后后尾现象象和波动动率聚类类问题,具有比较好的整体拟和效果。不过参数方法只能对已经到来的灾难信息给出准确的估计,对于即将到来的灾难信息无法给出准确的预测,因此对极端事件的估计缺
3、乏准确性。非参数方法则主要包括极值理论(EVT),该理论不研究序列的整体分布情况,只关心序列的极值分布情况,利用广义帕累托分布(generalized Pareto distribution)或者广义极值分布(generalized extreme value distribution)来逼近损失的尾部分布情况。Danielsson and de Vries(1997)以7支美国股票构成的组合为样本比较各种模型的表现情况,发现EVT的表现比参数方法和历史模拟方法明显的好。Longin(2000)认为极值理论的优点在于它的没有假设特定的模型,而是让数据自己去选择,而GARCH模型作为估计风险的一
4、种方法,它只能反映当时的波动率情况,对于没有预期到的变化缺乏准确性。不幸的是,Lee and Saltoglu(2003)把EVT模型应用到5个亚洲股票市场指数上,发现表现令人非常不满意,而传统的方法尽管没有一个在各个市场表现都是绝对优于其它模型的,但都比EVT模型的表现好。本人认为EVT模型之所以在亚洲市场表现不好主要是因为亚洲金融市场的数据具有很强的序列相关和条件异方差现象,不能满足EVT模型要求的独立同分布假定。另外,Jondeau and Rockinger(1999),Rootzen and Kluppelberg(1999),Neftci(2000),Gilli and Kelle
5、zi(2003)和Christoffersen and Goncalves(2004)也分别采用极值原理和其他模型对金融数据的尾部特征进行了分析和比较。本章在传统统单纯采采用极值值理论(假设被被分析数数据是独独立同分分布的)描述金融资产收益尾部特征的基础上,把ARMA(Asymmetric)GARCH模型和极值理论有机的结合起来。首先利用ARMA(Asymmetric)GARCH模型捕获金融数据中的序列自相关(Correlation)和异方差(Heteroskedasticity)现象,利用GMM估计参数,获得近似独立同分布的残差序列,再采用传统的极值理论对经过ARMA(Asymmetric)
6、GARCH模型筛选处理过的残差进行极值分析,在一定程度上克服了传统单纯采用极值理论时,由于金融数据序列自相关和波动率聚类现象不能满足极值理论假设所造成的估计误差。另外,本章还采用Bootstrap的方法给出了采用极值理论估计出的VaR和ES在某一置信水平下的置信区间改进了采用似然比率法估计置信区间时,由于极值事件的小样本所造成的误差。最后,我们利用中国上证指数自1990年12月19到2004年9月30日的对数日收益率进行实证研究给出上证指数的VaR和ES值,及置信区间。2、VaRR和ESS的概念念:VaR(VValuueaatRRiskk)是一一种被广广泛接受受的风险险度量工工具,220011
7、年的巴巴塞耳委委员会指指定VaaR模型型作为银银行标准准的风险险度量工工具。它它可以定定义为在在一定的的置信水平平下,某某一资产产或投资资组合在在未来特特定时间间内的最最大损失失,或者者说是资资产组合合收益损损失分布布函数的的分位数点。假假设代表表某一金金融资产产的收益益,其密密度函数数为,则则VaRR可以表表示为: (11) 当密度函数数为连续续函数是是也可以以写作:,其中中称为分分为数函函数,它它被定义义为损失失分布的的反函数数。该模模型计算算简单,在证券组合损失符合正态分布,组合中的证券数量不发生变化时,可以比较有效的控制组合的风险。但是VaR模型只关心超过VaR值的频率,而不关心超过V
8、aR值的损失分布情况,且在处理损失符合非正态分布(如后尾现象)及投资组合发生改变时表现不稳定,会出现 (22)的现象,不不满足AArtzznerr(19999)提提出了一一致性风风险度量量模型的次可加加性。(Expeecteed sshorrtfuull)满满足Arrtznner(119999)提出出的次可可加性、齐齐次性、单单调性、平移不变性条件,是一致性风险度量模型。它的定义如下:在给定的置信水平下,设是描述证券组合损失的随机变量,是其概率分布函数,令,则可以表示为: (3)在损失的密密度函数数是连续续时,可可以简单单的表示示为:。 本本章将分分别选用用这两个个模型来来度量金金融资产产的风
9、险险,给出出在修正正过的极极值模型型下,其其估计的的方法和和置信区区间。3. ARRMA(Assymmmetrric)GARRCH模模型3.1 AARMAA(AAsymmmettricc)GAARCHH模型的的性质模型: (4)其中,是期期望为00,方差差为常数数的独立立同分布布随机变变量,模型在可可逆的情情况下可可以表示示为。该模型型假设的的条件期期望是可可得的,条条件方差差为常数数,通常常可以用来来解释时间间序列的的相关性性,并可可以对时时间序列列进行的的短期预预测。但但是该模模型条件件方差为为常数的的假设,使使其无法法有效的的解释在在金融时时间序列列中经常常被观察察到的波波动率聚聚类现象
10、象,为此此,我们们需要在在模型中中进一步步引入模型。我们令,其其中是期期望为00,方差差为常数数1,的的独立同同分布随随机变量量,是在时刻的的条件方方差。这这里我们们采用通通常使用用的最简简单的模模型,则则条件方方差可以以表示为为:,模型也也可以表表示成平平方误的的形式: (5)其中,因此此模型本本质上是是平方误误的。模型的的引入不不仅可以以捕获到到金融时时间序列列的波动动率聚类类现象,而而且可以以在一定定程度上上改善尖峰峰后尾现现象,因因为 (66)其中和分别别表示和和的峰度度,的峰峰度明显显大于等等于的峰峰度。另外,在金金融序列列中我们们还可以以明显的的观察到到,波动率率正方向向变动与与收
11、益率率负方向向变动的的相关性性大于与与收益率率正方向向变动的的相关性性,一种种可能的的解释是是收益率率的负方向向变动会会加大波波动幅度度。而模模型认为为收益的的正方向向变动和和负方向向变动对对波动率率变动幅幅度有着着相同的的影响,为为了捕获获金融序序列波动动率变动动的这一一不对称称性,我我们引入入需要Gllostten et al(119933)提出出的非对对称模型型: (77)其中,在这这个模型型中我们们通过项来捕获收益益率的正正负变动动对波动动率变动动的不同同影响,如如果收益益率的波波动与收收益率波波动率的的变动像像我们上上面所预预期的那那样,则则。这样我们就就得到了了ARMAA(AAsy
12、mmmettricc)GAARCHH模型 (88)3.2、AARMAA(AAsymmmettricc)GAARCHH模型的的参数估估计:我们知道在在条件正正态分布布的假设设下,可可以很容容易的利利用ARMMA(Asyymmeetriic)GGARCCH模型型的似然然函数,给给出参数数向量的的估计值值,其中中,。即使使在金融融收益率率序列残残差不满满足条件件正态分分布的情情况下,使用正态极大似然估计法,仍然可以得到参数的一致渐进正态非最小方差估计。但是这样我们得到的残差将有很大的误差,而是我们下一步进行EVT尾部估计的输入变量,它的有效性将会直接影响我们整个的估计结果,为此我们必须寻找一个更有效
13、的估计方法。GMM(GGeneerallizeed MMethhod of Mommentts)广广义矩估估计恰好好可以满满足我们们的要求求,它不不需要假假设符合合任何分分布,只只需要的的条件矩矩。在SSkogglunnd(220011)“A ssimpple effficiientt GMMM eestiimattor of GARRCH moddelss”给出了了该估计计方法的的计算过过程和收收敛情况况。下面面给去估估计的步步骤:首先,定义义一个行行向量 和广广义向量量 ,其其中是工工具变量量,则参参数的GGMM估估计可以以通过下下式得到到: (9)其中是一个个恰当的的权重矩矩阵。在New
14、eey aand McFFaddden(119944)中,我我们可以以知道,有有效的GGMM估估计可以以通过另另,其中中,是Jaacobbiann行列式式。把和和带入上上面的目目标函数数(9)得得到: (110)其中,是一一个含有有参数的的权重矩矩阵,它它的元素素可以表表示为:其中,通过上面对对目标函函数(99)的变变化,我我们得到到函数是是恰好可可识别的的,即参参数的最最优估计计是使函函数等于于0。另另外,我我们要进进行GMMM估计计还需要一一个对参参数的初初始估计计值和对的三阶阶矩和四四阶矩的的初始估估计值,而而这一初初始值我我们可以以通过对对ARMMA(Asyymmeetriic)GGA
15、RCCH模型型残差符符合正态态分布的的情况进进行最大大似然估估计得到到。这样样我们就就可以得得到有效效的参数数估计值值和残差差序列。4、极值理理论极值理论是是测量极极端市场场条件下下风险损损失的一一种方法法,它具具有超越越样本数数据的估估计能力力,并可可以准确确地描述述分布尾尾部的分分位数。它主要包括两类模型:BMM模型(Block Maxima Method)和POT模型(Peaks over Threshold),两类模型的主要区别有:1、极值数据的获取方法上的区别,BMM模型通过对数据进行分组,然后在每个小组中选取最大的一个构成新的极值数据组,并以该数据组进行建模;POT模型则通过事先设
16、定一个阀值,把所有观测到的超过这一阀值的数据构成的数据组,以该数据组作为建模的对象,两个模型的共同点是只考虑尾部的近似表达,而不是对整个分布进行建模。2、两个模型分别采用极值理论中的两个不同的定理作为其理论依据,同时也因为获取极值数据的不同方法导致两个模型分别采用不同的分布来拟合极值数据。3、BMM模型是一种传统的极值分析方法,主要用于处理具有明显季节性数据的极值问题上,POT模型是一种新型的模型,对数据要求的数量比较少,是现在经常使用的一类极值模型。4、BMM模型主要用于对未来一段较长的时间内的VaR和ES预测,而POT则可以进行单步预测,给出在未来一段小的时间内VaR和ES的估计值。5、B
17、MM模型的前提条件是样本独立同分布,POT模型的前提条件是超限发生的时间服从泊松分布,超限彼此相互独立,服从GPD(generalized Pareto distribution)分布,且超限与超限发生的时间相互独立。样本独立同分布可以保证POT模型的前提条件。4.1 BMMM模型的的理论基基础假设表示我我们采用用BMMM方法获获得的极极值数据据组,其其中n表表示每个个子样本本的大小小,则有有下面的的极限定定理成立立定理1:(FFishher andd Tiippeett (19928), Gnnedeenkoo (19943))假设是一一个独立立同分布布的随机机变量序序列,如如果存在在常数,
18、以及及一个非非退化的的分布函函数,使得 成立,则则分布函函数一定定属于下下面的三三种标准准的极值值分布: Frechhet: Weiibulll: Gummbell: 从图1可以以清楚的的Freecheet分布布用来描描述那些些极值无无上界有有下界的的分布,WWeibbulll分布用用来描述述极值分分布有上上界,无无下界的的分布,GGumbbel分分布用来来描述极极值无上上界也无无下界的的分布。我们通常见到的很多分布函数都可以根据他们尾部的状况划分到上面的三种极值分布分布中去,例如:学生分布、帕累托分布(Pareto distribution)、对数Gamma分布、Cauchy distrib
19、uted根据尾部特征可以划分到Frechet分布中去;均匀分布和Beta分布的尾部分布可以收敛到Weibull分布;正态分布、Gamma分布和对数正态分布的尾部分布都收敛到Gumbel分布。 图形1:标标准Frrechhet、WWeibbulll和Guumbeel分布布图但是,在实实际应用用中对于于一个给给定得极极值序列列,我们们应该如如何在这这三种极极值分布布中做出出选择呢呢。一种理理想的方方法是通通过参数数的形式式把三种种极值分分布统一一的表示示成一个个分布函函数,这这样我们们就可以以在利用用最大似似然估计计的时候候,把该该参数也也一块估估计出来来,让数数据去决决定它们们的选择择,这将将极
20、大的的增加模模型估计计的准去去性。这这里我们们采用 Jennkinnsonn annd MMisees 的的方法,把把三种分分布表示示成如下下单参数数的形式式: (111)其中,这一一表达形形式也被被称为广广义极值值分布函函数(GGeneerallizeed eextrremee vaaluee diistrribuutioon),当当时,表表示Frrechhet分分布,当当时,表表示weeibuull分分布,当当时表示示Gummbell分布。 在在定理11的基础础上,对对于给定定一个金金融资产产的残差差序列,我我们就可可以首先先分组求求最大值值得到的的极值序序列记为为。为了了表达上上的简洁洁
21、,用和和代替公式式(111)中的的和,则可可以序列列的近似似分布函函数: (122)其中。然后后,我们们要对参参数进行行最大似似然估计计,这需需要得到到随机变变量的概概率密度度函数,通通过概率率分布函函数(112)对对求导,我我们得到到随机变变量的概概率密度度函数: (133)其中。通过过似然函函数就可可以得到到各参数数的估计计值: (14)在各参数估估计值给给定的基基础上,我我们就可可以利用用极值分分布函数数计算不不同下的分位数值,如如用表示示这一分分位数,则在个周期期内出现的极极值收益益会超过这这一阀值的预预期数量量有且仅仅有一次次。 表达形形式为: (155)注:关于参参数的置置信区间间
22、的确定定我们在在后面给给出其计计算方法法。4.2 POTT模型的的理论基基础假设序列的的分布函函数为,定定义为随随机变量量超过门门值的条件分分布函数数,它可可以表示示为: (116)根据条件概概率公式式我们可可以得到到: (177)定理2:(PPickkandd (119755), Ballkemma aand de Haaan (19774))对对于一大大类分布布(几乎乎包括所所有的常常用分布布)条件件超量分分布函数数,存在一一个使得得: (112)当时,;当当时,。分分布函数数被称作作广义的的Parretoo分布。图2:广义义Parretoo分布在在,取0.3,00,-0.3的图图形从图形
23、上我我们可以以看到的的不同取取值确定定了尾部部的厚度度,越大大则尾部部越厚,越小尾部越薄,从函数我们还可以得到当时,的最大取值为,有上界。Lee and Saltoglu(2003)在金融资产收益时间序列上直接使用EVT时,由于序列的尖峰后尾,使得确定出来的一定是大于零的,但是在我们的模型中,我们对残差序列进行极值分析,因此我们得到的不一定大于零。根据公式(112)我我们可以以得到广广义的PPareeto分分布的概概率密度度函数:因此对于给给定的一一个样本本,对数数似然函函数可以以表示为为: (113)在POT模模型中另另一个重重要的问问题,那那就是如如何确定定我们定定理2中中的阀值值,它的的
24、确定非非常重要要,它是是正确估估计参数数和的前提提。如果果阀值选选取的过过高,会会导致超超额数据据量太少少,使估估计出来来的参数数方差很很大;如如果阀值值选取的的过低,则不能保证超量分布的收敛性,使估计产生大的偏差。Danielsson et al(1997)、de Vries(1997)和Dupuis(1998)给出了对阀值的估计方法,一般有两种:一是根据Hill图,令表示独立同分布的顺序统计量。尾部指数的Hill统计量定义为:Hill图图定义为为点构成成的曲线线,选取取Hilll图形形中尾部部指数的的稳定区区域的起起始点的的横坐标标K所对对应的数数据作为为阀值。二是根根据样本本的超额额限望
25、图,令令,样本本的超限限期望函函数定义义为: (144)超限期望图图为点构构成的曲曲线,选选取充分分大的作作为阀值值,它使使得当时时为近似似线性函函数。另另外,如如果超限限期望图图当时是向上上倾斜的的,说明明数据遵遵循形状状参数为为正的GGPD分分布,如如果超限期望图图当时是是向上倾倾斜的,说说明数据据来源于于尾部较较短的分分布,如如果如果果超限期望图图当时是是水平的的,则说说明该数数据来源源于指数数分布。这一判断方法是根据广义Pareto分布在参数的时候,它超限期望函数是一个线性函数。 (155)注:因为对对于广义义Parretoo分布只只存在阶阶矩,如如果则存存在一阶阶矩,否否则一阶阶矩将
26、不不存在,就就没有办办法计算算超限期望函函数。当确定以后后,;利用用的观测测值,根根据公式式(133)进行行最大似似然估计计得到和和。同时时,我们们得到的的观测值值中比阀阀值大的的个数,记记为,根根据公式式(177)用频频率代替替的值,可可以得到到在时的表表达式: (166)对于给定某某个置信信水平,可可以由的的分布函函数公式式(155)可以以得到: (177)根据GPDD的条件件分布函函数公式式(155)可以以得到: (118)4.3 序列的和置信区区间的估估计方法法:通常,对于于参数置置信区间间的估计计方法,在在大样本本的情况况下我们们可以从从似然比比率检验验(Likkeliihoood
27、RRatiio TTestt)的思路中中获到。似似然比率率检验用用来检验验两个同同类型模模型的拟拟和程度度的好坏坏。两个个同类型型模型的的似然比比率符合合分布,它它的自由由度等于于复杂模模型中新新加入的的参数的的个数。以POT模型为例,要估计参数和在给定置信水平下的置信区间可以通过下式得到:其中,和为为估计的的最优值值,表示示似然函函数。这这样我们们就得到到了和的联合合置信区区间,如如果我们们希望得得到的估估计值,则则可以根根据公式式(177)反解解出带入入公式(113)得得到,令令,的置信信区间可可以通过过下式得得到:但是,于超超过阀值值的极值值数据量量不会很很多,使使的这一一估计的的渐进效
28、效果可能能不佳。为为此,我我们引入入Boootsttrapp方法来来获得置置信区间间的估计计。既然然我们得得到的序序列时独独立同分分布,就就可以每每次独立立从中抽抽取个点点组成新新的序列列,用该该序列估估计和,重复复这一操操作,就就可以得得到一系系列的和和估计值值,求出出和的经验验分布,最最后根据据经验分分布得到到和的置信信区间,并并把和的期望值值作为和和的估计计值。我们在在这里只只给出了了POTT模型中中置信区区间的求求法,其其他参数数的置信信区间可可以类似似的求得得。该方方法在确确定置信信区间的的同时,也也是一种种检验模模型稳定定性的方方法。5、实证分分析 我们采采用上海证券券交易所所公布
29、的的日收益益综合指指数为原原始数据据(数据据来源:大智慧慧),样样本空间间选自119900年122月199日-20004年年9月330日。样样本容量量为33391个个(使用用Eviiewss和Maatlaab软件件)。我我们定义义收益为为。我们的的实证过过程分为为四步,(11)用ARMMA(Asyymmeetriic)GGARCCH模型型对收益益序列进进行过虑虑得到近近似独立立同分布布的残差差序列;(2)用用极值理理论对这这一残差差进行分分析,给给出其渐渐进分布布,并估估计出相相应的和和值。(33)比较较用似然然比率和和用Boootsstraap方法法给出和和值的置置信区间间的估计计。(44)
30、整合合第一步步和第二二步的结结果,计计算收益益的和值。(55)利用用BMMM模型估估计值。5.1 ARMMA(Asyymmeetriic)GGARCCH模型型形式和和参数的的确定首先给出收收益序列列的描述述性统计计量(图图1),可可以看到到序列具具有明显显的尖峰峰后尾现现象,从从JBB检验可可以显著著的拒绝绝正态性性假设。对对收益序序列进行行单位根根ADFF检验(见见表1),因因为检验验的统计计量是,比比显著性性水平为为1的的临界值值还小,所所以拒绝绝原假设设,序列列不存在在单位根根,是平平稳序列列。图1:收益益序列的的描述性性统计量量ADF TTestt Sttatiistiic-23.66
31、45116 11% Crritiicall Vaaluee*-3.43354 55% Crritiicall Vaaluee-2.86629 110% Criiticcal Vallue-2.56675*MacKKinnnon criiticcal valluess foor rrejeectiion of hyppothhesiis oof aa unnit rooot.表1:序列列的单位位根检验验可以进一步步分析数数据的自自相关和和偏相关关(见表表2)现现象,发发现滞后后10期期,在999的的置信水水平下都都不能拒拒绝没有有自相关关和偏相相关的原原假设,为为此可以以认为收收益序列列中不存存
32、在ARRMA现现象。这样,我们们就可以以直接用用序列对对常数项项作最小小二乘回回归得到到残差项项,然后对残残差序列列进行AARCHH效应的的LM检检验(见见表3),发发现当取比较较大的值值时的相相伴概率率仍然有有,小于于显著水水平,拒拒绝原假假设,残残差序列列存在高高阶ARRCH效效应,即即有GAARCHH效应。表2:样本本数据的的自相关关和偏相相关表ARCH Tesst:F-staatissticc1.98661411 Probbabiilitty0.04443400Obs*RR-sqquarred15.8556844 Probbabiilitty0.04444766表3:ARRCH效效应的
33、LLM统计计量检验验根据上面的的分析,我我们可以以确定在在第一步步中所采采用的模模型公式式(199),并并对其进进行正态态最大似似然估计计(见表4)。 (119)CoeffficiienttStd. Errrorz-StaatissticcProb. C9.43EE-0559.03EE-0551.044420660.29664 VVariiancce EEquaatioonC1.47EE-0661.06EE-07713.95563990.00000ARCH(1)0.479973440.0100345546.37724000.00000(RESIID00)*AARCHH(1)-0.1333844
34、30.01664566-8.133359990.00000GARCHH(1)0.723315220.00552433137.9915990.00000表4:公式式(199)最大大似然估估计的结结果从表中可以以看到,正如我们所预见的那样,预测不到收益的负方向变动可以导致更大的波动率出现,正方向变动会使波动率下降。和都大于零表明过去时刻的波动对未来价格波动有着正向缓解作用,从而可以有效的解释了波动率的聚类性现象。下面我们以最大似然估计的结果为初始值按照前面所介绍的方法进行GMM估计,其结果如下表:最大似然估估计1.47EE-0660.47997344-0.133384430.723315229.4
35、3EE-0550.00227GMM估计计4.68EE-0880.650088-0.47733330.7722548.33EE-0441.90EE-066表5:最大大似然估估计和GGMM估估计比较较在GMM估估计值与与最大似似然估计计值的比比较中,我我们可以以清楚的的看到,GGMM估估计明显显的增加加了非对对称项系系数的绝绝对值,使使收益的的正负向向变动对对波动率率表动的的不同影影响更加加明显。另外,在最大似然估计中,这意味不存在有限的方差,而在GMM估计中,保证了的方差有限性。GMM估计在没有分布的情况下给出了参数的取值,并有效的降低了目标函数的取值。把GMM估估计值代代入公式式(199),由
36、由收益序序列得到到残差序序列(见见图2),从图像上可以看出序列变的更平稳,波动率聚类现象明显下降,更接近于独立同分布。对其进行一阶,二阶自相关和偏相关性检验和LjungBox检验,结果都在很高的水平上拒绝原假设,表示残差序列以没有ARMA现象和条件异方差现象。图2:收益益序列RR和残差差序列ARCH Tesst:F-staatissticc2.75EE-055 Probbabiilitty0.99558188Obs*RR-sqquarred2.75EE-055 Probbabiilitty0.99558177表6:序列列的ARRCH检检验5.2 PPOT模模型的应应用基于极值理理论中PPOT模
37、模型,我我们需要要利用充充分大的阀值,对超超限分布进进行GPPD拟合合,根据据公式(114),得得到超限限期望图图(见图图3)。发发现样本本的平均均超限函函数图在在时近似直直线,具具有明显显的Paaretto分布布特征。当时数据超过阀值的个数;当时;当时,我们的总样本个数,在允许的情况下选取10左右的数据(DuMouchel(1983)作为极值数据组是比较合适的选择,否则可能不能抓住序列尾部分布的特征,样本内过度拟合,样本外不适用。为此,我们分别给出阀值取0.8,0.9的情况下,利用最大似然估计得到各参数、的取值和95的置信区间(见表7),以及在这些参数下的QQ图和分布图(见图4和图五),从图
38、形中我们可以看到极值分布有效拟合了我们的样本分布,只有个别地方出现异常现象。且在和两种情况下的拟合效果没有明显的区别,为此在后面我们只给出时的图形。 下界0.150.331.822.460.160.321.812.46估计值0.22990.36771.96772.79110.25440.37331.95882.8188上界0.340.422.153.390.380.432.143.50区间长度0.190.090.330.930.160.110.231.04表7:参数数的最大大似然估估计和995置置信区间间 图33:序列列的超限期期望图 图4:和时的QQQ图图图5:和极极值分布布与经验验分布的的
39、比较对于的估计计 Emmbreecheets(119999)认为为金融序序列的的的取值范范围在33到4之之间,而而我们这这里计算算出来的的,几乎乎不落在在的区域域内,这主要是是因为我我们对金金融序列列用ARRMA(Assymmmetrric)GARRCH模模型进行行了过滤滤,得到到的序列列在一定定程度上上消除了了的尖峰峰后尾现现象,使使得估计计出来的的值偏小小,这与Embbrecchetts的结结论并不不矛盾。另另外在QQQ图图中,我我们可以以看到在在0.999的分分为数之之前拟合合效果非常常好,在在后面出出现了个个别的异异常值,这这不会影影响我们们对的估估计,因因为只关心00.999分为数数
40、之前的的分布情况况,而不不受到00.999分为数数之后分分布情况况的影响响。但是是的估计计由于受受到0.99分分为数之之后分布布情况的的影响,所所以这会会对的估估计造成成一定的的误差,这这也是为为什么我我们在表表7中看看到的995估估计区间间明显比的955估计计区间要要宽的原原因之一一。下面我们采采用Boootsstraap的方方法来确确定各参参数的置置信区间间,首先先在序列列中进行行33990次重重复抽取取得到一一个包含含33990个数数据的新新样本,利利用这些些新样本估估计、和取值,重重复上述述10000次,则得到四四个估计计序列,其中每个序列中包含了1000关于某个参数的估计值,我们把他
41、看作是一个样本,把这些样本与前面估计出来的参数区间相比较,如图6左其中方形区域是、单参数确定的95置信区间,椭圆形区域是、的95联合置信区间,图形中的散点表示每次估计出来的、的值构成的点。从图形中我们可以看到大概有5的点落在了95的联合置信区间的外面,但是当我们考虑单参数置信区间时发现在区域以外的点大大超过了5,这表明单参数估计的置信区间存在一定的问题,类似的现象我们还可以在和的估计中(见图6右)看到,联合置信区间比较准确的捕获了数据的特性,单参数置信区间的表示方法就有较大的误差。图6:单参参数和联联合置信信区间,以以及boootsstraap的估估计点图7:Boootsstraap方法法得到
42、的的、和的经验验分布图图另外,从四四个参数数估计序序列我们们可以得得到四个个参数的的经验分分布(见见图7),通过线性插值的方法得到参数的估计值和95的置信区间(见表8),用Bootstrap方法估计的置信区间明显比最大似然估计得到的置信区间要宽,这可能是因为我们的样本与广义Pareto分布并不是完全符合,且样本数量有限,最大似然估计的估计值是无偏的,但不是最小方差的,造成的估计的误差,但是两种方法估计出来的参数值比较接近,特别是对和的估计的误差都在以上,没有明显的差别,只需要对使用似然比率计算出的置信区间坐适当的调整。 下界0.08990.31881.80662.37220.08550.315
43、51.78992.3488估计值0.22220.37001.96662.79110.24220.37771.95552.8166上界0.35110.42882.14443.32990.38660.44882.13443.3799区间长度0.26220.110.33880.95770.30110.13330.34331.0311表8:参数数的Boootsstraap估计计和955置信信区间有了前面的的结果,我我们就可可以把两两个模型型结合起起来计算算收益的的和。首先先,根据据公式(119)和和第一步步中估计计出的AARMAA(AAsymmmettricc)GAARCHH模型中中的参数数计算时时刻
44、的波波动率,然然后把的的、的值和955的上上下界代代入就可以以得到收收益的和的值和和95的上下下界(见见表9):0.013397 下界1.80662.37220.024439770.032230441.78992.34880.024415990.031197估计值1.96662.79110.026663220.038815771.95552.81660.026647880.038851上界2.14443.32990.029911990.045567332.13443.37990.028897990.046637区间长度0.33880.95770.003388990.012253660.3433
45、1.03110.003395990.013357未经ARMMA(Asyymmeetriic)GGARCCH模型型调整估估计出来来的和下界估计值上界下界估计值上界2.833.07993.143.854.40335.49表9:残差差序列和和收益序序列的和比较上面计计算出来来的和值,我我们发现现ARMMA(Asyymmeetriic)GGARCCH模型型调整估估计出来来的和比未经调调整估计计出来的的值明显显偏小,是是因为在在19992年到到19994年间间中国的的股市处处于起步步阶段,监监督力度度不够,市市场波动动幅度比比较大,也也使的未未经调整整的超限限收益主主要发生生再19995年年以前(见见图
46、2),并没有考虑到在1996年以后证券市场进一步规范化,股市超限收益波动减小,应该对和进行相应的调整,而数据调整过的极值预测,可以有效的考虑到这一因素所造成的影响,使得对未来的估计更多的考虑到现在的市场风险,更准确估计市场现在的风险。5.3 BBMM模模型的应应用 首首先我们们把经过过过滤的数数据按照照季度进行行分组,共共包括556个季季度,在在每个季季度中选选取最大大的观测测值构成成一个极极值样本本。根据据定理11可知,这这个极值值样本符符合广义义极值分分布。图8:序列列每季度度的最大大值和最最小值我们知道一一年平均均有2552个交交易日,每每个季度度有633个交易易日,如如果一个个事件在在1000天内出出现一次次,且该该事