《2022年2022年金融统计分析补充知识 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年金融统计分析补充知识 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、金融统计分析补充知识1、均值:均值又称算术平均数,是所有观察值的和除以观察值的个数,是集中趋势的最主要测度值。NXNXXXXNiiN1212、方差:方差是个变量与其均值离差平方的平均数,是测度数据离散程度的主要方法。NXXKii12)(23、标准差:方差的平方根即为标准差。NXXKii12)(4、相关系数:设(iiyx,),i=1,2,n 是(x,y)的 n 组样本观测值,我们称yyxxxyLLLr为 x 与 y 的相关系数,表示x 和 y 的线性关系的密切程度。其中niiyyiniixyniixxyyLyyxxLxxL12112)(),()(,)(相关系数的取值围1r。5、一元线性回归直线回
2、归分析的任务就是根据若干观测值(xi,yi)i=1,2 n 找出两个变量x、y 之间的关系的直线回归方程bxay?,其中 a 称为截距,b 为回归直线的斜率,也称回归系数。其中y?是变量 y 的估计值。求直线回归方程bxay?,实际上是用回归直线拟合散点图中的各观测点。常用的方法是最小二乘法,也就是使该直线与各点的垂直距离最小,即求使观察值 y 与回归直线y?之差的平方和2)?(yy达到最小时的a 和 b 的问题。在判定一个线性回归方程的拟合优度时,R2系数是一个重要的判定指标,公式为222)()?(yyyyRii。从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能
3、解释的因变量变异性的百分比。如果 R2=0.775,说明变量 y 的变异性中有77.5%是由自变量x引起的;如果R2=1,表示所有的观测点全部落在回归直线上;如果R2=0,则表示自变量与因变量无线性关系。6、多元线性回归名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 3 页 -根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析。模型为nnxbxbxbby22110?,其中y?为根据所有自变量计算出来的估计值,0b为常数项,nbb21b、称为 y 对应于 x1、x2xn的偏回归系数。偏回归系数是假设在其他所有自变量保持不变的情况下,某一个自变量的变化引起因变
4、量变化的比重。在判定一个线性回归方程的拟合优度时,R2系数是一个重要的判定指标,公式为222)()?(yyyyRii。从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。如果R2=0.775,说明变量y 的变异性中有77.5%是由自变量 x 引起的;如果R2=1,表示所有的观测点全部落在回归直线上;如果R2=0,则表示自变量与因变量无线性关系。7、因子分析在各个领域的研究中往往需要对反映事物的多个变量进行预测,收集大量的数据以便进行分析寻找规律。多变量大样本无疑会为研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是,许多
5、变量之间可能存在相关性,从而增加了问题分析的复杂性。由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标间彼此不相关,即各指标代表的信息不重叠。这样就可以对综合指标根据专业知识和指标所反映的独特含义给与命名。这种分析方法称为因子分析,综合指标称为因子或主成份。因子应该比原始变量少,但还要尽可能少损失信息。原始变量:mxxx21、主成份:nzzz21、则各因子(主成份)与原始变量之间的关系可表达为:112121111ezbzbzbxnn2122221212ezbzbzbxnnmnmnmmmezbzbzbx2211则主成份分析的数学模型可写成:mmxaxaxaz12121111mmxaxaxaz22221212mnmnnnxaxaxaz2211从理论上讲m=n,即有多少原始变量就有多少个因子(主成份),但实际上前面几个主名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 3 页 -成份集中了大部分方差,因此主成份的数目远远小于原始变量的数目,但信息损失较少。名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 3 页 -