《结构方程模型.pdf》由会员分享,可在线阅读,更多相关《结构方程模型.pdf(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、三、结构方程模型的基本观念(一)结构方程模型是什么结构方程模型可以说,就是路径分析(path analysis)和因子分析(factor analysis)的结合体。它的用途,与大家所熟悉的多元回归分析十分相似,但是不同的地方在于,结构方程模型是一种更为强大的统计方法,在构造模型和估计参数的过程里,可以直接处理多组方程间的互动干扰、非线性关系、不独立(相关)的自变量、残差相关、衡量误差、以及将多组相依的衡量模型共冶于一个单一模型当中。事实上,我们可以将结构方程模型视为广义线性模型 (general linear model:GLM)的延伸,它的强大功能,绝对可以用来取代我们惯用的回归分析、路径
2、分析、因子分析、时间序列分析、甚至共变量分析。不过限于篇幅,本书将聚焦于结构方程模型在因子分析、潜变量路径分析、和一般路径分析上的应用。相对于多元回归分析,结构方程模型在应用上的限制也较少,关键的亮点包括在进行路径分析的时候,即使自变量间存在明显的共线性(multi-collinearity),结构方程模型依然可以照单全收,丝毫不影响其解释上的有效性。利用结构方程模型来进行验证性因子分析,更可以通过将多个可观测变量指定给单一潜变量,从而可以在根源处直接降低衡量误差。尤其在残差的处理上,很少有统计方法可以这么方便地直接检查每一个可观测变量的残差,甚至操弄这些残差之间的相关。结构方程模型在路径系数
3、的处理上也高人一等,不仅可以同时估计多个自变量对多组因变量的关系,还能够进行多样本多模型之间的系数比较。最重要的优势是,结构方程模型不仅仅可以估计单一参数的系数,还能够直接估计整体模型的拟合度,这是许多传统统计方法所望尘莫及的。如前所述,结构方程模型的主要用途,其实是用来验证研究者心中对于他所想象世界的猜想,而不是用来探索一个新的世界。换言之,在应用结构方程模型的一开始,大多数的研究者在他的心中,早已存在某些定见了。这些定见的存在形式,大抵上可以分成两种:(1)研究者想要检验他的某个想法是否正确,于是构造了一个结构方程模型,在代入真实数据对模型进行估计后,研究者可以根据拟合指标的好坏,来判断真
4、实世界里的数据,和他所构造的模型之间是否一致,从而明白他原先的想法是否可以接受。(2)研究者根据不同理论,得出两种或两种以上可以用来描述这个世界的不同看法,然后针对这些不同看法,分别构造出不同的结构方程模型来,在代入真实数据分别对这些模型进行估计后,研究者可以根据拟合指标的好坏,来判断究竟哪种看法,更加切合实际。尽管如此,我们还是可以在文献中看到有些研究者,利用结构方程模型来进行模型探索,而不是正确使用结构方程模型,来验证心中事先设定的模型猜想。例如有些研究者在验证原先设定好的结构模型时,发现拟合指标很差,于是通过修正指标(modification index)的暗示,为数字而数字地对模型任意
5、调整改动,直到拟合指标达到及格标准为止。当然这样的作法并不可取,因为通过这种过程而勉强予以接受的结构模型,可能只是刚好反映了这组特定样本的特征,而不是因为模型本身可以放诸四海而皆准,换句话说,是因为这组特定样本造就了一个事先想象不到、缺乏理论依据的模型,而不是通过真实数据,验证了一个具有理论深度的模型。这样的模型即使拟合指标合格了,可能还是缺乏外部效度,我们很难接受这样的模型会是能够代表事实真理的模型。对于这种情形下所构造出来的结构方程模型,研究者有必要使用多组不同的样本,对相同模型进行多次验证,也就是强韧度测试(robust tests),如果多组样本都证实了相同结构模型的拟合指标都是及格的
6、,那么我们才能够正式接受这个结构方程模型。(二)结构方程模型的前提假定如前所述,结构方程模型在应用上的限制相对已经较少了,但是它和其他的多变量分析技术一样,在实际应用的时候,仍然有其特定的前提假定必须遵守。(1)结构方程模型里面的可观测变量必须服从正态分布。(2)结构方程模型里面作为因变量的潜变量必须服从正态分布。(3)线性关系的假定(4)潜变量的假定(5)多元的可观测变量(6)不存在多重共线性的假定(7)残差独立的假定(8)不存在接近零的协方差矩阵(covariance matrix)(9)适当的样本大小(1)结构方程模型里面的可观测变量必须服从正态分布。由于在估计结构方程模型的拟合指标时,
7、我们所采用的最基本工具是卡方检定(chi-square test),卡方检定对于变量的正态性(normality)十分敏感,即使轻微的违背这个要求,都可能导致卡方检定结果发生很大的偏差。同时,大多数结构方程模型在估计参数时所采用的方法都是极大似然估计法,这方法在应用时的基本前提也是变量的正态性,尤其对于模型中内生变量(endogenous variables)的正态性更是严格要求,因此可观测变量服从正态分布,是进行结构方程模型时不可回避的必要条件。这里补充说明一下,如果可观测变量不服从正态分布,但是其残差却:(a)服从正态分布,(b)所有残差的方差都很接近(代表残差同质),(c)残差间彼此独立
8、(也就是不相关),这时卡方的估计结果还是不偏的。不过这三个条件看来比要求可观测变量服从正态分布还要困难。在实务上,避免违背这个条件的简易方法,首先就是尽可能不去使用顺序尺度(ordinal scale)或是名目尺度 (nominal scale)这种类别的,或是离散的变量衡量方法。其次,在万不得已必须使用类别型变量衡量的时候,还可以选用一些转换(transformation)技术,来正态化(normalize)那些有问题的变量。所谓转换,就是根据变量的分布特征,通过数学代换,将原本不属于正态分布的变量,设法将之转变成具有正态分布性质的变量。常见的转换技术包括:取平方根(square root)
9、、取自然对数(logarithmic)、或是函数1/x 反转(inverse)等等,其中函数反转优于取自然对数,自然对数又优于取平方根。例如,对于服从卜瓦松(Poisson)分布的变量,我们通常直接对它取平方根,即可赋予变量正态分布的特征;对于百分比形式的变量,反正弦(arcsine)处理也许是个好方法;对于二项式分布的变量,通常使用的方法是通过胜率(Odds)转换成概率后,再利用自然对数函数log(p/(1-p)进行转换;对于韦布(Weibull)型极值分布(extreme value distribution)形式的变量,则使用反转函数log(-log(1-x)进行转换。无论如何,这些变量
10、转换必须有根有据,确实依据数学原理让变量获得正态分布的性质,否则再怎么奇巧转换也是无益的。最后,当然还需要利用一些统计方法,来验证模型中所使用的可观测变量的正态性。这些方法包括QQ-plot,Shapiro-Wilk Statistic,或是Kolmogorov-Smirnov Statistic 等等,兹不赘叙。(2)结构方程模型里面作为因变量的潜变量必须服从正态分布。所以结构模型里面,所有的因变量都不可以被设计成类别型变量的形式。如果万不得已必须使用类别衡量的变量作为因变量,那么必须改用类别型潜变量分析(latent class analysis:LCA)方法处理,一般的结构方程模型软件并
11、不能处理这种问题。坊间存在若干特殊的统计软件是专门用来处理这种类别型潜变量问题的,例如 Statistical Innovations 公司的Latent GOLD 软件(商业软件),或是Jeroen Vermunt 博士的LEM(自由软件)。(3)线性关系的假定结构方程模型预设了所有的可观测变量和它们所属的潜变量之间,以及潜变量和潜变量之间的关系,都必须是线性的。不过这倒不至于构成太严重的限制,因为就和一般的回归分析一样,对于我们所假定的变量间的非线性关系,我们仍然可以针对变量进行函数转换,来适应这个变量间必须是线性的要求。(4)潜变量的假定在结构方程模型里面,我们基本上假定所有的路径关系,
12、都只能采用非直接衡量的方式加以处理,也就是只存在潜变量路径分析。(5)多元的可观测变量在结构方程模型中,所有的潜变量都必需由至少三个以上的可观测变量来加以描述,如果只有一个可观测变量在解释着某个特定的潜变量,那么这就不是结构方程模型,而是回归分析。如果只有两个可观测变量在解释着某个特定的潜变量,那么在模型中,这两个可观测变量必须被正式地表述(specify)为相关,通过对这个相关的估计(等于新增一个可观测变量),才能够避免因为可观测变量不足所导致的识别不足(under identification)问题,如果识别不足,则模型将受制于自由度不足而无法求解,连带的,当然也无法估计模型的拟合指标。一
13、个衡量模型至少必须满足恰好识别(just identification)的条件才可能求解。恰好识别的模型又称为饱和模型(saturated model),也就是模型所构造的协方差矩阵(港台称为共变异矩阵,covariance matrix)中的元素数量,刚好和所需要估计的参数数量相等,这时在估计参数的时候,刚好用尽了所有的自由度,所以参数虽然可以被估计出来,但是却也因此而无法估计拟合指标,因为没有自由度的估计,其实就等于是真实的计算,也就是百分之一百的拟合,或者这么说,其实根本就没有拟合的概念可言。在这样的情形下,用来估计结构方程模型的软件,不论是Lisrel 还是AMOS,都将会报告自由度为
14、0,卡方值为0,同时无法计算显著水平。研究者真正想要的其实是过度识别(over identification),过度识别代表已知变量间的协方差数量,大于未知的待估计参数的数量,所以这时模型的自由度将会是正的数值,我们才能够应用结构方程模型的软件来估计参数,同时计算出模型的各种拟合指标来。事实上由信度的立场来看这个问题,越多的可观测变量通常其结构信度也较佳,这可由Cronbachs alpha 信赖系数的计算即可清晰观察出来,在同一个构念中,当我们放入的近似的衡量题项愈多,Cronbachs alpha 的值很容易就可以升高。所以在构造衡量题项的时候,最好尽可能从多维度多视角的多元观点来广泛采纳
15、可观测变量,不要吝惜于可观测变量被纳入研究工具中的数量。毕竟在研究工具接受前测中效度信度检查的时候,就可能开始删减题项了,再加上田野调查之后,根据大规模数据进行衡量模型的效度信度检查时,还可能继续删减题项,如果原始题项不足,在最后的结构模型分析阶段,就很可能发生识别不足或是恰好识别的问题,为研究过程带来无谓的麻烦。(6)不存在多重共线性的假定和多元回归分析一样,结构方程模型假定了模型中的变量之间,不存在共线性的问题。但是由于结构方程模型的优势之一,就是可以在模型中直接将共线性清晰地予以表述(specify)出来,所以,本质上,结构方程模型还是可以处理多重共线性的问题。不过,如果这多重共线性十分
16、严重,在最极端的情形下称之为完全共线,那么就会导致模型中出现奇异(singular)矩阵,由于奇异矩阵是无法进行某些矩阵代数运算的,例如就不能进行转置(inverse)运算,结果就会使得结构方程模型无法求解。(7)残差独立的假定和多元回归分析一样,结构方程模型也假定了模型中可观测变量的残差之间是不存在相关的。但是由于结构方程模型中,我们一样可以将这些相关的残差,直接在模型中清晰地表述出来,所以结构方程模型还是可以处理残差相关的问题。只是要在模型中定义某些残差的相关,并不是随心所欲想要相关就相关的,更不应该只是单纯为了改善模型拟合指标,才让某些残差在模型中表述为相关,设计模型的要点就是要掌握理论
17、依据,实事求是,必须能够合理解释某对残差间为何必然存在相关,这才可以在模型中表述为相关。(8)不存在接近零的协方差矩阵(covariance matrix)结构模型本身必须真有意义,而不是潜变量的瞎拼瞎凑。如果结构模型里潜变量之间的因果关系不明确,或是关系甚小,就可能导致满盘都接近 0的协方差矩阵。由于许多拟合指标的计算过程(例如卡方检定、CFI、NFI、RMSEA、RMR 等等),其实是在观察每次模型修正后,真实数据下的协方差矩阵,和虚无假说(null hypothesis)下内容为 0的协方差矩阵之间差异的变化。当真实观察到的协方差矩阵很接近 0的时候,这些计算拟合指标的程序将无法分辨协方
18、差矩阵间的差异,所以就会认定不存在不拟合的现象,因此就高估了拟合指标。(9)适当的样本大小大多数国外管理学期刊里使用了结构方程模型的研究中,所使用的样本数量大约介乎于200到 400 之间。另外,许多学者对于样本数量做出了各种原则性的建议,但是也众说纷纭,没有一定的标准。其中大多数的学者相信,如果样本数低于 200,那么所获得的参数估计将不稳定。事实上,样本数量和模型中的变量数量之间,存在着密切关系。一般认为,适合进行结构方程模型的样本数量,至少应该是模型中所有可观测变量数量的 10到20倍(Mitchell,1993),或者是所需要估计的参数(包含所有系数和残差)的数量的5倍(Bentler
19、 and Chou,1987),虽然有些研究指出,卡方检定对样本数太敏感,过大的样本数容易导致较差的卡方拟合,但是比较新的观点认为,样本数还是尽可能愈大愈好,因为在中央极限定理之下,大的样本数比较能保证观测变量的正态性。(三)结构方程模型的构造与参数估计过程诚如前述,结构方程模型基本上是路径分析和因子分析的结合体,其中的路径,指的是潜变量之间的因果关系,而因子分析指的则是衡量模型,由可观测变量和潜变量组合而成。事实上,不论是路径还是衡量模型,这些变量之间的关系,全都可以使用一般人容易明白的图解形式很直观地加以表达,同时,它们也可以使用学者所熟悉的数学语言,例如线性代数的形式,精确地加以表述。这
20、两种方式,是一而二,二而一的事,本质上没有区别。在这里,本书将采用AMOS 软件为例,来对比一下结构方程模型的构造过程。不过在正式开始构造结构方程模型之前,让我们先来复习一下线性代数中,关于矩阵向量的一些基本概念。(1)向量与矩阵的基本概念二维行向量v=v1v2向量的加减v=v1v2与w=w1w2相加等于 v+w=v1+w1v2+w2常数乘向量av=av1v2=av1av2向量的乘积a bcd=ac+bdabc d=ac adbc bd矩阵和向量的乘积a bc def=ae+bfce+dfa bc d ef g h=ac+bf ad+bg ae+bh矩阵和矩阵的乘积a11a12a21a22b1
21、1b12b21b22=a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22(2)构造结构方程模型方框代表可观测变量,白色的圆圈代表潜变量,单箭头表示因果路径,双箭头表示相关。(3)模型的表述(specification)方式先考虑一个最简单的,只有三个“可观测变量”的“衡量模型”。假定三个“可观测变量”分别是x1,x2,x3,相对应的残差分别是1,2,3,需要估计的因子负载分别是1,2,3,“潜变量”是1。此一衡量模型以图形形式表达如下:以回归方程式的形式表达如下:x1=11+1x2=21+2x3=31+3以矩阵形式表达如下:X=x+1231
22、x1x2x3x1x2x3=1231+123这个模型的限制条件是:E(i)=0COV(1,i)=0,i=1,2,3COV(i,j)=0,i j结构方程模型的求解过程,其实是想要通过样本中的数据,来估计模型中所有的参数(),然后假定这个样本的,可以如实地反映母体的所有模型中的参数()。而这个求解过程,主要通过“方差-协方差矩阵(variance-covariance matrix)”的计算来达成。如果我们所构造的想像的概念模型,真的能够反映这个真实的世界,那么样本估计参数的“方差-协方差矩阵”和母体真实参数的“方差-协方差矩阵”应该相等,也就是:()()根据“方差-协方差矩阵”的定义,我们可以这么
23、来估计参数():()=E(XX)=E(x+)(x+)=xE()x+=xx+其中 是潜变量 的“方差-协方差矩阵”。是残差的“方差-协方差矩阵”。在这个衡量模型里,我们只有一个单一的潜变量,所以:=11=123=VAR(1)0VAR(2)00VAR(3)由于计算上的需要,我们必须定义一个初始值,于是将 11 强制限制为 1 ,代进上述的矩阵方程可以得到:()=11211+VAR(1)21111121211+VAR(2)31111131211131211+VAR(3)=11+VAR(1)211121211+VAR(2)311131211131211+VAR(3)换句话说,我们其实是在求解六个联立方
24、程式:S11=11+VAR(1)S21=2111S22=21211+VAR(2)S31=3111S32=312111S33=31211+VAR(3)详细求解过程在这不赘述。总而言之,这一个仅有三个“可观测变量”的“衡量模型”,也可以使用“方差-协方差矩阵”的形式加以表达,而这种表达方法,可以更有效地阐述一些单纯由回归式很难表达出来的,潜变量之间、或是残差之间可能的相关现象。所以最后这种表达形式,最能将模型完整表达清楚。X=x+x1x2x3=12311+110220033进一步稍微复杂化刚刚的衡量模型。假定刚才模型中的可观测变量 x1和x2的残差之间存在预期的相关21,那么此一衡量模型以图形表达
25、将变成如下形式:以“方差-协方差矩阵”的形式加以表达,则如下所示:X=x+x1x2x3=12311+1121220033这样的表达方式,确实非常的清晰简便。不过到此为止,我们所考虑的“衡量模型”是所谓的“一阶(first order)”的“验证性因子模型”,也就是说,其中的“可观测变量”之间只存在一个维度,也就是那个被归因的“潜变量”所代表的维度。但是许多时候,反映某个特定概念的一群“可观测变量”间,还可以再归纳出不同维度出来,换句话说,这个特定概念下,是存在结构的,通过这结构,可以进一步将这些“可观测变量”分群。这就是所谓的“多阶(higher order)”的“验证性因子模型”。例如下面这
26、个例子,就是“二阶(second order)”的“衡量模型”。以“方差-协方差矩阵”的形式加以表达,则如下所示:X=x+1231x1x2x34562x4x5x6211231x1x2x321x1x2x3x4x5x6=110210310042052062112122+110220033000440000550000066同理,如果这个模型中部分“可观测变量”的残差,我们认为其间应该存在相关,假定模型如下:其“方差-协方差矩阵”的表达形式如下:X=x+x1x2x3x4x5x6=110210310042052062112122+11022003342004405200550000066上述是“衡量模
27、型”的表达方式,其他的模型构造依次类推。事实上,“结构模型”的表达方式也是很类似的。让我们考虑一个最简单的“结构模型”,其中只包含一个潜变量形式的自变量1,一个潜变量形式的因变量1,和这个因变量的残差(或称作“干扰项”)1。(结构模型是关于潜变量之间关系的,测量模型是关于变量和潜变量之间关系的)以图形的形式表达此一结构模型如下:以回归方程式的形式表达如下:1=111+1以矩阵形式表达如下:=+1=111+1三个潜变量的连续型因果关系:1231x1x2x34562x4x5x621415211111以回归方程式的形式表达如下:1=111+12=211+2以矩阵形式表达如下:=+12=1101+02
28、11+12如果我们想要检查这三个潜变量中,其中的一个,是否存在中介变量的效果,那么模型就变成:以回归方程式的形式表达如下:1=111+12=211+211+2以矩阵形式表达如下:=+12=11211+0021012+12当然,潜变量之间不一定只存在单向的因果关系,也有可能是互为因果,那么模型变成:以回归方程式的形式表达如下:1=122+12=211+2以矩阵形式表达如下:=+12=01221012+12另一种可能的情形是相关的两个潜变量共同影响另一个潜变量,模型如下:1221111211221111212122112112以回归方程式的形式表达如下:1=111+122+1以矩阵形式表达如下:=
29、+1=111212+1(4)潜变量路径模型最后,将“衡量模型”和“结构模型”像积木般的组合在一起,就构造了我们所谓的“结构方程模型”,或者,更精确地说,“潜变量路径模型(latent variable path model)”。以上述两个相关的潜变量共同影响另一个潜变量的模型为例,我们可以获得这样一个模型:以矩阵形式表达如下:X=x+Y=y+=+结构方程模型中数学符号的总整理事实上,如果使用现代的统计软件来进行结构方程模型的参数估计,以上这些矩阵表达形式都已经不再需要了,商业软件中,不论是 Lisrel 还是AMOS,早已提供了十分便利、而且功能强大的图形工具,帮助我们用最直观的方式来构造模型
30、,甚至免费的自由软件 Mx,都已经在最新的版本里提供了以图解方式构造模型的功能,所以上述这些数学表述的模型构11111212211231x1x2x34562x4x5x62111123y1y2y31121123456789潜变量造方式,似乎早已落伍,大可随手扬弃了。不过,能够理解上面这些矩阵方程的表述形式,可以帮助我们更深入明白结构方程模型的内涵,使我们在以图解模式构造模型时,更能理解这些结构背后的意义与限制,从而提升我们在模型构造上的能力。同时,懂得这些矩阵表述式,可以让我们对于统计工具的选择更加自由,例如R 这免费自由软件也提供估计结构方程模型的模块,只是必须使用矩阵表述方式来构造模型,即便
31、如此,由于R 在统计上超级强大的功能,我们就可以在R 里面,通过具有逻辑回路的编程,将不同类型的统计过程结合在一起,甚至自行编写特殊用途的统计程序,自动化地进行许多更深入的统计分析,这是使用专属的结构方程统计软件所无法达成的事情。所以,学习以矩阵方程的形式来构造结构方程模型,还是很有价值的。起码,熟悉这些数学语言,可以大幅度地释放我们在阅读一些关于结构方程模型的经典文献时,可能面临的困难。毕竟这些重要文献,大多存在许多这样的矩阵表述。以下将这些数学符号略作整理。数学符号发言意义(m1)eta因变量潜变量的向量(n1)xi自变量潜变量的向量(m1)zeta潜变量残差的向量(mm)beta因变量潜
32、变量之间的路径系数矩阵(mn)gamma自变量潜变量之间的路径系数矩阵(mm)psi因变量的协方差矩阵(nn)phi自变量的协方差矩阵Y(p1)因变量可观测变量的向量X(q1)自变量可观测变量的向量(p1)epsilon因变量可观测变量残差的向量(q1)delta自变量可观测变量残差的向量y(pm)lambda y因变量可观测变量和潜变量之间因子负荷的矩阵x(qn)lambda x自变量可观测变量和潜变量之间因子负荷的矩阵(pp)theta-epsilon因变量可观测变量残差的协方差矩阵(qq)theta-delta自变量可观测变量残差的协方差矩阵模型识别构造好结构方程模型以后,紧接着的工作,
33、当然就是使用统计软件,对这个模型进行参数估计。这看起来非常容易,但是对于初学者而言,马上出现的问题,通常是模型识别不足(under identification)的问题,换言之,统计软件跑不出我们所想要的模型估计,而且在电脑萤幕上出现一些程序错误的警告信息。如前所述,我们在进行结构方程模型估计的时候,最想要的模型设计是过度识别,也就是模型中的自由度,希望能高于所必须估计的参数数量,这个要求,不仅对于衡量模型非常重要,对于结构模型而言,也是一个必要的条件。前面我们提到过,识别不足与过度识别的中线,是所谓的恰好识别,也就是所谓的饱和模型,如果能够辨认恰好识别的状态,我们就可以事先觉察所设计的模型会
34、不会遇到识别不足的问题。例如某个模型总共有三个潜变量,A、B、与C,假定其中A 同时影响B 与C,而B 又单独影响 C。在这个简单的结构模型里,如果明白我们前述的协方差矩阵的表述方式,那么这里我们有三个待估计的参数(也就是这三条潜变量路径系数:A 到 B、A到C、与 B 到 C),同时这个模型的协方差矩阵里也刚好有三个元素(COV(a,b)、COV(a,c)、与COV(b,c)),这刚好就是个恰好识别的模型,这时,如果我们增加一个待估计参数,比如猜想 C 对A 在理论上存在因果作用,那么马上就出现了识别不足的问题。避免出现识别不足和恰好识别现象的先决条件,当然就是在设计理论模型(或概念模型)的
35、时候,就已经考虑了自由度的问题。最简单的判别方式就是去计算协方差矩阵里的元素数量,是否高于所需要估计的参数数量。当然,更容易的方法,就是让统计软件告诉我们,究竟这个模型估计跑不跑得动。例如,在通过田野调查大量搜集数据之前,先使用虚构的假资料来试试这个理论模型,可以很容易的看清楚模型设计里的缺陷。那么,为甚么要这么麻烦地使用虚构数据进行测试呢?为甚么不能在搜集好数据之后,使用真实数据来进行测试呢?原因是,我们马上要谈到,处理识别不足问题的方法之一,就是增加模型中的自变量数量,但是要能增加自变量,必须在大规模调研之前,在构造研究工具的时候,就要在衡量题项里加以考虑了,这可不是在田野调查之后还能亡羊
36、补牢的事情。但是,即使我们的理论模型看起来是过度识别了,在利用真实数据,进行模型参数估计的时候,统计软件还是可能告诉我们识别不足或是恰好识别,这是为甚么呢?最可能的原因有两个:一是在非递归 (non-recursive)路径模型里,存在了数值过小的路径系数;或者,模型里的自变量(潜变量)之间,存在过于明显的多重共线(multi-collinearity)。以下针对这两种情形略加探讨。相对于非递归模型(non-recursive model),递归模型(recursive model)是指那些因果路径方向完全一致,不存在任何回路的模型,同时因变量的残差(干扰项)之间也不可以存在任何相关,因为一旦
37、相关,就有了回路了(所以我们预期因变量残差的协方差矩阵中所有的元素都接近0)。例如前述这个A 到B、A到C、与B 到 C 的模型就是一个递归模型,但是如果在其中添增一个C 到A 或是C 到B 的路径,或者B 与C 的残差之间存在相关,这个模型就变成了一个非递归模型了。对于非递归模型,如果模型中的路径系数接近0,也就是说,预期发生因果关系的潜变量之间,事实上,在真实数据的检验之下,其实是无关的,这时一方面由于模型中存在回路,需要估计的参数比起递归模型要多得多,甚至可能已经是恰好识别了,另一方面,这些需要估计的参数(路径),实质上根本不存在显著因果关系,将使得结构模型的求解发生困难,在内定的迭代运
38、算次数里还达不到均衡解,于是统计软件将之判断为识别不足。事实上,只要将模型设定成递归模型,同时我们确信因变量残差之间不存在相关,那么就一定不出现识别不足的问题。反之,由这里的描述,我们可以明白两种造成识别不足的可能情况:(1)模型被构造成非递归模型的形式,同时其中存在接近 0的路径系数;(2)因变量的残差之间存在相关,同时模型中存在接近0 的路径系数。另一个造成识别不足的原因是自变量(潜变量)之间的多重共线问题。很显然的,这还是和我们当初是如何来猜想这个世界、如何来构造模型有关。一个优秀的模型,必须满足简洁(parsimony)的要求,换言之,在周延地考虑了与研究问题真正相关的变量之后,所选定
39、的变量与变量之间,必须在概念上能够互斥,在概念上高度相关的变量,就应该视为同一个变量,使用相同的潜变量加以处理,不可以枝枝节节,同时使用好几个潜变量来表述相同的概念。只要能够注意这一点,就不容易出现自变量之间的多重共线问题,从而,也就比较可以避免研究者最讨厌的识别不足的问题。可是,有些时候,我们实在不够了解这个世界,我们在想象中以为不相关的概念,在真实的世界里,也许正是高度相关的,这与我们的人生境界、所接受的训练、对于研究问题的经验、认识等等,都有关系。那么,当我们的结构方程模型发生识别不足的时候,我们该如何来归因,才能够知道这可能是因为自变量之间的多重共线所造成的问题呢?首先是观察标准化回归
40、系数(standardized regression weights),也就是标准化路径系数的数值,如果两个潜变量之间的标准化路径系数接近 1 ,就代表这两个潜变量所代表的概念几乎相同,换句话说,这两个潜变量其实就是如假包换的同一个变量,这时如果将这两个潜变量同时当作自变量,来估计它们同时对另一个潜变量的影响,结构方程模型将无法计算这两条本来在概念上应该只有一条的路径系数,计算结果很可能就是其中一条的路径系数大于+1,而另一条却小于-1。所以在检查统计软件所跑出来的标准化回归系数矩阵时,如果看见这种情形,那么就可以明白这个模型之所以识别不足,可能就导因于自变量的多重共线问题。其次,如前所述,如
41、果模型中存在两条共线很严重的路径,或者说,存在两个高度相关的自变量潜变量,共同在影响着同一个因变量潜变量,由于统计软件在参数估计上遇到困难,很可能直接将这些在迭代的过程中所面临的不稳定现象,都归入了标准误(standard errors),以致使得存在共线问题的路径的标准误,明显地大于其它不存在共线问题的路径的标准误,因此,我们也可以通过观察未标准化回归系数(unstandardized regression weights)的标准误,来检查自变量之间是否存在多重共线的问题,进而确定模型发生识别不足的可能原因。同样的,前述这个计算困难的问题,也可能反映在所估计参数的协方差矩阵(covarian
42、ceof the parameter estimates)里,那些协方差特别高的成对路径,很可能就在暗示着存在着共线的问题。另一个明显的指标是,存在共线的路径所指向的那个因变量(潜变量)的方差估计(variance estimate)可能为负值。所有这些征候,都反映着模型的识别不足问题,正可能是来自于自变量间的高度共线性所造成的。如果很不幸地(事实上研究者通常就是这么不幸),我们的理论模型看起来很好,一点也没有识别不足的问题,但是在昂贵的田野调查之后,利用统计软件和大量样本,针对模型进行参数估计时,电脑却出现令人懊恼的识别不足问题,这时我们该怎么办呢?以下列出一些经验之谈:(1)设法找出并消除
43、模型中的回路型的路径,换言之,就是设法将模型构造成递归模型(recursive model)的形式。(2)从理论与实务同时下手,看看能不能找出证据,来支持模型中的某些待估计参数,其实是不需要估计的。换句话说,假如模型中原本有些预设需要估计的参数,但是在思考之后,我们发现这些参数的值,是可以合理的直接予以规定的,那么我们就可以直接将那些数值明白地表述(explicitly specify)在模型当中,这样每多指定一个固定(fixed)的值,模型就多出一个自由度来,可以很有效地消除模型识别不足的问题。但是能够这样做的前提,还是需要有根有据,不能为所欲为。(3)如果找不到证据支持来直接指定待估计参数
44、的值,但是却必须利用这方法来增加自由度,那么还有一个秘诀可以使用。在 AMOS 的 Analysis Properties 的 Output设定窗口里,勾选critical ratios for differences(CR)这个选项,然后检查所跑出来的配对的路径系数的这个CR 值(这个 CR 值,事实上等于两个路径系数的差,除以它的标准误,换句话说,就是标准化正态分布下的 Z 值)如果CR0.05),因此可以重新设定模型,将这两条路径的系数直接指定相同的任意值(当然要接近刚刚电脑跑出的估计值),因此就可以直接节省两个自由度。(4)设法减少模型中的路径。事实上,每减少一条路径,就等于减少一个待
45、估计参数,也就同时增加了一个自由度。如果在模型中直接将路径系数指定为固定(fixed)的值0,这与在模型中删除这条路径的效果是一样的。(5)设法删减变量,让模型变得更简洁。(6)删除(合并)那些相关系数很高的自变量潜变量。(7)在模型中增添(导入)新的自变量潜变量。(8)保证每个潜变量的可观测变量都至少三个或以上。(9)确保样本数据中不存在遗漏值。(10)一般的统计软件直接内定使用极大似然法(maximum likelihood)来进行参数的估计运算,可以考虑改用其他方法(例如 GLS)试试看。(11)设法在统计软件中设定更高的迭代次数。(12)把电脑砸烂。(开玩笑的,后果请自负!)拟合指标与
46、模型修正即使模型没有识别不足的问题,还有一件事,是研究者很惧怕看到的,那就是拟合指标不好,或者称为违犯估计的问题。拟合指标不及格,代表我们所想要验证的模型是不可以被接受的,也反映了模型的表述(specification)方式不好,不能充分地描述它所想要描绘的真实世界。这里所谓的不好,是指我们所搜集的数据拒绝了我们事先猜想的理论模型,如果这个数据来自随机抽样,而且真的能够代表我们所生存的真实世界,那么就证明了我们的模型确实不好,必需要加以修正;反之,如果模型的拟合指标及格,那么就代表我们所表述的模型,可能比较靠近了真理,或者至少是可以表达真里的众多模型中的其中之一。这里的主要问题是,我们无法确认
47、代进模型中的数据,真的是真理的化身,真的充分的反映了这个世界的真相。所以即使我们的模型,结构过硬、拟合及格,我们也不能说,我们已经通过了结构方程模型证明了某个真理,至多只能说,我们的数据,并没有拒绝了我们对这个世界的猜想。事实上,这里还有个所谓对等模型(equivalent models)的问题,也就是,除了我们所表述的模型之外,可能还存在一些拟合指标很接近、方差协方差矩阵很相似甚至完全相同,但是其实是不同表述形式的模型。考虑下列拥有相同三个潜变量的模型:(1)A-B-C(2)B-C,B-A,C-A(3)A-B,A-C,B-C(4)AB,B-C,C-A(5).假定这四个不同表述方式的模型,它们
48、的拟合指标都一样好,那么,究竟哪一个才真正代表真理呢?比较合理看待这个问题的态度是,回归洋八股的基本思想,我们在一开始设计这个模型的时候,就充分的引用了相关理论,来帮助我们解释这个世界的种种现象和行为,模型中特定概念之间的关系,不管是相关还是因果,也不管他们的影响方向,总之,全部必须有根有据,不能单纯基于空穴来风的臆测,这就是所谓的先验理论优势(status of a priori theory)的观点,换句话说,有理论支撑的模型,要比没有理论支撑的模型更有效,我们在设计模型的时候,一定要充分考虑到模型中的理论支持,这样再来考虑模型的拟合指标才有实际的意义。同时,研究者在利用结构方程模型进行研
49、究的时候,在不同理论和不同范式(paradigms)的支持下,也要多方考虑各种可能存在的对等模型,甚至通过替代理论(competing theories)来考虑各种可能的替代模型(competing models),而不应该只考虑了一种模型设计,在代入数据后,侥幸得到及格的拟合度,就说自己验证了真理。事实上,寻找真神,哪里是这么容易的事!正确的作法是,在一开始整理文献、构造理论的时候,就该开始考虑对等模型了,而且,在发展模型的过程中,还应该在理论的支持下,清楚说明放弃这些对等模型的原因。当然更严谨的作法是,对于拟合指标很接近(检定下不显著)的对等模型,最好能够设计实验进行更仔细的检查,看看在不
50、同的研究情境下,哪个模型更好。诚然模型的拟合指标及格不代表我们找到了上帝,但是如果模型的拟合不及格,那么肯定这个模型出了问题。出了什么问题呢?简单的说,就是模型和数据之间不相匹配的问题。想要比较模型和数据之间是否拟合,最简单的概念就是去比较由样本得来的真实的数据和使用模型所估计出来的数据之间,是否十分接近,而用来进行检查的手段,最简单的,但是也是最重要的,就是卡方检定(Chi-square test)。在结构方程模型中,实现这个过程的方法,主要就是去比较样本的协方差矩阵,和所估计参数的协方差矩阵之间,是否存在显著的差异,如果差异不显著(卡方值很小,或是卡方值的显著水平不显著),就代表这两者之间