《二元经济中城乡混合基尼系数的计算与分解.doc》由会员分享,可在线阅读,更多相关《二元经济中城乡混合基尼系数的计算与分解.doc(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2006 年第 1 期 二元经济中城乡混合基尼系数的计算与分解 * 程永宏 内容提要 : 关于基尼系数计算方法的文献已经十分丰富 , 但专门计算城乡混合基尼系 数的理论方法 , 却一直没有得到很好的解决 , 这导致全国收入分配长期变化方面的某些研 究难以深入 。 本文建立了城 乡混合基尼系数的新算法 , 并给出新的分解形式 , 同时还提出 并论证了度量城乡差距的新指标 。 该分解形式具有明确的经济含义和理论意义 , 并且不 依赖于 城乡收入分布不重叠 的假定 。 利用这一分解形式的经济含义 , 我们分析了几个 重要理论问题 。 最后 , 应用新算法计算并分解了中国个别年份的城乡混合基尼系数 ,
2、 以检 验新算法的有效性 。 关键词 : 城乡混合基尼系数 混合基尼系数分解形式 城乡收入分布相对差距指数 一、引 言 中国经济直到目前仍然具有典型的二元结构特征 , 其主要表现之一就是 : 在城乡之间存在着显 著的收入水平和收入分布的差异。对于这种经济 , 由于技术上和理论上的原因 , 计算城乡混合基尼 系数 非常困难。 如果基于城乡混合的收入调查数据 , 利用通常的几何法或平均差法等进行计算 , 这在理论上是 可行的。国内曾有学者在个别年份进行过这 种调查和计算 , 例如 , 李强等 ( 1995) 、赵人伟和李实 ( 1999, p. 49) 等。但这种方法的 广泛应用遇到几个难题 :
3、首先因为过去多年中国统计部门一直没有 进行过城乡混合的收入调查 , 因而这种方法不能满足研究中国收入分配历史变化过程的要求 ; 更重 要的是 , 根据城乡混合的收入调查数据 , 无法对城乡混合基尼系数进行分解分析 , 这对于研究全国 收入差距的构成及其变化是一个重大损失。 而利用城乡分离的收入调查数据计算城乡混合基尼系数 , 这在目前的国内外文献中都没有得 到很好的解决 ( 胡祖光 , 2004; 李实、赵人伟 , 1999; 李实 , 2000; 李强、洪大用等 , 1995) 。 胡祖光 ( 2004) 根据 !中国统计年鉴 中独立的城镇和农村居民收入调查资料 , 对通常的人口等 分法进行
4、修正 , 即把农村最贫穷的 33. 3% 人口视为城乡混合后全国最贫穷的 20% 人口 , 把城镇人 口中最富的 50% 视为城乡混合后全国最富的 20% 人口 , 其依据在于 : 前者平均收入低于同期城镇 居民困难户的平均收入。这种处理作为一种近似方法是可行的 , 但从理论上看 , 即使农村最贫穷的 33. 3% 人口平均收入低于城镇困难户的平均收入 , 但农村人口中的高收入仍然有可能超过城镇人 口中的低收入 ; 事实也的确如此 ( 董静、 李子奈 , 2004) 。这种情况会导致上述方法失效。 陈宗胜、周云波 ( 2002, p. 26 29) 给出一个 分层加权法 计算公式 , 并计算了
5、中国 1988 1998 * 程永宏 , 中国人民大学公共管理学院社会保障 研究所 , 100872, 电 子信箱 : chengyonghong mparuc. edu. cn。本 文获得国 家 社科基金重大招标项目 !调整收入分配格局 , 缩小收入差距政策研究 的资 助 , 项目编号 05&ZD049; 感谢北京师 范大学李实教 授的 修改意见 , 同时也感谢匿名审稿人的宝贵意见 ; 但文负自责。 # 城乡混合基尼系数是指 , 把全国所有城镇和农村居民看作一个整体 , 按全部国民收入在这一整体中的 分配状况所计 算的 基尼系数 , 这是定量描述全国收入差距的重要指标 , 有些文献称之为 全
6、国基尼系数 。 109 # 程永宏 : 二元经济中城乡混合基尼系数的计算与分解 年的城乡混合基尼系数。该算法把城乡人口分组数据中各组人口比重的加权平均 , 等同于全国人 口分组数据中的各组人口比重 , 这种等量关系是否严格成立 , 需要进一步讨论。 一些关注基尼系数可分解性的文献对计算城乡混合 基尼系数具有重要参考价值 , 但遗憾的是 , 这些分解形式存在很强的约束条件。例如 Sundrum, R. M( 1990, p. 50) 提供了一种算法 , 用来计算由 穷人 和 富人 两个群体构成的混合群体的基尼系数 : 设 穷人 群体的基尼系数、平均收入、人口 比重分别为 G1 、 1 、 P1
7、, 富人 群体的基尼系数、平均收入、人口比重分别为 G2 、 2 、 P 2 , 全体人口 的平均收入设为 , 则混合群体的基尼系数 G 可分解为为 : G = P1 G1 + P2 G2 + P 1 P2 国内有学者引用这一公式计算中国城乡混合基尼系数 , 这就忽略了这一算法所需要的一个很 强的条件 : 穷人与富人的收入分布不重叠。这在现实经济中是很难满足的 , 例如 , 1995 年 , 中国农 村居民中就有 26% 高于城镇居民中最低 10% 收入组的平均收入 ( 李实 , 2002) 。因此 , 严格说来 , Sundrum 的算法不适合计算城乡混合基尼系数。 针对这一问题 , 董静、
8、李子奈 ( 2004) 对 Sundrum 的算法进行了修正 , 以便更合理地用来计算城 乡混合基尼系数。从其证明过程看 , 这一修正的算法 依赖于 城镇和农村居民的收入是两个服从正 态分布的独立随机变量 这一假定 , 但现实经济中居民收入不一定服从正态分布。 Cowell( 2000) 总结其他学者的研究成果时指出 : 混合群体的基尼系数无法在不同群体之间分解 尽净 , 因为混合基尼系数除了要包括各组内部差距之外 , 还应包括组间差距和交叉项 , 即 : n i= 1 式中 , G 是混合基尼系数 ; Gi 是第 i 组的基尼系数 ( i = 1, 2, &, n) , Wi 是 Gi 的权
9、系数 , 等于第 i 组 人口比重与收入比重的乘积 ; Ib 是以各组平均收 入计算的基尼系数 , 即组间差距指数 ; ( f i ) 为交叉 项 , 是各组内部收入分布 f i 的函数 , 其大小取决于各组收入分布的重叠程度 , 当各组的收入分布完 全不重叠时 , ( f i ) = 0。 Silber( 1989) , Yao, Shujie( 1999) 也给出了类似的分解形式。 徐宽 ( 2003) 对过去八十年中基尼系数计算方法 ( 包括分解方法 ) 的发展进行了一次全面总结 , 从中可以看出 , 到目前为止 , 基尼系数按组群分解的方法主要就是上述这种形式 , 并且其中的交叉 项颇
10、有争议 : Mookherjee and Shorrocks ( 1982) 等认为它 不可能有精确解释 ; Silber ( 1989) 和 Lambert and Aronson( 1993) 则认为它有明确的经济意义 , 并给出了一个解释 , 但这个解释实质上也只是说 : 交叉项反映了各组收入分布的重叠程度 , 除此以外并没有更多的经济含义。 综上所述 , 到目前为止 , 城乡混合基尼系数的计算及分解一直没有得到满意的解决。 本文根据笔者以前提出的一种单一样本基尼系数计算方法 ( 程永宏、糜仲春 , 1998) , 构建了一 种理论 上可靠的城乡混合基尼系数计算方法 , 并给出一种全新而
11、且简单的分解形式。 为了清楚地阐述本文算法的原理 , 这里有必要部分地重复笔者此前推导一般基尼系数计算方 法的过程 , 本文第二部分主要是完成这一工作 , 并对这一算法的误差进行估计 ; 第三部分导出城乡 混合基尼系数的计算公式 ; 第四部分对城乡混合基尼系数进行分解 , 并在此基础上建立了全面度量 城乡差距的新指标 ; 第五部分应用本文的算法 , 计算了 1990 年中国城乡内部基尼系数和城乡混合 基尼系数 , 以检验本文算法的有效性 ; 第六部分对本文算法的优缺点进行了总 结。 二、用收入分布函数 计算单一总体的基尼系数 G 本文以基于个人收入的基尼系数为例论证新算法的原理 , 其他类型基
12、尼系数的算法同此。 ( 一 ) 洛伦兹曲线与收入分布函数的解析关系 : 110 2 1 2 2 2 - 1 G = WiGi + Ib + ( f i ) 2006 年第 1 期 在一个人数众多的收入总体中 , 个人收入可以被近似地看作一个连续型随机变量 I, 因此 , 个 人收入分配状况可以用随机变量 I 的概率分布函数来表示 , 即 : P I t 2 , 则 T = max( t 1 , t 2 ) = t 1 , 实际计算过程中可以根据具体的中间结果确定 max( t 0 1 , t2 ) ) : ( 25) 这就是计算全国城乡混合基尼系数的基本公式。将上式进一步展开 , 并记 : 0
13、 0 0 0 0 t2 t2 0 0 t2 2 把 ( 25) 式展开 , 再把上式及 ( 26) 式代入 , 整理后可以得到 : t1 - A 1 + !A 2 + !( t 1 - t 2 ) C ( 26) ( 27) 至此 , 我们得到了城乡混合基尼系数 G n 的计算公式。尽管这一公式比较复杂 , 但利用计算机 强大的数值计算功能 , 这一问题可以很容易得到解决。更重要的是 , 上述计算公式可以进一步分解 成具有明确经济意义的简单形式 , 这种分解形式提供了一个重要的分析工具 , 可以对收入分配的一 些理论问题进行分析。下面讨论城乡混合基尼系数的分解形式及其经济含义。 四、城乡 混合
14、基尼系数 Gn 的分解与 城乡差距新指标的建立 基尼系数的分解一直是相关文献研究的热点问题之一 , 但已有的分解方 法还很不完善 ( 万广 华 , 2004) 。根据本文的上述算法 , 可以导出一种全新的城乡基尼系数分解方法。 设农村居民平均收入为 u1 、城镇居民平均收入为 u2 、全国居民平均收入为 u, 利用 ( 20) 和 ( 21) 式可知 : t 1 - A 1 + !A 2 + !( t 1 - t 2 ) = u, A 1 - B 1 = u1 G1 , A 2 - B 2 = u2 G2 。 将 ( 27) 式经过重新组合得到 : u 利用 + != 1、 A 1 - B 1
15、 = u1 G1 , 上式分母 中的前两项 A 1 - B1 可变为 : A 1 - B 1 = ( A 1 - ( 1- !) B1 ) = ( A 1 - B1 + !B1 ) = u1 G1 + !B1 ( 27b) 同理 , 可以将 ( 27a) 式分母中的后面几项分别变为 : !A 2 - ! B2 = !( A 2 - ( 1 - ) B2 ) = !( A 2 - B 2 + B2 ) = !u2 G2 + !B2 ( 27c) !( t 1 - t 2 ) - ! ( t 1 - t 2 ) = !( t1 - t 2 ) ( 1- !) = !( t 1 - t 2 ) (
16、27d) 把 ( 27b) ( 27d) 代入 ( 27a) , 得到 : u u u 114 t 1 t 1 - ( F1 + !F 2 ) dt 0 G = - 1 1 t - ( F + !F ) dt t t t t t 2 2 F 1 dt = A 1 , F2 dt = A 2 , F1 dt = B1 , F2 dt = B 2 , F1 F2 dt = t t 2 考虑到 t t 2 时 , F 2 ( t ) = 1, 故有 F2 dt = t 1 - t2 , F 2 dt = t 1 - t 2 , 于是有 : t t t 2 2 2 F2 dt = F 2 dt + F
17、 2 dt = B2 + ( t 1 - t 2 ) , t t t 1 2 1 F 2 dt = F2 dt + F 2 dt = A 2 + ( t 1 - t2 ) 0 0 t 2 2 2 t1 - B1 + ! B2 + 2 !C + ! ( t 1 - t 2 ) Gn = - 1 2 2 2 ( A1 - B1 ) + ( !A 2 - ! B2 ) + !( t 1 - t 2 ) - ! ( t 1 - t 2 ) - 2 !C Gn = ( 27a) 2 2 2 2 u u ! !( B + B - 2C + t - t ) G = G + G + ( 28) t 2 2 t
18、 1 2 t 1 2 2006 年第 1 期 根据 ( 26) 式把 B1 、 B2 、 C 还原为定积分的形式 , 并考虑到 : 2 0 F2 dt = 0 F2 dt - 2 F2 dt ; 以及 t t 2 时 F2 ( t ) + 1, t 2 F2 dt = t1 - 1 t 2 , 2 则 B1 + 2 B2 - 2C 可以转化为 : 1 2 t 1 2 B 1 + B 2 - 2C = 0 ( F 1 + F 2 - 2F 1 F2 ) dt - t 2 F 2 dt = 0 ( F 1 - F2 ) dt - ( t 1 - t 2 ) 我们定义 : 把 ( 28a) 和 (
19、28b) 式代入 ( 28) 式 , 得到 : D = u 0 1 1 (F 1 - u2 F2 ) ! 2 dt ! ( 28a) ( 28b) G n = u G 1 + u G 2 + u D ( 29) 再把平均收入的定义式 u1 = W1 N 1 , u2 = W2 W1 N 2 , u = W2 W0 N 0 以及 、 !的定义式代入 ( 29) ! 式得到 : Gn = W0 G1 + W0 G2 + u D ( 30) 易知 , W1 W0 、 W2 W0 分别为农村居民总收入和城镇居民总收入占全国收入的份额 , 记 W1 W0 + , 则 W 2 W 0 + 1- , 于是
20、, ( 30) 式变为 : Gn = G1 + ( 1 - ) G 2 + !) D u ( 31) 这就得到城乡混合基尼系数 Gn 的分解式。该分解式中的 D 具有明确的经济含义 : 它是度量 城乡差距的一个优良指标 , 能比 城乡人均收入之比 ( 或差 ) 更全面地反映城乡差距。 为了证明这一点 , 我们首先对 城乡差距 概念的内涵进行必要的界定。尽管城乡差距概念经 常被提到 , 但并没有人给出严格的量化定义 ( 这里的 城乡差距 专指收入方面 ; 常见的度量指标是 城乡人均收入之比或之差 ) ; 但根据常识 , 我们可以合理地判定城乡差距指标应具有以下性质 : 第一 , 当城乡收入分布函
21、数完全相同即 F1 + F2 时 , 不存在城乡差距 , 因为这时城乡之间的收 入分配没有任何区别。因此 , 一个合理的城乡差距量化指标在 F 1 + F2 时应该等于 0。 第二 , 每一个农村 ( 或城镇 ) 居民的收入都低于任一个城镇 ( 或农村 ) 居民的收入 ( 即城乡收入分 布不重叠 ) , 不是存在城乡 差距的必要条件 ; 否则 , 任何现实经济中都肯定不存在城乡差距。因此 , 一个合理的城乡差距量化指标无需在城乡收入分布不重叠时才大于 0。 第三 , 由以上两点可知 : 只需城乡收入分布函数不完全相同 , 便可以认为存在城乡差距。可见 , 城乡差距实质上就是城乡收入分布函数之间
22、的差距。因此 , 一个合理的城乡差距量化指标在 F1 , F2 ( 指 F 1 与 F2 不全等 , 下同 ) 时应该大于 0。 第四 , 给定任一收入水平作为区分 穷人 和 富人 的标准 ( 这里的 穷人 和 富人 是相对的 , 分别指任一给定收入水平 t 以下或以上的人 ) , 如果农村 穷人 比重大于城镇 穷人 比重 , 则农村 居民在城镇获得较高收入的概率大于留在农村 , 农村居民有向城镇迁移的动力 , 而这正是存在城乡 差距的重要证据之一 ( Johnson, G. , 2002) , 故可以认为这时存在城乡差距 ; 反之亦然。从另一个角 度看 , 城乡之间 穷人 ( 或 富人 )
23、比重的差异 , 真实地 记录 了城乡收入分布偏离无差距状态的程 度 , 因此可被视为城乡差距的反映。可见 , 城乡差距与城乡之间 穷人 或 富人 比重的差异是完全 一致的。因此 , 一个合 理的城乡差距指标应该能够刻画城乡之间在 穷人 ( 或 富人 ) 比重上的差 t t t t t 异程度。 115 程永宏 : 二元经济中城乡混合基尼系数的计算与分解 接下来我们根据上述性质 , 分析 D 作为城乡差距指标的合理性。由 D 的定义易式 ( 28b) 可知 , D = 0 与 F1 + F2 是等价的 , D 0 与 F1 , F2 是等价的 , 因此 , D 符合上述性质一至三。 图 1 城乡
24、收入分布函数之差的经济意 义 更重要的是 , 根据概率分布函数和 D 的定义可知 , 当 F 1 , F2 时 , D 正是对城乡之间 穷人 ( 或 富人 ) 比重差异程度的度量 , 因此 D 也符合城乡差距的性质四。 F 1 , F 2 2 可分为两种情况 相交和不相交 ( 参见图 1; 为方便起见 , 图 1 中以 | F1 - F2 | 代替 ( F 1 - F2 ) 进行分析 , 其经济意 义是一致的 ) 。若 F 1 与 F 2 不相交 ( 参见图 1 中的 a 图 ) , 则 F1 F 2 ( 或 F1 F 2 ) 在整个收入分布区 间上都成立 , 这时在所有的 贫富标准 下都是农
25、村 ( 或城镇 ) 2 穷人 ( 或 富人 ) 比重大于城镇 ( 或农 村 ) 穷人 ( 或 富人 ) 比重 , ( F1 - F 2 ) 刻画了每一个贫富标准 t 下的农村 穷人 比重与同样标准 下的城镇 穷人 比重之间的差距 ; D 则全面 记录 了城乡之间每一个贫富标准下的 穷人 ( 或 富 人 ) 比重之差的总和。可见 , F1 与 F2 不相交时 , D 符合城乡差距的性质四。若 F 1 与 F 2 相交 ( 参 见图 1 中的 b 图 ) , 则 D 分成两部分 : 在交点以下 , D 记录 了农村 ( 或城镇 ) 穷人 比重大于城镇 ( 或农村 ) 穷人 比重的程度 , 在交点以
26、上 , D 记录 了农村 ( 或城镇 ) 富人 比重大于城镇 ( 或农村 ) 富人 比重的程度 , 二者之和仍然度量了城乡之间 穷人 ( 或 富人 ) 比重的差距程度。可见 , F 1 与 F2 相交时 , D 也符合城乡差距的性质四。因此 , 无论 F1 与 F2 是否相交 , D 都是符合城乡差距 性质四的。 综上所述 , 以 D 作为度量城乡差距的指标是合理的。而且 , D 能比城乡人均收入之比 ( 或差 ) 更全面地反映城乡差距。城乡人均收入之比 ( 或差 ) 作为城 乡差距的指标过于粗略 , 因为 平均收 入 本身只是一个抽象概念。特别地 , 当城乡人均收入水平相同而收入分布不同时
27、( 例如象图 1 中 b 图所示 ) , 城乡差距是存在的 , 但城乡人均收入之比 ( 或差 ) 却无法识别它 , 即不满足上述性质三 , 而 D 则完全可以识别出这种情况下的城乡差距 , 尽管这种情况并不常见 ( 但在比较国与国之间的 差距时很可能是常见的 ) 。泰尔指数的分解形式 ( 参见万广华 , 2005) 和 Cowell ( 2000) 的基尼系数分 解形式就存在这一问题 : 其中的 组间差距 仅仅是各组平 均收入和总平均收入的函数。 显然 , D 与人均收入水平有关 , 且与收入水平具有相同的量纲。因此 , 我们可以把 D 定义为 城乡收入分布绝对差距指数 , 或简称为 绝对城乡
28、差距 ; 而 D 被 u 除后与人均收入水平不再相 关 , 故可以把 D u 定义为 城乡收入分布相对差距指数 , 或简称为 相对城乡差距 , 它与基尼系数 具有相同的 量纲 , 是对城乡混合基尼系数的直接贡献之一 , 因此 , 可以记作 : D u = G 3 , 则 ( 31) 式 可以变为 : Gn = G 1 + ( 1- ) G2 + !G3 ( 31a) 本文分解形式具有明确的经济含义和理论意义。具体地 , 可以利用 ( 31) 式进行分析 : 与 Sundrum, R. M( 1990, p. 50) 分解式相比较 , 本文分解式无需 组间收入分布不重叠 的假定 , 116 20
29、06 年第 1 期 并且其中 G1、 G2 的权系数具有明确的经济意义 : 分别是农村和城镇收入份额 , 这表明城乡各自内 部基尼系数对城乡混合基尼系数的影响程度只取决于城乡收入份额。 利用上述分解形式还可以推知 : 经济增长一般不能降低绝对城乡差距 D 。即使所有居民的收 入同比例增长 , D 仍然随经济总量的增长而增长。由此可见 , 随着经济总量的增长 , 即使所有群体 收入都有所增长、总体基尼系数不变 , 也仍然存在着不同群体间绝对收入差距扩大的可能性 , 世界 银行学者的研究也证实了这一点 ( Dollar, D. and Kraay, A. , 2001; 转引自胡祖光 , 2004
30、) 。 而且 , 上述结论也适用于以其他标准划分的 不同群体之间的收入差距分析。 五、对本算法的检验 根 据统计数据计算并分解中国的城乡混合基尼系数 为了检验上述算法的有效性和可操作性 , 我们利用 1990 年中国城乡收入分组数据计算并分解 当年城乡混合基尼系数。计算过程主要包括以下几个步骤 : ( 一 ) 根据城乡收入调查数据 , 拟合城乡家庭人均收入分布函数 F 1 、 F 2 。 根据 1990 年的统计资料 , 我们分别采用城镇家庭人均生活费收入和农村家庭人均纯收入分组 数据 , 计算出各收入水平下城乡家庭人均收入分布频率 ( 见表 1) 。 表 1 1990 年中国城镇和农村家庭收
31、入分组数据 农村家庭 收入 t 累积 频率 F 1 城镇家庭 收入 t 累积频率 F 2 农村家庭 收入 t 累积频率 F 1 收入 t 城镇家庭 累积频率 F 2 100 以下 150 以下 200 以下 300 以下 400 以下 500 以下 0. 0045 0. 0139 0. 0359 0. 1308 0. 2752 0. 4263 720 以下 840 以下 960 以下 1080 以下 1200 以下 1320 以下 0. 0738 0. 1309 0. 2004 0. 288 0. 3755 0. 4739 600 以下 800 以下 1000 以下 1500 以下 2000
32、以下 0. 5589 0. 7445 0. 849 0. 9521 0. 9823 1440 以下 1560 以下 1680 以下 1800 以下 0. 5656 0. 6452 0. 7195 0. 7776 数据来源 : 根据 !中国统计年鉴 1991( 国家统计局 , 1991, p276、 294)相关收入分组数据计算。 接下来的关键在于高精度地拟合收入分布函数 , 这需要找到适当的概率分布 函数形式。我们 试用了帕累托函数、伽马函数、正态分布函数等 , 发现都不适合中国城乡收入分配状况 ; 经过反复试 验对比 , 最终发现 , 对生物学中常用的逻辑斯蒂函数稍加变形 , 用来拟合中国城
33、乡收入分布比较适 合 , 只是在两端理论曲线比实际分布上升稍快 , 为此 , 我们将自变量 t 的指数由 1 降为 0. 05, 拟合效 果得到极大改善。因此 , 最终选定以下函数形式拟合中国城乡收入分布 : F( t ) = 1 ( 1+ ae ) ( 32) 其中 , a、 b 为待估计参数 , 利用表 1 中 F1 、 F2 、 t 的样本值 , 用最小二乘法可以得到 a、 b 的估计 值。在实际拟合过程中 , 我们发现上述分布函数形式过于复杂 , 直接拟合会出现迭代次数过大而溢 出的问题。为此 , 我们把 ( 32) 式进行对数线性化 , 转化成如下形式 : ln( 1 F - 1)
34、= lna - bt ( 33) 记 : ln( 1 F - 1) = y , - b = p , lna = q, t = x ( 34) 则 ( 33) 式变为 : y = px + q ( 35) 式中 , p 、 q 为待定系数 , y 、 x 是根据样本数据 F 、 t 和 ( 34) 式计算的中间变量。利用 Matlab 对 y 、 x 117 - bt0. 05 0. 05 0. 05 程永宏 : 二元经济中城乡混合基尼系数的计算与分解 进行最小二乘拟合 , 可以得到 p 、 q 的估计值 , 再根 据 ( 34) 式可以计算出 ( 32) 式中的待定参数 a 、 b 。 表 2
35、 中分别列出根据农村和城镇收入调查数据进行曲线拟合得出的参数值 p 、 q , 以及由此得到的 a 、 b 值。从拟合优度指标 R 看 , 拟合效果非常好。 表 2 1990 年中国农村和城镇收入分布函数拟合结果及拟合优度 q p R 2 Adj R 2 SSE a b 农村 城镇 63. 17 81. 91 - 45. 95 - 57. 13 0. 9995 0. 9999 0. 9995 0. 9999 0. 04267 0. 00180 2. 7188E+ 27 3. 7416E+ 35 45. 95 57. 13 t 2 、A ( 二 ) 根据收入分布函数拟合结果 , 计算城乡混合的收
36、入分布函数 , 以及所需要的中间结果 t1 、 1 、 A 2 、 B1 、 B2 、 C , 最后计算出城乡混合基尼系数 Gn: 计算城乡混合的收入分布函数 , 涉及城乡家庭数量。在忽略抽样误差的前提下 , 我们可以认 为 , 城、乡样本的收入分布函数真实地代表了城、乡各自总体的收入分布函数 , 则计算城乡混合收入 分布函数时 , 可以采用全国城乡家庭数量。另外 , 目前国家统计局的城乡收入抽样调查不是按照分 层抽样原理进行设计的 , 采用全国城乡家庭数量进行计算可以避免 对分层抽样调查的要求。据此 , 利用 ( 17) 式和 ( 32) 式 , 可以分别计算出全国农村和城镇家庭人均收入最高
37、值 t 1 、 t 2 : N 1 b1 N 2 b2 然后 , 根据上面得到的 a1 、 b1 , a2 、 b2 , F1 、 F2 , t1 、 t 2 , 结合 ( 26) 式的定义 , 利用 Mat lab 的数值积 分功能 , 计算出 A 1 、 A 2 、 B1 、 B2 、 C, 计算结果见表 3。最后 , 我们分别利用 ( 27) 式的原始公式和 ( 31) 式的 分解式计算 Gn 。 ( 27) 式计算结果列于表 3, ( 31) 式计算结果列于表 4。两个计算公式的计算结 果在小数点后第 6 位才出现差距 , 这表明 ( 31) 式的分解形式是正确的。 表 3 利用 (
38、27) 式计算城乡混合基尼系数 表 4 利用 ( 31) 式计算城乡混合基尼系数 项目 N 农村 175300000 城镇 86260000 项 目 农村 城镇 t A B u G 111340. 5830 110659. 4919 110447. 2983 681. 0911 0. 31155 75611. 0845 74131. 45268 73773. 57588 1479. 6319 0. 24187 城乡家庭人均收入均值 u 城乡户数比重 、 ! 城乡收入份额 城乡各自基尼系数 G 681. 015 = 0. 6702 = 0. 4833 0. 31155 1479. 5180 !=
39、 0. 3298 1- = 0. 5167 0. 24187 、 ! = 0. 6702 != 0. 3298 全国家庭人均收入均值 u 城乡收入分布差距 D 944. 3555 336. 7966 C Gn 109806. 7879 0. 354368 城乡混合基尼系数 G n 0. 354368 注 : 表中 u 是指 全 国城镇 或农 村家庭 人均收 入的 平 均值 。 注 : 这里 , 农村收入份额 = u 1 N 1 ( u 1 N1 + u 2 N2 ) , 而 不 数据 来源 : 这 里的 农村 和城 镇家 庭 数量 N 、 N 根 据 等于农村居民收入总和占全国城乡收入总和的比
40、重 , 其 中 , u 1、 u 2 分 1 2 别为农村和城镇家庭人均收入 平均值 ; N1、 N 2 分别为全国 农村和城 !中国统计年鉴 1991( 国家 统计局 , 1991) 中农村 和城镇 家 庭平均 人口 ( p276、 294) 以及农 村和城镇 总人口 ( p79) 计 算 ; 、 !根据 N 1、 N2 计算。 镇家庭数量。这是因为 , 这里的基尼 系数是以 家庭人均 收入而不 是 个人收入为基础进行计算的 ; 城镇收入份额 也是同样定义的。 数据来源 : 根据 !中国统计年鉴 1991相关数据计算。 118 2 20 lna + ln( N - 1) 1- 1 1 20
41、1 lna2 + ln( N 2 - 1) 1- ( 三 ) 城乡混合基尼系数的分解及其三个组成部分的贡献率。 根据表 4 和 ( 31a) 式 , 可以把城乡混合基尼系数分解成 G1 、 G2 、G 3 2006 年第 1 期 的加权平均 , 并计算出各部 分对 G n 的贡献率 r 1 、r 2 、r 3 分别为 : r 1 = 42. 49% , r 2 = 35. 27% , r 3 = 22. 24% 。这里计算的城乡差距 对全国差距的贡献率 , 大大低于利用泰尔指数分解式计算的相应贡献率 ( Lee, 2000, 转引自 : 万广 华 , 2005; 魏后凯 , 1996) , 这
42、是因为本文的分解方法以及对城乡差距的定义与其他方法有本质的区 别。万广华 ( 2004、 2005) 注意到 : 在按城乡分组的情况下 , 利用目前已有的基尼系数或 泰尔指数分 解方法得到的城乡差距对全国差距的贡献率过大 , 一般达到 85% 左右。本文的分解方法克服了上 述问题 , 分解结果中城乡差距的贡献率大大降低。 六、总 结 从上述论证过程和检验结果看 , 本文构建的城乡混合基尼系数计算方法是可靠的 , 并在以下几 个方面获得了一些新的结果 : 第一 , 建立了计算并分解城乡混合基尼系数的新方法 , 这一方法无需进行分层抽样调查。 第二 , 建立了全面度量城乡差距的新指标。 第三 ,
43、本算法给出的混合基尼系数分解形式 , 不依赖于 城乡收入分布不重叠 的假定。 第四 , 本算法可 以避免通常算法低估基尼系数的倾向 , 且适合在计算机上运算 , 计算精度很高。 对本文算法的一个最大质疑可能是 : 随着统计方法的改进 , 有可能直接获得城乡混合的收入调 查数据 , 这似乎会使本文算法失去意义。但城乡混合的收入调查需要使用分层抽样技术 , 这一技术 容易导致较大的抽样误差 , 而且 , 直接使用城乡混合的收入调查数据计算混合基尼系数 , 将无法进 行分解分析。 本文分解方法有待深化的方面在于 : 只提供了涉及两个分组的分解形式 , 若将其推广到多个分 组 , 结果可能非常复杂 ,
44、 这需要进一步研究。 参考文献 陈希孺 , 2004: !基尼系数及其估计 , !统计研究 第 8 期。 陈宗胜 , 2000: !中国居民收入分配差别的深入研究 , !经济研究 第 7 期。 陈宗胜 , 2002: !关于总体基尼系数估算方法的一个建议 , !经济研究 第 5 期。 陈宗胜、周云波 , 2002: !再论改革与发展中的收入分配 , 经济科学出版社。 程永宏、糜仲春 , 1998: !利用个人收入分配函数确定基尼系数的新方法 , !华东经济管理 第 1 期。 董静、李子奈 , 2004: !修正城乡加权法及其应用 , !数量经济技术经济研究 第 5 期。 胡祖光 , 2004: !基尼系数理论最佳值及其简易计算公式研究 , !经济研究 第 9 期。 李强、洪大用等 , 1995: !我国社会各阶层收入差距分析 , !科技导报 第 11 期。 李实 , 2003: !中国个人收入分配研究回顾与展望 , !经济学季刊 第 2 卷第 2 期。 李实 , 2000: !对收入分配研究中几个问题的进一步说明 , !经济研究 第 7 期