数据漏报对总和生育率与出生率确定性函数关系的影响.doc

上传人:Wo****W 文档编号:63527004 上传时间:2022-11-25 格式:DOC 页数:9 大小:25KB
返回 下载 相关 举报
数据漏报对总和生育率与出生率确定性函数关系的影响.doc_第1页
第1页 / 共9页
数据漏报对总和生育率与出生率确定性函数关系的影响.doc_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《数据漏报对总和生育率与出生率确定性函数关系的影响.doc》由会员分享,可在线阅读,更多相关《数据漏报对总和生育率与出生率确定性函数关系的影响.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据漏报对总和生育率与出生率确定性函数关系的影响【摘要】:p :(中)【摘要】:p 根据总和生育率与出生率确定性函数关系,利用国家统计局人口统计数据,分别计算了四种出生人口数据漏报模式下总和生育率与出生率的关系系数。并与官方公布数据(有数据漏报)情况下估算的关系系数进行对比分析p ,发现虽然出生数据漏报对总和生育率和出生率有明显的影响,但是对总和生育率与出生率关系系数影响很小,可以忽略。因此,可以认为出生人口数据漏报对总和生育率与出生率具有同等的影响,而对两者之间的关系系数没有影响。并利用不受数据漏报影响的K值,估算出中国1990年以来的总和生育率,研究结果是官方和非官方都可以接受的生育水平。

2、最后,文章还对今后的研究方向提出了建议。【关键词】:p :(中)【关键词】:p 数据漏报;总和生育率;出生率;函数关系;人口统计中图分类号:(中)中图分类号C921文献标识码:A文章编号:1000-4149(20_)01-0001-13DOI:10.3969/j.issn.1000-4149.20_.01.001一、问题的提出出生率和生育率是反映人口生育水平的两个常用指标,出生率也称为粗出生率,它的优点是资料容易得到,能够从官方统计数据中获得,但是由于受到人口年龄构成和性别构成的影响,不能够很准确地反映生育水平,难以进行比较研究。生育率通常包括:一般生育率、分年龄生育率、终身生育率以及总和生育

3、率等,通常所说的生育率一般都是指总和生育率。总和生育率是比出生率更好的指标,它能够准确地反映现有生育水平,避免了育龄妇女构成的影响,可以直接用于比较研究,是最具有代表性的人口统计指标,具有直观、易理解的特点。在社会相对稳定的情况下,总和生育率可反映妇女生育率变化的趋势。但是除了普查年及小普查年,人们很难获得总和生育率的数据,而官方可以通过每年一度的人口变动抽样数据估计出历年的出生率数据。如果能够建立总和生育率与出生率之间的确定函数关系,就可以利用公布的出生率数据估计每年各个地区的生育率数据。我们曾经给出过总和生育率与出生率有确定性函数关系:总和生育率()=出生率(CBR) /常数(K),即=C

4、BR/K1,再根据人口统计数据估计出K值,这样如果已知出生率,就能够在K值给定的情况下估算出历年的总和生育率。然而,自20世纪90年代以来中国出生人口漏报是一个很普遍的现象。这可能会导致对K值的估计不准确,进而会影响到使用出生率对总和生育率所进行的估计。本文的目的就是在假定出生人口存在漏报的情况下,分析p 漏报对K值的影响,最终来判断利用出生率来估计总和生育率的有效性1-4。二、以往研究的回顾长期以来,出生人口数据漏报一直困扰着中国的人口学者,用漏报的出生人口数据计算出来的总和生育率与出生率总是不准确的,为此,人口学者尝试着利用各种间接数据来研究中国的总和生育率和出生率。关于出生人口数据漏报对

5、生育率影响的研究文献很多,根据数据处理方法和来的不同,可以分为三类不同的研究。一类是假定普查数据是可信和准确的,直接利用普查数据估计总和生育率,这类得到的结果是最低的,认为自20_年以来中国的总和生育率不超过1.55-7。第二类研究对普查数据提出质疑,通过各类方法调整后,再进行总和生育率的估计,由于使用的调整和估计方法不同,估计的结果也存在较大的差异,估计的总和生育率水平在1.421.758-11。第三类研究利用教育数据、公安数据等其他系统数据来校对、调整普查数据,进而估计总和生育率,估计的生育率水平在1.61.712-14。也有学者采用其他方法对生育率水平进行估算,比如,陈卫、杨胜慧采用布拉

6、斯(Brass)提出的生育率间接估计P/F比值方法,对中国2021年的总和生育率进行间接估计,得到的结果为1.6615;陈卫、张玲玲利用普查同队列人口的比较计算,估算出20_52021年间的生育水平基本上在1.5以上16。研究出生人口数据漏报的学者,主要有孙学礼和秦凯世,张广宇和原新,夏乐平,郭志刚等12,17-19,其中郭志刚和夏乐平具体给出了育龄妇女分年龄别的出生人口数据漏报说明和各个年龄别出生人口数据漏报的比例12,19。不同于已有文献关注于调整出生人口和育龄妇女人数来估计生育水平的方法,本文通过研究在有出生人口数据漏报情况下,总和生育率与出生率确定性关系系数的稳定性,并利用不受出生人口

7、数据漏报影响的关系系数K值,对1990年以来的中国人口生育率给予大致的估计。三、数据和方法二级标题1.数据来及预处理本研究所采用的年平均总人口数、分年龄别育龄妇女人数和每年对应的分年龄别出生人口数(活产数)取自国家统计局中国人口年鉴、中国人口统计年鉴和中国人口和就业统计年鉴,共获得了198_年到20_年近30年的数据。经过对数据进行处理由于早期的统计数据没有经过信息化处理,不是电子数据,本文作者花费大量时间把纸质的统计数据完全电子化,为后续的研究分析p 创造了条件,在此要特别感谢周小青、秦雪姣同学的大力帮助。,获得了可以用来计算总和生育率与出生率函数关系系数的数据:得到分年龄别妇女人数、分年龄

8、别活产数、年平均总人口数、分年龄别育龄妇女结构数据、分年龄别生育率数据、分年龄别标准生育模式数据。通过上面的公式(10)能够清楚地发现,影响K值的主要因素是分年龄别出生人口数(分年龄别活产数)、分年龄别育龄妇女人数以及平均总人口数。在计划生育政策的影响下,会出现一定程度的出生数据漏报,并可以表现为分年龄别出生人口数(分年龄别活产数)的漏报。人口漏报主要集中在09岁的少年儿童阶段,由于上学申报户口等原因,漏报的人口随着年龄的增长会逐步补报,而1549岁育龄妇女漏报很少,其漏报率只有0.159,这个漏报情况对地区育龄妇女总和生育率的影响很小,可以忽略20;即使在出生人口漏报严重的20世纪90年代,

9、人口漏报也不超过10,国家统计局对1993年和1994年人口變动情况进行了抽样调查,发现1993年和1994年人口漏报率分别为6.9和6.421,而人口出生率漏报也多是在5以下22,漏报的出生人口对总人口数量的影响微乎其微,也可以忽略。因此在数据漏报对总和生育率与出生率确定性函数关系影响研究中,不考虑分年龄别育龄妇女人数和平均总人口数这两个变量的变化20-28。本文主要研究出生人口数据漏报,特别是分年龄别出生人口数(分年龄别活产数)的漏报对K值的影响。3.研究方法为了便于研究,本文把分年龄别出生人口数(活产数)漏报对K值的影响分为四种模式。(1)每个年龄别的出生人口数成比例漏报。举例说明,对1

10、5,16,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段漏报的出生人口数都具有相同的比例,比如都是30,则每个年龄段漏报前的出生人口数(活产数)B1_=B_130,然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),代入K值计算公式估算K值,再对计算结果进行分析p 。(2)每个年龄别漏报的出生人口数据固定。举例说明,对15,16,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段都漏报1000个活产,则每个年龄段漏报前的出生人口数(活产数)B2_=B_+1000,然后用漏报前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),

11、代入K值计算公式估算K值,再对计算结果进行分析p 。(3)每个年龄别漏报的出生人口数据没有规律,每个年龄别漏报人数不确定,而是随机漏报。举例说明,对15,16,17,48,49等35个育龄妇女年龄段的出生人口数(活产数),假定每个年龄段漏报的出生人口数都不一样,也没有规律,假定按照随机函数RAND()的50比例漏报,则每个年龄段漏报后的出生人口数(活产数)B3_=B_+B_RAND()/2,漏报前的出生人口数在B_(官方公布的数据)和1.5B_之间随机变化,(随机函数RAND()返回大于等于 0 且小于 1 的均匀分布随机实数,每次计算工作表时都将返回一个新的随机实数,这里用随机函数RAND(

12、)来产生随机数据),然后用漏報前的出生人口数(活产数)作为该年龄别的出生人口数(活产数),代入K值计算公式估算K值,再对计算结果进行分析p 。(4)根据已有文献关于育龄妇女分年龄别出生人口漏报分布,研究出生人口漏报对K值的影响。根据文献的论述,40岁以上育龄妇女生育已经极少,因此在研究漏报对K值的影响时,这个年龄段的漏报可以忽略。1519岁及3549岁两个年龄段育龄妇女,占整个生育群体的比例从1980年的12逐步减少到5,他们对整个生育率的影响是有限的,在研究漏报对K值的影响时也不予考虑,而2034岁是高生育率年龄段,该年龄段出生人口数据漏报对总和生育率、出生率及K值的影响最大,这个年龄段出生

13、人口数据漏报是研究的重点。根据文献的研究结果,由于官方制定的晚婚晚育的限制,导致20岁、21岁和22岁育龄妇女出生人口漏报问题严重,漏报比例分别达到63、28和18,而进入可以生育第一胎的2326岁年龄的育龄妇女群体,漏报情况很少。进入27岁的年龄段,由于进入第二胎生育期,漏报的数据再次升高,在2734岁的年龄段漏报的数量超过2012,19,24-25。本文首先利用已知年份的出生人口数、妇女人数和总人口数,求出官方公布数据下的K值,然后再把该年份的出生人口数作为有漏报的出生人口人数,分别采用上述四种模式的数据漏报方法获得漏报前的出生人口数,并用漏报前的出生人口数代替原来的出生人口数,利用K值计

14、算公式分别求出四种出生人口漏报模式下的K值,再用四种漏报模式下求出的K值与官方公布的数据(有数据漏报)下求出的K值进行对比分析p ,研究四种出生人口数据漏报对K值的影响程度。四、结果与讨论在下面的讨论过程中用到的一些变量,在这里分别作如下的定义说明:B_表示官方公布(有漏报数据)的活产数;B1_代表每个年龄别出生人口数成比例漏报前的活产数;B2_代表漏报了固定出生人口数前的活产数;B3_代表随机漏报了出生人口前的活产数;B4_代表根据已有文献漏报了出生人口前的活产数;f_表示官方公布数据情况下的分年龄别生育率;f_1表示成比例漏报下的分年龄别生育率;f_2表示固定漏报情况下的分年龄别生育率;f

15、_3表示随机漏报下的分年龄别生育率;f_4表示根据已有文献漏报比率下的分年龄别生育率;h_表示官方公布数据下的标准生育模式;h_1表示成比例漏报下的标准生育模式;h_2表示固定漏报下的标准生育模式;h_3表示随机漏报下的标准生育模式;h_4表示根据已有文献漏报比率下的标准生育模式;K表示官方公布数据下的总和生育率与出生率关系系数;K1表示成比例漏报情况下的系数;K2表示固定漏报情况下的系数;K3表示随机漏报情况下的系数;K4表示根据已有文献漏报比率情况下的系数。根据K值计算公式(10),在平均总人口P和分年龄别育龄妇女W_没有漏报的情况下,即可以把公式中的P和W_看作固定值。现在只研究出生人口

16、数漏报,也即分年龄别出生人口数漏报对K值计算结果的影响。本文利用国家统计局中国人口统计年鉴和中国人口和就业统计年鉴获得了198_年到20_年近30年的人口统计数据,并对每一年的数据进行了分析p 处理。首先利用上述数据求出每一年的K值,然后,分别针对四种数据漏报模式,求出四种漏报情况下的K值,并对填补了漏报数据求出的K值与官方公布数据(有漏报数据)情况下求出的K值进行比较分析p ,研究数据漏报对K值的影响。通过对每一年数据的研究分析p ,发现每一年数据漏报对K值的影响是一致的。为了能够清楚地展示研究过程,下面以1995年和20_年两个年份的研究过程为例,展示分析p 出生人口数据在四种漏报模式下,

17、数据漏报对K值的计算结果的影响。1.成比例漏报情况下K值的稳定性研究结果与分析p 1995年官方公布数据情况下,K值的计算过程及计算结果参见表1。五、归纳和总结有关20世纪90年代以来中国生育水平的学术研究中,数据质量问题成为研究中国生育水平的关键问题。在众多的研究中,有关生育率水平的探讨主要通过两大类方法来处理。一类是调整出生人口数据,通过考察各类调查、普查数据之间的关系,调整、回推出生人口数据;或者利用教育、公安等其他系统数据,通过校对、调整出生人口数。另一类是采用一些对普查数据质量要求较低的计算方法,比如采用生育率间接估计的P/F比值方法、变量r方法等。不同于已有研究关注于出生人口数据质

18、量对生育率的影响,本文从总和生育率与出生率确定性函数关系系数入手,研究出生漏报对关系系数K值的影响,研究发现数据漏报对K值的影响很小,足以忽略,从而可以利用人口统计数据求出K值,并利用官方公布的出生率估算出每年的总和生育率数据,本研究提供了一种利用人口统计数据计算生育率的新方法,可以计算出每一年的生育率数据,计算结果是官方和非官方都接受的生育水平。K值随着时间的变化规律,以及与K值有关的标准生育模式h_的变化规律是今后需要进一步研究的问题。(致谢:作者感谢安徽农业大学教授徐俊博士在论文撰写过程中给予的支持!)【参考文献】:p :【参考文献】:p 内容1乔晓春,朱宝生.如何利用(粗)出生率来估计

19、总和生育率?J.人口与发展,20_(2):65-70,100.2CBELL A A.Manual of fertility analysisM.London: Churchill Livingstone,1983:3-10.3ENTWISLE B.CBR versus TFR in crossnational fertilityJ.Demography,1981,18(4):635-643.4佟新.人口社会学M.北京:北京大学出版社,20_:63-93.5郭志刚.六普结果表明以往人口估计和预测严重失误J.中国人口科学,2021(6): 2-13,111.6郝娟,邱长溶.20_年以来中国城乡生育

20、水平的比较分析p J.南方人口,2021(5): 27-33.7朱勤.20_2021年中国生育水平推算基于“六普”数据的初步研究J.中国人口科学,20_(4):68-77,112.8李汉东,李流.中国20_年以来生育水平估计J.中国人口科学,20_(5):75-83,112.9王金营,戈艳霞.2021年人口普查数据质量评估以及对以往人口变动分析p 校正J.人口研究,20_(1):22-33.10崔红艳,徐岚,李睿.对2021年人口普查数据准确性的估计J.人口研究,20_(1):10-21.11米红,杨明旭.总和生育率、出生性别比的修正与评估研究基于19822021年历次人口普查、1抽样调查数据

21、J.人口与发展,20_(2):12-19.12夏乐平.197920_年中国人口生育趋势:出生数据和教育数据的比较分析p J.人口研究,20_5(4):2-15.13杨凡,赵梦晗.20_年以来中国人口生育水平的估计J.人口研究,20_(2): 54-65.14陈卫.20_年以来中国生育水平评估J.学海,20_(1):16-25.15陈卫,杨胜慧.中国2021年总和生育率的再估计J.人口研究,20_(6):16-24.16陈卫,张玲玲.中国近期生育率的再估计J.人口研究,20_(2): 32-39.17孙学礼,秦凯世.出生漏报的症结及建议采取的措施J.人口與经济,1993(1):49-51.18张

22、广宇,原新.对1990年代出生漏报和生育水平估计问题的思考J.人口研究,20_4(2):29-36.19郭志刚.再论队列平均子女数不能作为当前总和生育率的估计J.中国人口科学,2021(5): 26-33,95.20王金营,何云艳,王志成,等.中国省级20_年育龄妇女总和生育率评估J.人口研究,20_4(2):20-28.21贾同金,赛音.人口变动情况抽样调查现状与问题分析p J.人口研究,1995(5):28-31.22周夷谷,于丽莎.出生人口数量增多是我国第三次出生高峰的主要内容兼与查瑞传老师商榷J.人口研究,1992(5):25-28.23乔晓春.“单独二孩”,一项失误的政策J.人口与发展,20_(6): 2-6,18.24周皓.我国第四次人口普查漏报情况的重新估计基于第五次人口普查的分析p J.人口研究,20_3(2):36-41.25李若建.历次人口普查中低年龄组人口漏报研究J.中山大学学报(社会科学版),20_(2):145-152.26赵梦晗.20_2021年中国生育水平估计J.人口研究,20_(5):49-58.27乔晓春.实施“普遍二孩”政策后生育水平会达到多高?兼与翟振武教授商榷J.人口发展,20_(6):2-15.28郭志刚.中国的低生育水平及其影响因素J.人口研究,2021(4):1-12.责任编辑方志责任编辑第 9 页 共 9 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁