《基于svm的城乡发展一体化水平评价——陕西延安的研究-王渊.pdf》由会员分享,可在线阅读,更多相关《基于svm的城乡发展一体化水平评价——陕西延安的研究-王渊.pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、A 西北大学学报(哲学社会科学版)萨翟三篓曼篓鍪三兰盏!篓:羔:墨墨三型塑墅堂堂 INIWT T_【经济研究】基于SVM的城乡发展一体化水平评价陕西延安的研究王 渊12,郝向举1,崔 弘3(1西安工程大学管理学院,陕西西安710048;2西北大学经济管理学院,陕西西安710069;3西安工业大学学生处,陕西西安710048)摘要:基于支持向量机(SVM)构建评价模型测度城乡发展一体化水平,并对陕西延安地区进行实证研究,一方面检验模型的有效性,另一方面为延安地区县域城乡发展一体化提供决策依据。为了解决构建指标体系过程中主观性强的问题,研究将评价指标看作空间维度,被评价样本映射为高维空间中的点集,
2、在构造学习样本的基础上,应用网格搜索法和K一交叉验证训练样本确定最优核函数与参数,并应用该模型测度了延安地区12个县的城乡发展一体化水平。结果表明,基于SVM的评价模型相对于传统的指标体系评价模型具有更高的科学性。KMeans聚类分析表明,12个县的城乡发展一体化水平应该划分为四个阶段:黄陵和吴起处于高度一体化阶段,志丹处于中度一体化阶段,洛川和安塞处于初步一体化阶段,其余的七个县均处于城乡互动起步阶段。关键词:城乡发展一体化;支持向量机;聚类分析中图分类号:F127 文献标识码:A DOI:1016152jcnkixdxbsk2016-02-022一、引言与问题的提出加快推进城乡发展一体化是
3、党的十八大提出的战略任务,也是落实“四个全面”战略布局的必然要求。推进城乡发展一体化要坚持从国情出发,认清城乡发展不平衡、不协调和二元结构的现实。作为省委、省政府支持的率先实现统筹城乡发展的地区,认识和解读城乡发展一体化的阶段性和差异性是推进统筹城乡发展的前提和基础,也是新时期“上山建城”战略目标能否顺利实现的关键。城乡发展一体化的阶段性和差异性客观存在,构建科学的评价模型并对特定样本进行横向比较具有重要意义。但是,通过对已有研究的梳理和分析发现,在内容上,建立指标体系是构建评价模型的基础,主观差异导致了指标体系的多样性;方法上,构建指标体系的降维过程很难规避信息损失和指标问的多重共线对评价结
4、果造成的影响。如果不对指标进行降维和分类,而是将每一个指标看做空间的一收稿日期:2015101l基金项目:陕西省软科学计划项目(2014KRM51);西安市社科规划基金(15J114);教育部人文社科青年基金(11YJC630217);陕西省哲学社会科学重点研究基地建设项目(14JZ018);西安工程大学研究生创新基金(CX2014041)作者简介:王渊,男,江苏镇江人,西北大学博士后,西安工程大学副教授,从事经济决策研究。万方数据王渊等:基于SVM的城乡发展一体化水平评价个维度,则每个被评价样本就对应高维空间的一个点,进而利用支持向量机(SVM)的非线性处理能力在高维空间中对样本点分类,结果
5、用来评价样本的城乡发展一体化水平,既实现了多个样本之间的横向比较,又减少了构建指标体系过程中引入的主观误差。本文的主要内容包括:根据城乡发展一体化的内涵与影响因素,运用频率分析法与专家咨询法选取反映城乡发展一体化的指标,进而构建基于多属性SVM的城乡发展一体化水平评价模型,寻找指标到评价结果间的映射关系;通过机器学习的方法求解模型的核函数以及参数;应用模型实证研究延安地区城乡发展一体化水平存在的阶段性和差异性,进而提出下一步的发展建议。二、城乡发展一体化水平评价研究评述城乡一体化的思想源于马克思、恩格斯,由“城乡融合”演化而来,但表述方式却源于我国学者,体现了我国学者对马克思、恩格斯城乡关系论
6、述的理解和感悟性J。十八大报告中明确了城乡一体化的内涵是城乡发展一体化,即不是城市向乡村靠拢的低水平一体化,而是在发展中缩小城乡差距的高水平一体化。城乡发展一体化内容广泛,很难用一个指标体系或者几个维度的指标全面测度旧J,但学者们还是从不同的角度进行了尝试。1997年,杨荣南设计了包括经济、人口、空间、生活、生态环境5个方面融合度的指标体系,并采用数学平均法计算城乡一体化水平得分H1。从内容上讲,他的研究仅仅做了一些探索,没有检验指标体系的效度;从方法上讲,数学平均法没有考虑指标间的多重共线问题。不过他的研究提供了两个重要的研究方向:第一,测度内容。测度内容就是指标体系的维度设计,即一级指标。
7、文献中的维度设计有三种方式:第一种按城乡发展一体化的内涵划分,如经济、生活、基础设施等。大部分学者都是以这种方式设计一级指标m 9l;第二种按政府行为划分,可以分为投人性指标和产出性指标1 011 J。第三种按指标与结果的关系划分,可以分为显示性指标、传导性指标和分析性指标2131。第二,测度方法。现有研究都是基于指标体系测度城乡发展一体化水平,即首先形成指标体系,然后确定指标权重,采用加权平均的方法计算城乡发展一体化水平。指标体系的形成有理论导向和数据导向两种方式,前者基于理论推理指标体系的二级、三级指标,具有很强的理论逻辑;后者按照承载信息的侧重有选择地进入指标体系,数理逻辑较强。权重的确
8、定分为三类。第一类是主观赋值法,如德尔菲法,采用主观评分给各项指标打分,充分利用专家们的经验做出综合评判,但是存在过度估计和估计不足的问题4。1 6I。第二类是客观赋值法,根据指标对总体的贡献来确定权重,如主成分分析、因子分析5,10,17,18。第三类是主客观结合赋值法,如层次分析法、模糊综合评判等心,1922 J。现有研究存在三点共性:第一,内容上采用不同划分方法的目的都是为了确定合理的指标体系,这是科学评价的基础;第二,方法上客观赋值法和主客观结合赋值法应用广泛,操作性较强;第三,结果上以指数得分作为评价结果并作为分析差异性和阶段性的依据,区域间的发展差异可能因此被模糊甚至被消除。综上所
9、述,尽管学者们从不同角度构建指标体系,测度了全国和部分地市的城乡发展一体化水平,然而,始终缺乏一个能被广泛认可的指标体系和测度方法。三、基于SVM的城乡发展一体化水平测度模型的提出本研究将评价指标视为城乡发展一体化水平的属性,将城乡发展一体化水平评价转化为多属性评价问题,模型的效用偏好值即代表了城乡发展一体化水平。应用多属性决策的支持向量机方法提出基于SVM的城乡发展一体化测度模型,决策问题可以表示为:DR:z(“),x2(u),z。(u)万方数据134 西北大学学报(哲学社会科学版)2016年第2期其中DR为决策原则,X=戈,戈:,戈。是研究对象构成的集合,Y=Y。,Y:,Y。是属性集,oi
10、是研究对象石i在yi下的屙|生值(i=1,2,n;J=1,2,m),矩阵A=(ai)。表示研究对象x关于属性y的决策矩阵,为避免属性之间量纲不同对评价结果造成的影响,对矩阵A进行无量纲化和正向化处理,得到规范化矩阵R=(rii)。所提出的城乡发展一体化水平测度模型利用SVM强大的非线性处理能力和良好的学习能力描述决策者偏好,通过对决策样本的学习,建立基于SVM的决策模型,也就是要设计一个高维空间映射关系ui=F(o),描述属性向量(rn,k,ri。)与效用值Mi之间的非线性映射关系,反映决策者偏好。将城乡发展一体化属性值-=(rd,k,ri。)作为SVM的输入向量,以决策方案的效用值Zi作为S
11、VM回归目标值,求解获得回归函数:M=(d。一a+)K(x,算)+6。其中理。和Ot。+为Lagrange乘子,k=lz=(r嘞,r。),(k=1,2,s)为支持向量,s为支持向量的数目,K(x,石)是核函数。基于SVM的城乡发展一体化水平的测度分为学习阶段和执行阶段。学习阶段主要用于获取决策者的偏好行为并建立决策模型,大致可将其分为构造学习样本、模型训练和测试。学习样本主要通过效用函数拟合将属性值效用化以便获取决策者偏好信息,通过训练和测试学习样本选取SVM的核函数以及参数对比寻优建立最优决策模型,记忆决策者偏好信息。执行阶段则是将效用化的属性真实值输入已建立的决策模型获得映射回归值,即城乡
12、发展一体化水平评价值。四、延安城乡发展体化的实证研究(一)城乡发展一体化的属性已有研究主要采用理论分析法、频率分析法和专家咨询法等选取评价指标,本文在查阅已有研究的基础上,选取尽可能多的指标作为测度城乡发展一体化水平的属性,共19个,如表1所示。表1 城乡发展一体化水平评价属性(二)数据来源和处理数据来源有两个:第一,统计资料,包括陕西省统计年鉴2013陕西省区域统计年鉴2013延安万方数据王渊等:基于SVM的城乡发展一体化水平评价统计年鉴2013)(陕西省县域经济监测排行榜2013);第二,延安地区实地调查的数据。由表1可以看出各属性之间具有不同的量纲和属性方向,为避免对评价结果产生影响,需
13、要对属性进行趋同化和无量纲化处理。采用标准化方法处理数据得到规范化矩阵R=(o)。,m。(三)构造学习样本基于函数拟合理论计算决策方案的SVM回归目标值是构造学习样本的关键,拟合效用函数的选取关系到评价结果的准确性,经过趋同化处理的数据适用于效益型的效用函数。经过比较,选择S型曲线1+expa(xb)“对各属性函数进行拟合,令各属性正负理想点的效用值分别为“i=(ri。)=095和“】_=(r,)=005,计算得到相应曲线的系数,得到各属性与效用函数问的非线性映射关系tt;=F(ri)。为使学习样本具有权威性,并能反映决策对象的整体特征,本文选用随机点样本、方案点样本和理想点样本构造学习样本。
14、效用值从005到095,以步长为001,通过u。=F(rif)的反函数rP,=厂(ui)计算共可获得随机点样本89个;根据各研究对象属性值r。,计算可得到效用集u,对效用集u计算反函数Pi=厂(i)可得到方案点样本228个;理想点样本2个。去除重复样本,共得到有效学习样本228个。(四)训练与测试随机抽取18个样本作为测试样本,其余210个作为训练样本。采用MATL气B下的libsvm工具箱,通过网格搜索法得到最优核函数为径向基核函数,经过10折交叉检验得到最优参数:c=1,gamma=06,epsion=1010。此模型对测试样本进行预测得到测试样本均方差MSE=00009,平方相关系数SC
15、C=0988,说明模型具有很好的预测能力。f五)执行阶段利用训练好的SVM回归模型将规范化矩阵R作为SVM的输入,得到计算结果如表2所示。表2延安地区各县城乡发展一体化水平排名由上表可知,延安地区城乡发展一体化水平中,黄陵和吴起的指数最高,分别是109、0919;志丹次之,城乡发展一体化指数为0744;发展水平最差的是黄龙和延长,水平指数分别是一0196、一0178;居中的各县城乡发展一体化水平差距不大。为进一步考察各县城乡发展一体化阶段性,对各县水平指数进行KMeans聚类分析。通过聚类分析,将延安12县的城乡发展一体化水平划分为四个阶段,高度一体化阶段以10045为聚类中心,包括黄陵、吴起
16、;中度一体化阶段以07438为聚类中心,仅包括志丹一县;初步一体化阶段以03029为聚类中心,包括洛川和安塞两县;其余的七个县处于城乡互动起步阶段。可见延安县域城乡发展一体化水平差异很大,两极分化现象比较严重。五、结论及政策建议本研究将城乡发展一体化水平测度转化为多属性评价问题,映射样本到高维空间中,利用SVM在高维空间中进行分类并计算效用值,研究得到了两点结论:第一,提出了基于SVM的城乡发展一体化水平评价模型及测度方法;第二,利用提出的模型实证研究了延安地区12个县的城乡发展一体化水平,一方面检验了模型的有效性,另一方面定量描述了延安地区12个县城乡发展一体化的阶段性和差异性。万方数据西北
17、大学学报(哲学社会科学版)2016年第2期实证研究的结果表明,延安城乡发展一体化水平不均衡,存在两极分化现象。12个县的城乡发展一体化水平可以划分为四个阶段,对每个阶段适用的差异化发展建议如下:第一,高度一体化阶段要坚持工业化带动城乡发展一体化:通过引入高水平的项目改善产业结构,促进转型升级,同时加快发展社会公共服务。黄陵和吴起两县处于高度一体化阶段,依托资源优势发展工业带动了本地的城乡发展一体化,城乡差距在经济社会快速发展中不断缩小。例如,城乡人均GDP和城乡人均收入都有了较大提高,而且差距越来越小。聚类结果表明,这两个县城乡发展一体化水平相近,结构相似,表现为工业化水平较高,经济总量较大,
18、城乡差距小。但是,社会公共服务方面有所欠缺。黄陵县的农村社会保障覆盖率和安全饮用水普及率处于中等偏下水平,吴起县的公路交通网密度排名倒数第二,这是两县在城乡发展一体化进程中的短板,也成为制约两县城乡发展一体化的主要因素。第二,中度一体化阶段要加快发展工业,增加信息化投入,促进两化融合,利用信息化提升产业优势,缩小城乡信息鸿沟,带动城乡发展一体化。志丹的资源优势和区位优势使得其工业和现代农业都具有较高水平,工业和农业的平衡发展带动了城乡发展一体化,但是,该县的问题是信息化水平较低,而且已经成为制约发展的主要障碍,也是其跨入高度发展一体化的主要瓶颈。在延安地区12个县中,志丹的信息化水平排名11位
19、,较低的信息化水平制约了产业结构升级,影响了产业链无缝衔接,同时也是加大城乡信息鸿沟的主要原因。政府通过信息化基础设施的投入,改善信息化环境,同时引导企业增加信息化投人,为两化融合奠定基础,是促进城乡发展一体化的重要抓手。第三,初步发展一体化阶段要改变现代农业产业化水平较低,产业结构单一的状况。聚类的结果显示,农业规模较大,产业结构单一是洛川和安塞的特点,优越的农业生产条件和明显的区位优势是两县的优势所在,不足之处在于工业发展的产业结构单一,现代农业产业化推进较慢。洛川的特点是农业比重较大,表现是非农产业从业人员比重、乡村人员非农就业比都是12个县中最低的,而安塞尽管农业生产条件较好,但是农业
20、机械化水平在12县中排名倒数第一。因此,两县优越的农业产生条件是一把“双刃剑”,利用比较优势发展农业是两个县的合理选择,特色农业取得了较好的经济效益,但是却削弱了推进农业产业化的动力。安塞和洛川依托资源优势和区位优势发展工业也取得了一定成果,但是产业结构比较单一,造成了两极分化。工业农业分别发展的结果虽然拉动了城乡发展,但是城乡差距很难缩小,反而有越来越大之势。因此,这两个县的发展应该走工农业齐头并进之路,在传统农业基础上大力推进现代农业产业化,通过集约化的农业生产促进农业人口收入不断增加,逐步缩小和城镇人口的差距。同时,利用其区位优势,通过引进高水平项目改善增量,实现产业结构转型升级。第四,
21、对处于城乡互动起步阶段的七个县而言,需要在对比差距的基础上,找到制约城乡发展一体化的短板,以此为突破口,实行差异化的发展策略,提升城乡发展一体化水平。七个县中,子长最为特殊,是典型的低水平一体化,经济、社会等各个方面指标都低于12个县的平均水平,需要全面赶超。其他各县均有某些方面远低于平均水平,包括:甘泉城镇化水平和交通网密度较低;宜川教育投入和非农产业增加值较低;延川人均固定资产投资和农业机械化水平低于平均水平;富县乡村从业人员非农占比和非农产业人员比成为发展短板;延长信息化水平较低;黄龙非农产业增加值和安全饮用水不达中等水平。各个县应该以改善这些方面的状况为工作重点,推进城乡发展一体化,尽
22、快进入初步城乡发展一体化阶段。参考文献:1健全城乡发展一体化体制机制让广大农民共享改革发展成果N人民日报,2015-05-02(1)2 3王渊,白永秀,王宇城乡经济社会一体化内涵与外延的再认识J福建论坛,2013,(1)3周江燕,白永秀中国城乡发展一体化水平的时序变化与地区差异分析J中国工业经济,2014,(2)万方数据王渊等:基于SVM的城乡发展一体化水平评价 1374杨荣南城乡一体化及其评价指标体系初探J城市研究,1997,(2)5李志杰我国城乡一体化评价体系设计及实证分析基于时间序列数据和截面数据的综合考察J经济与管理研究,2009,(2)6刘伟,张士运北京城乡经济社会一体化进程评价定量
23、化研究J生态经济,2009,(8)7刘伟,张士运,孙久文我国四个直辖市城乡一体化进程比较与评价J北京社会科学,2010,(1)8李运祥,陈国生城乡一体化评估体系的主要指标以湖南省为例J求索,2010,(2)9完世伟城乡一体化评价指标体系的构建及应用以河南省为例J经济经纬,2008,(1)10苏春江河南省城乡一体化评价指标体系研究J农业经济问题,2009,(3)11罗雅丽,张常新城乡一体化发展评价指标体系构建与阶段划分以大西安为例J江西农业学报;2007,(7)12付兆刚统筹城乡的评价指标体系与实证分析J哈尔滨商业大学学报(社会科版),2009,(1)13李勤,张元红,张军,等城乡统筹发展评价体
24、系:研究综述和构想J中国农村观察,2009,(5)14中国社会科学院农村发展研究所城乡统筹研究课题组统筹城乡发展评价及其政策建议J重庆社会科学,2009,(11)15邓玲,王彬彬统筹城乡发展评价指标体系研究基于成都市温江区的实证应用J西南民族大学学报:人文社科版,2008,(4)16王力,汪海霞新疆石河子垦区城乡一体化进程评价及分析J石河子大学学报:哲学社会科学版,2006,(6)17杨振宁城乡统筹发展与城镇化关系的实证研究基于安徽的数据J农业经济问题,2008,(3)。18王阳,岳正华城乡统筹协调发展的实证研究:2000_2008以四川省为例J农村经济,2010,(3)19张庆文,叶丹,韩洁
25、,等城乡一体化综合评价与聚类分析以北京市为例J农村经济,2010,(3)20王洪跃,张雄湖北省城乡一体化评价研究J现代农业科技,2010,(5)21朱金鹤,崔登峰新疆城乡一体化进程的影响因素与评价研究J干旱区资源与环境,2012,(2)22任平,周介铭,张果成都市区域城乡一体化进程评价研究J四川师范大学学报:自然科学版,2006,(6)责任编辑卫玲Integration Evaluation of RuralUrban Development based onSupport Vector Machine Method:Empirical Study of YananWANG Yuanl一,HA
26、O Xiang-jul,CUI Hong(1Management School,Xi 7an Polytechnic University,Xian 710048,China;2School ofEconomic&Management,NorthwestUnwemhy,Xian 710069,China;3Students7 Affairs Division,XianTechnological Un拓emity,Xi 7an 710048,China)Abstract:An evaluation model was proposed to measure ruralurban integrat
27、ion based on support vector ma-chine(SVM)and then empirical study with data of Yan7 anThereare two contributions of this researchFirstly,empirical study indicated the evaluation model is effective and is less subjective than evaluating by index systemSecondlythe evaluation results can support author
28、itiesdecisionWe take the index as spatialdimeBSions and the samples can be seen as set of points in high dimensional spaceThe optimal kernel function and parameters are determined by the grid search method and Kcross validation training samples,andthen the 12 countries of Yah 7an were evaluated by t
29、he SVM evaluation modelResults indicated that ruralurban integration of Yanan has serious polarization:Huangling and Wuqi are in the high integration phase;Zhidan is in the moderate integration phase;Luochuan and Ansai are in the preliminary integration phase;therest seven counties are in initial stage of ruralurban interactionKey words:integation of rural and urban areas;support vector machine;clustering analysis;developmentphase万方数据