《分析研判篇_第十一章 网络舆情研判与预测.doc》由会员分享,可在线阅读,更多相关《分析研判篇_第十一章 网络舆情研判与预测.doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、分析研判篇第十一章 网络舆情研判与预测网络舆情研判与预测在网络舆情信息工作中占据重要位置,发挥着重要作用。网络舆情信息分析研判必须要利用科学的理论和方法,在搜集整理大量的舆情信息基础之上,通过分析材料叙述的表面现象,挖掘网络舆情背后错综复杂的本质,进而了解网络舆情的运动规律。只有准确地研判与预测,网络舆情工作才能充分发挥其作用。第一节 网络舆情研判网络舆情的发展往往受一定的内因推动,承载着特定的诉求,通过各种媒介载体在互联网中传播、扩散,并持续发酵。网络舆情分析研判就是对网络上苗头性、倾向性的网络舆情,尤其是即将或已经形成网络热点的舆情,去粗取精、分类整理和研究分析,探究其传播路径、趋势和影响
2、力,并将研判评估结果形成文字上报,向相关部门提供舆情引导策略。一、 网络舆情研判的重要意义网络舆情与现实社会密不可分,它反映了社会群体对现实社会中存在的某些特定事件和问题的态度和心理,是观察民生民意的一扇窗户。网络舆情积聚发展到一定程度,就具有鼓励、引导和宣传的作用,集体性事件可能由此发生。所以,通过网络舆情研判来预警具有重要意义,具体表现在以下几个方面:第一,网络舆情研判有助于占领网络舆论制高点。互联网技术的发展给舆论环境带来翻天覆地的变化,以报纸、广播、电视为代表的主流媒体舆论场受到信息滞后、传播模式单一、缺乏与受众之间互动交流等制约,影响力逐渐减弱。而以互联网新技术为基础的网站、微博、(
3、微)视频、微信、客户端等形成了舆论新战场,以互动交流便捷、自由平等对话、传播影响力大等优势,逐渐掌握了民间舆论场的话语权。目前,我国正处于社会经济的转型期,经济发展面临巨大的压力。社会中还存在保障体系不完善、贫富差距较大等问题,这些因素随时都有可能点燃新兴舆论场中的“腥风血雨”。同时,网络中存在的“网络推手”、“网络水军”、“网络暴力”现象,加大了舆论引导和社会管理的难度。如何提高舆论引导力,已成为加强党的执政能力建设迫切需要引起高度重视的现实问题。只有通过网络舆情研判,在网络热点形成之前,及时占领舆论制高点,才能在新兴舆论场中化被动为主动。第二,通过网络舆情研判能及时发现和防范不稳定事件。现
4、实社会中的热点事件容易在网络舆情中“蔚然成风”,反过来,随着网络舆情的膨胀、发酵,社会的关注度也会随之越来越高。其中,网络舆情中的一些负面因素一旦被利用,更容易使整个网络舆情中呈现级数扩散和宣传的态势。此时,就有网络舆情演变为社会集体行动的可能,对公共安全造成负面影响。提早进行网络舆情研判,并在此基础上建立舆情预警机制,就有可能将这些负面影响消除在萌芽状突。第三,网络舆情研判能够发现隐含的社会危机。互联网已经成为民众对一些社会现象、热点事件自由表达其态度和观点的阵地。受社会矛盾和利益冲突的影响,互联网舆情中参与者的言论往往具有一定倾向性。它们分布零散,不容易在短期积聚演变成网络热点,但其中包含
5、了不容忽视的负面因素或对公众产生倾向性引导的意见。如“寒门难出贵子”,这种舆情显示了对城乡教育资源的严重分化、贫富差距严重等问题的不满情绪。它在网络中的广泛传播引起了相同背景网民的“共情”,极易打击广大“寒门学子”的信心,久而久之会演化为更严重的社会危机。第四,网络舆情研判能够提高政府部门的敏感度。由于政府部门的工作流程和相关机制不健全,往往不能及时、准确掌握公共安全苗头性事件的发生,对后期的决策和处置工作带来一定的阻力。在网络科技发达的社会中,网络舆情的热度反映了网民对相关事件的关注程度,网民关注度越高,传播越广泛,就越有可能成为需要公共部门引起注意的公共事件。相关政府部门若是通过网络舆情研
6、判及早发现这些信息,就能化被动为主动,抓住事件处置和应对的先机。第五,网络舆论研判有助于政府体察民意,从而提高公信力。网络是集聚民声民意最直接的场所,特别是各级政府推出“网络问政”之后,许多网民都愿意参与到各种问题和事件的讨论中来。这就为政府收集社情民意,了解民心动向提供了重要的平台,也为党和政府密切联系群众搭建了桥梁。有效地掌握网络舆情,并对其中的各种利益矛盾进行预先研判,在发生矛盾冲突之前提出相应的对策,有利于维护社会安定团结,对提高政府公信力意义重大。互联网在人们的工作生活中扮演着越来越重要的角色,甚至已经成为必不可少的一部分。网络中的舆情已成为现实社会舆情的映射,重视互联网舆情的研判对
7、现实公共安全来说更加必要。近些年来,一些地方政府因舆情研判能力不足引起社会恶劣影响的案例不在少数。如2011年5月26日,江西省抚州市检察院内停车场、临川区行政中心西楼一楼、临川区药监局大楼旁相继发生爆炸。犯罪嫌疑人钱明奇在爆炸中死亡。事件起因为时任临川区区长习东森在2002年5月修建京福高速公路时擅自降低补偿标准,克扣征地拆迁款约计1000余万元,导致钱明奇损失近200万。钱明奇为此起诉到当地法院,但法院终审驳回钱的诉讼请求。爆炸案发生之后,抚州征地拆迁问题和钱明奇的新浪微博都受到人们的广泛关注。舆论对抚州政府一片斥责,并不断质问抚州的拆迁工作。在舆情的发酵期,抚州市政府并没有全力配合媒体的
8、报道,网络上关于抚州市的负面舆情不断上升。这就侧面反映出江西抚州市政府处理舆情危机的意识淡薄。二、 网络舆情研判分析网络舆情事件的解决需要不断回应网络舆情,并与网民搭建互动沟通桥梁,为此,建立科学的网络舆情分析研判机制对政府公共安全管理,特别是公共安全舆情方面有很大的作用。以下就通过对网络舆情定性和定量两方面来探讨舆情研判方面的机制建设。(一) 网络舆情研判定性分析1网络舆情价值研判。价值判断是网络舆情研判的基础,受到舆情信息发生、发展的时间和内容两方面因素的影响。首先是舆情价值的时间要素。在分析网络舆情信息的时间价值时,要从时间的时效性和连续性来着手。时效性是网络舆情发生,或舆情走势发生变化
9、的第一时间。连续性是指网络舆情随着时间的推移而呈现不同的舆情态势。对于决策者来说,第一时间了解公共事务的情况,并能及时获取舆情更新的发展变化,更有助于把握舆情动向的主动性。相反,再有价值的信息,如果错过其发生的关键时机就丧失了意义。特别是一些重大突发舆情,及时准确了解,就为相关部门决策争取了时间和主动权。其次是舆情价值的内容要素,主要包含内容准确性和完整性。准确性要求必须客观、真实说明网络舆情的具体情况。因为互联网中存在大量的虚假、冗余信息,只有通过去伪存真、去粗取精才能确保信息的准确性。完整性就是要全面获取有用信息,避免片面信息误导决策者。2网络舆情来源和传播方式判断。网络舆情是网民意见、态
10、度与情绪的综合体现,它可以通过不同途径表现出来,也可以通过各种途径传播。目前,民众在互联网上对各类问题事件发声的主要通道有:网站新闻跟帖、博客、论坛、微博、微信等。这些舆情信息包含了网民更加真实的情绪和诉求。因此,政府部门为了全方位把握网络舆情发展情况,就要在上述通道中,收集网民的倾向性、敏感性和苗头性的意见,判断网络舆情发展走势,为后期政府回应、引导舆论和决策做准备。3网络舆情性质及危害程度研判。一般来说,涉及征地拆迁、官员腐败、环境保护和社会保障等事件,包含官民关系紧张、贫富差距扩大、权益纠纷增多等社会矛盾因素,一旦出现容易迅速成为网络舆情热点事件。如果处理不当还会出现集会抗议、维权上访等
11、不稳定因素。因此,在研判这类事件时,就要及时准确把握舆情信息的性质,捕捉舆情动态中的苗头信息。同时,舆情研判还要评估该事件演变成为网络群体性事件的可能性和危害程度,包括相关负面的社会影响、经济损失、政府形象等各种有形无形的危害。4网络舆情的社会情景研判。上述网络舆情研判都是从事件发生、发展的时间维度出发,网络传播具有超越时空的特性,这一方面的研判就从网络舆情的广度和深度上着手,分析舆情信息在多维度的历史环境、地域空间中的影响和地位,注意网络舆情是否发生在敏感时间和敏感地点。比如,2013年3月27日到4月3日,仅仅八天时间之内,河南中牟、湖北巴东、四川西昌相继发生三起因征地纠纷农民被碾死事件,
12、且死状惨烈,引起网民强烈不满。网络中充斥着责骂、悲愤、无奈的情绪。腾讯网发起题为“你认为还会发生农民被碾死事件吗”的调查显示,99%的人认为还会发生,只有1%的人认为不会。就社会情景分析而言,首先,这三起事件单独的发生地都不具备敏感性,但是在网络舆情快速传播的今天,相关事件极易被舆论关联评论,从而引起舆论高峰;其次,每年的4月5日左右都是清明节,而第三起事件发生日为4月3日,更能激发人们哀悼悲愤的心情,积聚网民的关注度;再次,舆情评论呈现主题扩散性。网民的相关评论从维护农民合法权益和生命尊严,不断转移到官商勾结、贫富差距过大等社会现象的不满情绪中。(二)网络舆情研判定量分析1建立网络舆情热点事
13、件案例库、数据库。通过建立数据库和案例库,收集近年来发生的各类热点事件,按照事件的性质或主体责任将其分门别类,总结各种舆情案例的发酵规律、网民情绪和政府应对措施及效果,以便将来发生类似事件时进行参考。如:2011年6月29日,四川什邡市政府宣布钼铜项目开工建设,这一决定引起当地市民的不满,一度引起学生和市民接连上访并示威,最终导致了警民冲突的发生。冲突发生后,什邡官方就钼铜项目三次表态,最终决定今后在什邡不再建设钼铜项目。从舆情应对的角度看,什邡官方事发后积极应对,顺应了当地民意,从而使事态得以控制。而2014年3月30日,广东省茂名市爆发反对当地拟建PX项目的千人聚集事件,造成多人受伤,市区
14、部分设施被毁。事发后,网络上出现大量不实传言,一度引发大规模的恐慌性舆论围观,各类谣传泛滥多日之后,才被主流媒体证伪。当地政府控制不实传言的能力凸显官民信息沟通仍待加强。从这两个事件来看,发生官民冲突时,地方政府要保持积极主动的态度回应群众的诉求,网络舆论就会出现大大转向。2跟踪高回帖率的事件,统计网民倾向性意见。回帖率就是网民针对热点事件,对相关网站媒体报道、博客、论坛、微博、微信中的关注度,包括媒体报道浏览量、参与评论人数、实际评论人数、微博转发及评论数等。一个热点事件如果在网络中一出现就引起广泛关注,则相关内容的报道、微博的浏览量、评论量和转载量会以小时、以天为单位积聚上升。这些内容是网
15、民针对该事件的网络舆情真实体现,也量化反映了网络舆情的网民关注程度。据中国传媒大学网络舆情研究所2009年发布的年度报告指出,如果网民参与官民矛盾类事件评论的人数超过8%,相关部门就应关注事件的进展。同时,舆情研判还要对媒体和网民的倾向言论、观点进行统计。包括截至某一时间节点,有多少网民关注、网民中具有代表性意见的占比等。如果将这些舆情信息统计并分析,就能总结出网民的主要意见和看法,为决策者了解当下舆情走势提供重要的线索。第二节 网络舆情预测从网络舆情产生之初,它的生命周期就按照网络舆情传播规律,经历着发生期、发酵期、高潮期和回落期的周期演变。网络舆情预测就是采用各种信息分析手段,预判网络舆情
16、所处阶段,民众关注焦点和趋势的过程。舆情预测有助于发现舆情变化中的潜在危机,辅助政府部门做出相应决策。网络舆情具有传播范围广、速度快和影响力大的特点。一旦发生具有强影响力的公共事件,特别是涉及群体利益、官民矛盾等事件,媒体和网民就会通过各种渠道发表自己的意见和看法。此外,网络传播的虚拟性、匿名性和超越时空等特点让网络成为情绪化、偏激言论,甚至是谣言的灰色地带。因此,网络舆情作为公共情绪,具有感情和思想,有着很大的非稳定性和易变性,随时会左右网络事件的走向。法国社会学家古斯塔夫庞勒认为,社会集体行动爆发促使整个群体形成一个集体心理,反过来,集体心理会影响着群体的每个个体忽略自身的因素,共同为集体
17、目标努力。从这种意义上来说,群体无意识支配了群体行动,从而引发集体行动的爆发。但是从近几年发生的网络危机来看,网络舆情转变为集体行动的可能性较低,主要是由于现实社会形成的热点一旦将阵地转移到了网络,就演变成了网络空间事件。它较之于现实群体事件有着本质的不同,因为互联网中仅仅依赖于文字评论的情绪激发着网络舆论的高涨,事件中的当事者可以在舆论演化的过程中采取种种措施,从而舒缓舆情,降低其衍生为集体行动的可能。然而,这并不是一个放之四海而皆准的原理,不能排除网络舆情转变为集体行动的可能。比如,2014年8月,在一个社交网络上发起的冰桶挑战活动,迅速成为网络集体行动,并蔓延到世界范围。我国的各界人士也
18、纷纷响应。再比如,“随手拍解救公车”、“随手拍解救乞讨儿童”等,已成为此类公共事件的最佳推手。当前,一些地方政府在舆情管理机制上还存在较大的欠缺,有着重危机处理、轻危机预警,重危机过程管理、轻危机信息分析的通病。这导致地方政府在网络舆情的管理中常处于被动地位,更易被网络舆论的狂潮牵着鼻子走,无从发挥引导舆论走向的作用。如果地方政府能及时预测网络舆情发展趋势,感知危机事件的征兆,则有利于发挥舆情处置的主动性,在网络舆论中“力挽狂澜”。对即将或已经形成网络热点的舆情有效预测,可以从舆情事件参与主体、涉及相关内容和定量分析等方面来预测。一、 根据舆情参与主体进行预测一是通过舆情传播者来预测舆情影响力
19、。网络舆情传播者的身份、影响力对舆情的发展具有重要的意义。比如,微博在网络舆论中发挥着非常重要的作用,据统计已有30余个国家的驻华大使馆及领事馆借微博账号,促进与我国友好邦交关系。但是,部分西方国家驻华大使馆及各总领事馆的微博账号频频发布一些具有较强刺激性的内容,例如发布各地PM2.5监测数据,因其与我国官方数据相去甚远,引起网民热议和追捧,加深了网民对国内环保问题的不满。而且,此类使领馆微博还与一些意见领袖频繁互动,不断维护着话题的热度。二是通过网民活动轨迹预测舆情发展阶段。互联网自媒体技术的不断发展为网民自由发表言论开辟了阵地,他们在这些通道中针对某一网络热点的表现就可以看出网络舆情的发展
20、态势。一般来说,网络舆情随着网民参与度的增加而高涨,反之亦然。政府部门应该通过网民关注态势预测网络舆情趋势。三是通过媒体报道和意见领袖预测舆情发展的拐点。网络舆情的形成和发展在很大程度上受到媒体、专家和网络意见领袖的制约,他们从各自的角度出发,共同影响着整个舆论走向。其中,充当着二级传播并拥有大量粉丝人群的网络意见领袖,发挥着不可忽视的引导作用。网络热点发展过程中,他们的表现有可能决定着舆论的拐点。因此,在特定的网络舆情事件中,要重点关注这些人群的反应。二、 根据舆情事件的内容预测一是敏感事件。涉及敏感政治事件的网络舆情应该成为分析预测的重点对象。敏感事件具有明确的政治导向和针对性,它对国家现
21、行的政治体制、社会稳定能产生严重的破坏作用。因此,网络舆情中一旦涉及这一因素,就要密切警惕其发挥的渲染、鼓动因素和网络舆情相互作用造成的严重危机。二是网络热点话题。网络热点话题是公众在特定时间段最关注的话题。从近几年来各大媒体频频发布的舆情年度报告来看,每年舆论关注的热点都和政府政策导向、经济发展中的民生问题等与人民群众息息相关的话题有关,包括了国际关系、医疗教育、楼市股市、环保、食品药品安全等多个方面。这些热点事件舆情不会轻易发展为集体公共行动,但仍具有影响公共安全的潜力。比如,楼市调控一直是人们关注的热点话题,2011年10月,伴着资金链紧张、政策松动无望、保障房的冲击、商品房存量的激增,
22、全国范围的楼市出现一波降价潮。房子未见,房价缩水,不少地区的老业主在各地“团团包围”讨要说法,有的地区甚至出现了上百名老业主“冲击”售楼处的情况。三是各种社会思潮。社会思潮是指一定时期内反映一定阶级阶层的利益和要求,以某种理论学说为主导和依据,得到广泛传播并对社会生活产生广泛而深远影响和作用的思想倾向及潮流。例如,当代中国社会思潮领域存在自由主义、新左派,民族主义思潮等。目前,我国正处于改革发展的关键期,各种复杂的思潮互相交织、影响,加之互联网的特殊属性,在特定时刻会对社会公共安全有重要的影响。因此,政府部门应对特定网络舆情中可能涉及的思潮提前预测研判。三、 建立预警指标体系量化网络危机定量预
23、警是在收集相关敏感信息的基础上,通过科学的技术方法和分析,将网络舆情危机中的各种征兆量化显示,从而确定舆情的危机等级。其中,最关键的是建立一套舆情预警指标体系,可以分为舆情真实性、敏感度、关联性、网民倾向性和参与度等。国家突发公共事件总体应急预案将危机划分为特别重大、重大、较大和一般四个等级,不同等级的危机要采取相应等级的人力和物力应对。参照这种划分模式,舆情危机程度可以分为:安全、轻度、中度、重度和危险五个等级。将网络舆情各项指标转换为具体数值之后,与之前默认的临界值进行对比,判断舆情的危险级别和发生突发危机的可能性,并向相关部门发布与等级对应的预警报告和处置建议。四、 撰写网络舆情预警研判
24、报告网络舆情预警研判报告是针对某一热点事件,在一定的时间内,通过定性和定量的方法分析网站、论坛、微博等多通道传播的媒体、专家、意见领袖和网民的意见,判断网络舆情的发展趋势,预测发生社会集体事件的可能性和时间节点,同时向相关部门提出相关处置应对的建议。网络舆情研判报告的质量不仅决定着主管部门对舆情事件的关注程度,还影响着相关部门的决策效果。因此,优秀的舆情预警研判报告,从内容上来看,要客观准确、重点突出;从语言上来看,要精巧连贯,生动活泼;从形式上来看,要数据鲜明准确,形象直观。第三节 网络舆情指标体系简介网络舆情指标体系是指通过一系列相互联系、相互补充的指标,来反映网络舆情的整体状况。完整的指
25、标体系可以指导网络舆情监控工作,并可根据指标来明确网络舆情信息采集的来源、范围和方向。指标体系涉及整个网络舆情生命周期,有助于全面了解网络舆情的发展状况,挖掘有价值的信息,并及时通过预警指标判断网络舆情潜在问题。指标体系的设立,使得网络舆情信息判断更加客观,定性定量相结合可以实现综合分析,直观展现复杂问题,增强对网络舆情形势的把握度。构建网络舆情指标体系,需要遵循以下原则:一是目标性:要体现网络信息本质,反映计算机处理指标的要求,符合网络舆情形成模式和变动规律,便于网络舆情工作者对网络舆情进行引导和管理。二是科学性:指标项目要有科学依据,符合信息学、情报学、传播学、社会学等专业理论原则以及网络
26、舆情工作流程实际,尽可能减少人为主观因素。三是系统性:网络舆情汇集和分析工作是一个十分复杂的过程,涉及许多方面,构建指标体系一定要全面、完整,各项指标彼此有机地形成一个整体,从而能够多层次、多角度将网络舆情的特点表现出来。四是实用性:构建指标体系是为了实际操作应用。如果不能或不便操作,那么建立起来的指标体系也毫无意义,所以一定要考虑在可行的条件下取得数据资料,使采集和处理规范有可操作性。建立网络舆情指标体系的思路是:先从新闻、论坛、博客、微博客、社交类网站、搜索引擎日志和元搜索这些数据源中提取出网络舆情要素,然后建立网络舆情指标体系,最后设计网络舆情指数的计算方法。进而,网络舆情指标体系架构就
27、包括了:总体态势指标、业务指标、基础指标、网络舆情要素。如下图所示:图11-1 网络舆情指标体系架构一、 受众指标(一) 受众维度的粒度受众维度的粒度层次设置为:ID、用户:一个用户可能有多个ID、用户群体。(二) 和受众相关的指标ID、用户、用户群体共用指标:实名度指标、活跃度指标、交际广泛度指标、影响度指标、敏感度指标、上网时间分布度指标、接入方式分布度指标、成为意见领袖的可能性指标、心理特征指标。(注:1. ID、用户的指标含义相似。2用户群体的指标含义一般用群体内用户的同名指标的加权计算。)用户群体独有的指标:地域分布度指标、内部凝聚力指标。ID、用户、用户群体共用指标描述: 实名度指
28、标:使用真实姓名的可能性,为以后网站实名制实施后提供的扩展指标。 活跃度指标:根据发文频率、回帖频率计算。 交际广泛度指标:与其他用户的关系。根据博客、微博客、社交类网站中的跟随人数、被跟随的人数、朋友数计算。 影响力指标:单位时间内、每发一个文、被回帖的频率。 敏感度指标:发布敏感信息的频率。 上网时间分布度指标:根据上网的时间计算分布度。 接入方式分布度指标:接入方式主要有网页、手机、即时通、客户端。 成为意见领袖的可能性指标:根据活跃度指标、交际广泛度指标、影响度指标计算。 心理特征指标:通常对一篇文章持什么意见。根据活跃度指标、发文的观点倾向计算。 不活跃 活跃 从众/中庸 情感强烈
29、反对 支持用户群体独有的指标描述: 地域分布度指标:ID或用户的IP、发布信息的位置、家乡、住地的离散程度。 内部凝聚力指标:描述群体对舆情事件的观点的一致程度。可以理解为群体内部每个人的观点分布,用分布的密度计算。如下图所示。图中每个点代表一个网民的观点。这些观点的态度越相近,则距离越近。态度相近到一定程度的观点能够自然聚成一个团。图中的团越多,越分散,则说明内部凝聚力越弱。图11-2 内部凝聚力指标二、 信息源指标(一) 信息源维度的粒度信息源维度的粒度按照以下层次设置: 新闻 新闻网站 新闻-频道 论坛 论坛网站 论坛-版块 博客 博主 微博客 社交类网站 搜索引擎日志 元搜索(二) 和
30、信息源相关的指标各信息源共用如下指标:活跃度指标、权威度指标、可信度指标、重要度指标、地域扩散度指标、态度倾向度指标。和信息源相关的指标描述: 影响力指标:信息转载关系、发文数、点击数、回复数。 活跃度指标:发文频率。 权威度指标:人工指定,如中央级、地域级等。 可信度指标:人工指定。 重要度指标:人工指定。 地域扩散度指标:地域扩散程度,如有可能,可以利用备案系统。 态度倾向度指标:发文的态度倾向性。三、 主题指标(一) 主题维度的粒度主题维度的粒度层次如下图所示。图11-3 主题维度粒度层次(二) 和主题相关的指标文章、主题、类别共用如下指标:地域扩散度指标、敏感度指标、流量指标、报道热度
31、指标、点击热度指标、回复热度指标、态度倾向性指标、拐度指标、观点对立度指标。和主题相关的指标描述: 地域扩散度指标:内容涉及的地域扩散程度。 敏感度:根据内容涉及敏感信息的程度、一段时间内成为热点的频率计算。 流量指标:一段时间内Web页面总数。 点击热度指标:一段时间内点击数。 回复热度指标:一段时间内回复数。 态度倾向性指标:态度是正面还是负面还是中立。 拐度指标:一段时间内热度的变化程度,例如可能反映了某管制措施的有效程度。 观点对立度指标:一段时间内,观点的分散程度。可以理解为参与讨论主题的人的观点分布,用分布的密度计算。如下图所示。图中每个点代表一个网民的观点。这些观点的态度越相近,
32、则距离越近。态度相近到一定程度的观点能够自然聚成一个团。图中的团越多,越分散,则说明观点对立度越大。图11-4 观点对立度指标四、 业务指标业务指标包括:受众心理特征指标、受众成为意见领袖的可能性指标、网民内部凝聚力指标、网民的地域分布度指标、主题相关信息源的地域扩散度指标、主题相关信息源的权威度指标、主题相关信息源的可信度指标、主题的传播扩散度指标、主题的流量指标、主题危机预警指标、主题热度指标、主题态度倾向指标、主题焦度指标、主题重要度指标。注:(1)受众= ID、用户、用户群体 (2)主题=文章、主题、类别业务指标的具体描述: 受众心理特征指标:同基础指标。 受众成为意见领袖的可能性指标
33、:同基础指标。 网民内部凝聚力指标:同基础指标用户群体内部凝聚力指标。 网民的地域分布度指标:同基础指标用户群体地域分布度指标。 信息源影响力指标:信息源的影响力。 主题相关信息源的地域扩散度指标:发布该主题的信息媒介的地域扩散程度。 主题相关信息源的可信度指标:发布该主题的信息媒介的可信度。 主题相关信息源的活跃度指标:发布该主题的信息媒介的活跃度。 主题的传播扩散度指标:根据信息源的总数量、变化量、地域扩散,网民的总数量、变化量、地域扩散,主题流量指标计算。 主题热度指标:根据流量指标、点击热度指标、回复热度指标计算。 主题态度倾向指标:同基础指标。 主题焦度指标:根据一段时间内保持热度的
34、时间、频率计算。五、 总体态势指标总体态势指标主要从主题角度对网络舆情的总体情况加以概括,基于主题的领域或类别划分,对包括流量和热度等基础指标,由细到粗对各主题领域进行分层汇总,最终得到总体的舆情指数以及在各领域间的分布情况。根据业务需要和偏好,对重点关注的类别或主题可以相应调整权重。在相关的指标确定后,即可以采用模糊综合评估模型进行建模计算。综合评判隶属于多元分析,是系统工程的重要环节,应用非常广泛。所谓综合评判就是对受到多种因素制约的事物或现象做出一个总体评判。综合评判的方法有多种,用模糊数学的方法进行综合评判叫做模糊综合评判。该方法突破了精确数学的逻辑和语言,强调了影响事物或现象的各个因
35、素模糊性,较好地解决了定性指标的定量化问题,在处理定性指标较多的评价问题时具有良好的适应性,较为深刻地刻画了其客观属性,是迄今为止比较先进的评判方法,可适用于类型识别系统、专家评价系统、带有评语集的多目标社会评价系统。在实际应用中,对模型的选择要根据具体问题的需要和可能而定。评估对象是网络舆情时,要考虑所有因素对整体对象安全的影响,从而体现出整体特性,因此采用加权平均型算子模型。建立模型的程序通常包含以下六步:1 确定对象集和因素集U; (确定指标体系)2建立评语集V; (确定各指标的值域)3确定权重集W; (确定指标的不同因素的权重)4在U和V之间进行单因素评价,建立模糊隶属度矩阵R=(ri
36、j)n*m;rij表示U中第i个因素ui对于V中第j个等级vj的隶属度;(指标隶属度的确定)5选择合成算子(加权平均型算子),计算模糊关系矩阵的合成值B=WR,对B作归一化;B是一个模糊向量,不是一个点值,这个向量较为准确地刻画了被评价对象本身的模糊情况;6利用评价向量B的分量形成权数,对各个评语等级的得分进行加权平均得到总评分。(得出指数)下面以计算某主题的热度指标为例对具体计算过程进行说明。热度指标根据流量指标、点击热度指标和回复热度指标计算。第一,指标权重的确定方法。权重是以某种数量形式对比、权衡被评价事物总体中诸因素相对重要程度的量值,反映了各因素在评估中对最终的评估目标所起作用的大小
37、程度,体现了单项指标在整个评估指标体系中的重要性,反映了评估者对不同指标价值的认识程度。权重是评估工作要解决的重要问题之一,它不仅是评判模型构造时的重要因素,而且直接体现评估者的价值取向,是最能反映人的主观能动性的方面。一般说来,各个因素在评估中具有的重要程度不同,区分各因素的重要程度,有助于突出主要因素的作用,有助于评判结果的准确。指标权重的确定方法从总体上可以分为主观赋权法和客观赋权法两种。主观赋权法认为权重的本质是各评价指标相对于评价目标的相对重要程度的量化值。由于这种相对重要程度是一种客观存在的模糊概念,对其度量的依据是客观的,但又必须通过主观判断来获得,常用的主观赋权法包括德尔菲(D
38、elphi)法和层次分析法(AHP)。而客观赋权法认为权重的大小取决于各评价指标属性值数列的离散程序的相对大小。也就是说,如果某个指标的各属性值相同无差异,则该指标的权重值应为0;否则,指标属性值的差异(即离散程度)越大,则赋予的权重值也越大,即该指标在综合评价中的作用也越大。客观赋权法的特点是消除了主观赋权法的“主观随意性”,但也有其局限性,比较适用于评价突出各评价对象的差异情况。常用的客观赋权法包括变异系数赋权法和熵值法。德尔菲法又称专家打分法,是指在对各个指标赋权时,邀请一批在本行业内有丰富经验的专家,对各指标应当赋予的权重发表看法。具体操作方法是:先请每位专家为各项指标打分;然后,将若
39、干名专家的意见集中起来,求出每个指标权重的均值和方差。由于各位专家对同一指标重要程度的看法不尽相同,通过对方差的分析,可以了解到全部专家意见的分散程度。如果第一轮调查结束后,发现专家们的意见分散程度过大,则可以进行下一轮甚至多轮的调查,直至专家们意见接近一致。最后,选择最终各个专家打分的均值作为指标的权重。在实际操作中,各专家的打分一般是匿名进行的。即各个专家之间并不知道对方也在接受该项目的咨询,从而避免因为专家之间相互沟通而降低结论的客观性。层次分析法AHP是美国运筹学家萨蒂(T.L.saaty)在20世纪70年代初提出来的,它是将一些难量化的定性问题,在严格数学运算的基础上进行量化;是将一
40、些定量与定性相混杂的复杂决策问题综合为统一整体后,再进行综合分析评价。此方法特别适用于那些难于完全用定量方法进行分析的复杂问题。因此,在资源分配、选优排序及决策预报等领域得到广泛的应用。变异系数反映了各个指标数值的差异程度。这里的差异包括纵向和横向两方面内容,即时间序列数据和截面数据都可以作为确定权重的依据。假如某个指标的各个数值差异越大,意味着该指标发展越不稳定(时序数据)或不均衡(截面数据),从而对于实现预期目标的把握性越差,因而赋予较大权重;反之,若某个指标差异很小,意味着该指标发展得较为稳定(或均衡),实现预期目标的把握较大,我们给予的关注就可以少一些,因而所赋权重就小。熵值法(ent
41、ropy method)也是一种根据各项指标观测值所提供的信息量的大小来确定指标权重的方法。熵原是热力学中的一个名词,在信息论中又称为平均信息量,是用于估计各种各样随机试验不肯定程度的指标。根据美国数学家申农(Shannon)的定义,假定随机实验a有有限个不相容的结果A1, A2, , An,其出现的概率分别为P1, P2, ., Pn,则这n个结果的平均信息量,即熵为:并且,熵值越大,说明P1, P2, ., Pn之间的差异越小,即这n个结果势均力敌,随机实验a的不肯定性就越强;反之亦然。第二,指标隶属度的确定。在普通集合理论中,对于任何一个元素来说,其隶属关系只有两种:或属于某集合U,或不
42、属于这一集合。然而在模糊集合理论中,由于存在模糊性,论域中的元素对于一个模糊子集的关系就不再是“属于”和“不属于”那么简单的关系,其对该模糊集的隶属程度大小即隶属度,取值在0到1之间。在进行模糊评判的时候,如何建立各个因素对应各个评判等级的隶属程度大小,是整个评判能否进行的关键。确定隶属度,在各类评判中有不同的方法。由于模糊数学本来就是用以解决难以用完全定量的方法来解决的问题,而且确定隶属函数的方法多数还处于研究阶段,尚没有达到像概率分布的确定那么成熟的阶段,所以,隶属函数的确定难以避免不同程度上人为主观性的影响,但是无论其受到主观性的影响如何,都是对客观现实的一种逼近。评判隶属函数是否符合实
43、际,主要看它是否正确地反映了元素隶属集合到不属于集合这一变化过程的整体特性,而不在于单个元素的隶属度数值如何。隶属函数的表示方法通常有公式法、图表法、曲线法。对于网络舆情评估模型来说,在确定了评估因素集、评判集和各评判指标的权重集之后,就要对每个因素进行单因素评判,得到单因素评判向量,从而建立模糊隶属度矩阵,以确定评估指标的隶属度。指标隶属度的确定一般来自问卷调查。为避免主观判断所引起的非科学性,增加定性指标的科学性,可采用对专家打分后的问卷调查的处理。可以采用简单的求平均值,也可以根据不同专家对该领域的影响程度,赋相应的权重,而后求其加权平均值,从而得到各个指标的综合指数,即评价值。假设该主
44、题在某天的部分舆情信息如下:Web页面总数:101000点击数:55000回复数:45000计算该主题的热度指数。第一步:确定对象集和因素集U主题热度指标U=流量指标 u1, 点击热度指标 u2,回复热度指标 u3流量指标 u1=Web页面总数u11点击热度指标 u2=点击数u21回复热度指标 u3=回复数u31第二步:确定评语集V主题热度指标的值域:1 很热 (-,12比较热 (1,23一般热 (2,34不热 (4, )第三步:确定指标权重第3.1步 建立递阶层次结构模型表11-1 主题热度指标的层次结构一级指标二级指标舆情要素主题热度指标流量指标时间段内的Web页面总数点击热度指标时间段内
45、的点击数回复热度指标计算时间段内的回复数第3.2步 专家打分请专家协助,参考表11-2填写调查表11-3。表11-2 层次分析法比例标度表表11-3标度含义1表示两个因素相比,3表示两个因素相比,5表示两个因素相比,7表示两个因素相比,9表示两个因素相比,2,4,6,8表示上述相邻判断中间值倒数若因素i与因素j的重要性之比为aij,那么因素j与因素i重要性之比为aji=1/aji表11-3 主题热度指标重要程度两两比较调查表流量指标点击热度指标回复热度指标流量指标1点击热度指标1回复热度指标1第3.3步 确定指标权重对专家填写的调查表11-3用平均或加权平均的方法,构造各层次中的两两比较判断矩
46、阵,并用根法计算各层次的相对权重。得到结果如表11-4所示。表11-4 主题热度指标重要程度两两比较调查表流量指标点击热度指标回复热度指标权重流量指标121/30.29点击热度指标1/211/30.18回复热度指标3310.69将各层次的权重进行归一化后得到权重向量W=(0.25,0.15,0.6)第3.4步 一致性检验通过计算得到:最大特征根=3.1 一致性比例 CI = 0.05 一致性指标 RI = 0.58 CR =CI/ RI =0.0860.1因此,各层次指标的相对权重可以接受。第四步:确定指标隶属度请专家协助,填写调查表11-5、11-6、11-7。假设三位专家填写的调查表如表1
47、1-8、11-10、11-12所示,用平均或加权平均的方法分别得到流量指标、点击热度指标、回复热度指标的隶属度矩阵,如表11-9、11-11、11-13所示。表11-5 流量指标等级评估表二级指标舆情要素指标语言变量(天)评语流量指标时间段内的Web页面总数100,000介于50,000-100,000之间介于10,000-50,000之间10,000表11-6 点击热度指标等级评估表二级指标舆情要素指标语言变量(天)评语点击热度指标时间段内的点击数100,000介于50,000-100,000之间介于10,000-50,000之间10,000表11-7 回复热度指标等级评估表二级指标舆情要素指标语言变量(天)评语回复热度指标时间段内的回复数100,000介于50,000-100,000之间介于10,000-50,000之间10,000表11-8 流量指标等级评估表调查结果二级指标舆情要素指标语言变量(