《社会学理论下社会学网络的模型研究.docx》由会员分享,可在线阅读,更多相关《社会学理论下社会学网络的模型研究.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、社会学理论下社会学网络的模型研究摘要:社会网络的发展使人们的沟通变得越来越便捷,对社会学网络模型的研究不仅具备理论价值,它还具备极高的应用价值。但是,由于社会学网络中的数据是以稀疏形式存在的,再加上噪音数据与数据缺失等现象的普遍存在,这使传统的数据处理技术存在很大弊端与缺乏。同时,现阶段社会学网络的研究还尚未构成较为完善的社会学理论支撑。为此,本文便基于社会学理论和稀收学习方法对社会学网络模型进行深化的研究,以此有效处理社会学网络中所存在的稀疏数据之间的内在关系及其交互,为社会学网络模型提供足够的社会学理论支撑,以此帮助相关人员克制社会学网络模型中存在的技术难点。关键词:社会学理论;稀疏学习;
2、社会学网络;模型一、社会学网络的主要特征社会学网络能够看作是虚拟世界的一种延伸形式,它相比于传统的信息网络来讲,具备下面几个主要特征。首先,社会学网络具备社会性,社会性普遍存在于社会网络环境当中,其是与社会网络呈现共存关系的,它将社会网络环境中不同个体所具备的影响力与权威性之间的差异作为用户所自有的社会性特征。其次,社会学网络具备多维度特征,它能够从不同侧面对一样用户进行描绘,进而使用户具备明显的多维度特征,同样,对于一样群体来讲,也同样具备明显的多维度特征。再次,社会学网络具备较强的关联性特征,在社会网络中,用户与用户之间的差异使不同用户在行为上具备一定的联络,并借助于网络拓扑构造来实现不同
3、用户之间的互相影响,进而使用户具备了较强的关联性特征。最后,社会学网络具备演化性特征,在社会网络的发展中,用户的状态及关系并不是一成不变的,而是处于不断更新中,这也使网络能够不断的产生新的信息,用户也能够对个人状态进行不断更新,同时建立新的社会关系,这也使社会网络中的用户具备了演化性特征。通过演化经过,能够使信息在社会网络中的传播得到不断扩大,进而使其在非常短的时间内就能进行大面积传播。固然社会学网络的发展给人们带来了新的商业时机与沟通渠道,但由于社会网络本身所具备的这些特征,也使其在数据挖掘方法及分析技术方面和传统方式产生很大的不同,并且在社会网络不断发展的同时,也给人们带来了一系列需要攻克
4、的技术难题,如符号网络的链接预测问题、短文本的主题识别问题、信任关系稀疏问题等,因而,需要利用新的方法并充分结合多种理论来对社会学网络模型进行深化的分析与研究,克制现有的技术难关,使其能够更好的知足用户日益增长所带来的社会需求。二、稀疏学习方法及模型1.稀疏学习方法近些年来,社会网络的发展与大数据的推广,给传统的机器学习带来了宏大的挑战,例如数据缺失、数据的规模庞大、数据的稀疏性等。数据的稀疏性在各个研究领域中普遍存在,例如在社交网络领域中,固然用户是大量存在的,但这些用户之间的社会交互与社会关系相比于数据集合来讲仍然较为稀疏。机器在学习经过中,由于数据所具备的数据量大、冗余性、稀疏性等特征,
5、使训练学习模型变得越来越复杂,并且所耗时间也越来越长,这也使其在适用性上越来越差,因而必需要找出相应的方法来解决上述问题。所谓稀疏学习方法,是将实际生活中的应用问题所具备的数据特征利用维度约简来进行稀疏表示,进而构建出解决问题的模型,利用稀疏学习方法能够有效提高与改善学习模型性能,进而使学习模型成为一种愈加高效的数据挖掘与机器学习工具。2.稀疏学习模型分析稀疏学习模型主要分为三种类型,分别是主成分分析模型、Lasso模型及矩阵分解。主成分分析模型能够从大量数据中对数据冗余及噪音进行有效去除,使获得的原始数据能够对事物特征进行最本质的反映,进而到达数据的降维处理与压缩目的。Lasso模型是在上世
6、纪60年代提出的,它是LeastSquares模型的变体,该模型能够有效弥补传统特征选择方法中存在的缺乏,它通过惩罚函数的构造来建立相应的学习模型,并利用压缩系数对某些回归系数进行变小处理,这也使其具备子集选择与岭回归的优势。矩阵分解能够使矩阵分解以后变得更容易处理,矩阵分解具备很多性质,这也使其能够适用于不同的分解技术。最常见的矩阵分解技术主要有非负矩阵分解技术、奇异值分解技术、概率矩阵分解技术及低秩矩阵分解技术等。3.稀疏学习算法分析在机器学习领域,除了需要具备能够对问题进行解决的模型以外,还要具备相应的优化算法。传统的优化算法能够使机器学习效果得到显著提高,但大数据时代的来临,使机器学习
7、模型难以对数据稀疏及数据规模大这两大问题予以有效解决,这也使传统优化算法难以针对大数据的特点进行有效处理。而稀疏学习优化算法则是在传统优化算法的基础上演变出来的,它针对损失函数及正则化项的特殊构造含义及其作用,能够适用于大数据的特点来对优化问题进行有效解决。三、基于社会学理论和稀疏学习方法的社会学网络的模型研究1.LASSO稀疏学习模型研究在短文本主题识别方面的问题主要存在于短文本的信息量较少、表达语法不规范、关键特征较为分散、数据量大、更新速度快等问题,这也使经典机器学习方法难以对短文本进行有效处理。为此,本文通过构建稀疏学习模型来对噪音文本及短文本的分类问题进行形式化表示,然后对社会学理论
8、文本关联关系及文本内容进行模拟,最终提出对短文本及噪音文本进行主题识别的相关解决方案。首先,采用Lasso稀疏学习模型中的多类别分类器来对多分类问题进行解决。为了使文本表示能够更好的应用到主题识别当中,应对文本进行预处理,如对停用词的移除,提取词干等。然后通过文本特征选择模型来对文本内容的特征空间进行表示。采用的特征空间主要有三个,分别是Unigram模型、TF模型及TF-IDF模型。为了对稀疏学习模型进行进一步的扩展,并通过社会情境来对主题进行识别,为此采用了两个社会学理论应用到主题识别当中,分别是偏好一致性正则化与社会感染正则化,并求解这两个社会学理论的目的函数。根据上述两个社会学理论的定
9、义来建立主题识别的社会学框架,进而实现利用社会学理论并通过社会情景来对短文本及噪声文本进行主题识别的目的。2.信任预测模型研究对于信任预测模型,应采用特征向量中心性方法来对用户的社会等级进行计算,然后对用户的社会等级进行排序,并根据社会等级理论来提出相应的社会等级正则化方法,并最终建立信任关系预测模型sTrust,通过上述步骤,能够有效解决社会网络在进行信任数据预测时所产生的稀疏性问题。详细内容如下,首先利用矩阵分解技术将原矩阵分解成三个低维非负矩阵,然后重构信任关系网络矩阵,即,这时由于信任关系网络矩阵过于稀疏,因而需要添加正则化项来避免出现过度拟合问题,在社会等级正则化中,要给出所应用的基
10、本符号,并利用低秩矩阵分解方法来对用户与用户之间的信任关系建立的可能性进行分析,以此找出最小化社会等级的惩罚项,然后根据社会等级理论进行建模。3.链接预测模型研究在矩阵符号网络预测模型中,需要将符号网络当成矩阵,然后采用矩阵分解方法与信任传播方法来对符号属性进行预测,该模型是以低秩矩阵分解法,结合社会学理论中的社会等级理论、构造平衡理论及交互情感理论来对相应的符号网络预测模型进行构建,进而到达对链接关系符号属性进行预测的目的。首先用邻接矩阵形式对构建符号网络进行表示,然后采用矩阵分解方法分析低秩逼近的相关表达方法,利用低秩矩阵相乘的方式来对符号网络矩阵进行重构,并将原矩阵中的缺失值进行补齐,由于这时的符号关系矩阵比拟稀疏,因而需要添加正则化项方式来对过度拟合问题进行避免,进而到达对链接关系符号属性进行预测的目的。四、结语综上所述,固然我国在社会网络中的情感分类、符号网络、信任关系预测及主题识别等方面获得了一系列的阶段性成果,但在社会学网络中仍然存在很多问题需要得到进一步讨论。在将来的社会学网络研究工作中,将主要集中在对多数据源融合技术与垃圾用户识别方面,而这也需要诸多学者的共同努力才能完成。当然,本文仅仅只对基于社会学理论和稀疏学习方法的社会学网络模型进行了浅要的研究,并没有对有效性进行验证,这也需要在后续的工作中逐步得到完善。