《浅谈大数据下的信息资源管理创新(精品推荐).docx》由会员分享,可在线阅读,更多相关《浅谈大数据下的信息资源管理创新(精品推荐).docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、浅谈大数据下的信息资源管理创新摘要:【目的/意义】根据大数据环境下信息资源管理的特征,对信息资源管理形式进行创新探索,进一步挖掘信息资源深层次价值,实现更健康有效的信息资源载体的支持。【方法/经过】以大数据背景的信息资源特征为基本研究出发点,挖掘数据科学与信息资源管理的关联,利用数据挖掘和数据分析以及新兴的智慧服务,构建较为系统的信息资源管理形式。【结果/结论】通过本文的研究,构建了大数据背景下信息资源管理三种创新形式:“物联网大数据创新形式;“数据挖掘技术信息资源融合形式;“技术框架用户核心的信息服务形式,为大数据时代信息资源管理的可持续发展及研究提供知识参考根据。关键词:大数据;信息资源管
2、理;管理形式;形式创新;智慧服务;融合形式伴随着科学的不断进步,技术的不断发展,大数据处理技术与机器学习技术应运而生。大数据中的信息资源被迅速大量的积累,挖掘隐含在大数据信息资源中的潜在隐含的知识具有重要意义。大数据环境下信息资源管理领域的重点主要集中在知识组织、价值发现和精准信息服务等方面。信息资源指数的增长使得用户难以对信息资源的来源进行准确、高效的提取与利用,最终会导致网络资源利用率降低。因而,为到达对信息资源更高效利用、用户得到更为准确有效的信息资源载体的目的,对大数据环境下信息资源管理特点及问题进行分析并提出相应的对策建议变得尤为重要。大数据时代的到来,尤其是数据科学的出现,为信息资
3、源管理带来了新的机遇与挑战。机遇主要体如今包括信息资源在内的大数据重新遭到广泛重视,而挑战在于信息资源管理形式的创新,因而在大数据时代我们需要改变考虑形式和研究范式。本文根据大数据背景下信息资源特征,挖掘数据科学与信息资源管理的关联,并针对性地提出信息资源管理的创新形式。2大数据背景下信息资源特征信息资源管理有狭义和广义之分。狭义的信息资源管理是指对信息本身即信息内容施行管理的经过。广义的信息资源管理是指对信息内容及与信息内容相关的资源如设备、设施、技术、投资、信息人员等进行管理的经过。大数据产生和发展的特点能够归纳为“4V,即Volume海量、Velocity高速、Variety多样、Val
4、ue价值。2.1数据量大进入Web2.0时代后,用户主导而生成的内容互联网产品形式成为主流,以此生成以人为本的创新2.0形式在互联网领域的典型体现,是由专业人员织网到所有用户介入织网的创新民主化进程的生动注释,由此生成海量的、复杂的数据集合。与此同时伴随着各种随身设备、物联网和云计算、云存储等技术的发展,人和物的所有轨迹都能够被记录,数据因而被大量生产出来。互联网的核心网络节点由网页转化为用户,每个用户都成为数据制造者,短信、微博、照片、录像都是其数据产品;数据来自无数自动化传感器、自动记录设施、生产监测等设备,因而大数据的起始计量单位不仅仅是人们如今熟知的G、T,还可能是P1P1024T、E
5、1E1024P或Z1Z1024E这些数量级。大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。2.2速度快速度快,时效性强大数据最为显著的一个特点是能够实时地从不断变化的动态数据中抽取用户所需要的信息且创立和移动数据的速度较快。在现代高速发展的网络环境下,软件性能优化促使了电脑处理器和服务器的升级,能够实现创立实时数据流的目的。信息资源管理不仅包括数据存储与检索的经过,还包括数据快速处理、分析数据并反应给用户的经过,以知足用户的实时需求。大数据的多层构造使得大数据呈现出具有多种形式和类型的特点。其中,数据资源中的业务数据随时间的推演具备统一标准的格式,这种构造数据
6、能够被专业的数据分析工具识别和分析。和传统的业务数据相比,大数据环境下的数据资源具有不规则性和模糊性等特点,怎样从多种形式构造的复杂数据中挖掘所需要的资源是一个重要挑战。2.3数据类型多种多样当下,多种类型的数据源产生丰富多样的额数据类型和格式,早已不拘泥于传统意义上的构造化数据。数据类型主要包括构造化、半构造化和非构造化数据,其中,半构造化、非构造化数据逐步占据了数据的主要部分。构造化数据是以二维表构造来实现逻辑表达的数据,其具有严格地数据格式与长度规范,能够使信息资源以更为标准化的形式展示在搜索结果中;构造化数据相较于普通纯文本构造性更强,在利用和提取方面,用户能够得到显著的便利;非构造化
7、数据,是与构造化数据相反的,包括所有格式的办公文档、XML、HTML、各类报表、图片和咅频、视频信息等,在全文检索和各种多媒体信息处理领域被广泛应用。由于非构造化数据的非限定构造形式,使得这些数据较为灵敏且丰富。因而,综合看来,在信息资源管理中,针对多样性的数据要求对数据的分析处理能力的方法也要多元化。22.4数据价值面密度低据价值面密度低,准确性不够用户所产生的信息中,有价值的信息数据所占比例很小,具有价值密度的高低与数据总量的大小成反比的趋势。相比于传统的信息资源管理形式,创新形式应体如今通过从大量不相关的各种类型的数据信息,挖掘出对将来趋势与形式预测分析有价值的信息,并利用机器学习、人工
8、智能或数据挖掘等方法进行系统分析,挖掘其中的隐含的规律和知识,并在农业、金融、医疗领域进行广泛的应用,最终到达提升社会治理能力、提高生产效率、推进科学研究效果的目的。同时,来自不同数据源的社交数据、企业内容、交易与应用等数据逐步兴起,信息资源管理的目的重点逐步转向保障信息资源的真实性和安全性等方面。3数据科学与信息资源管理的关联3.1数据科学1974年,著名计算机科学家、图灵奖获得者Peter初次明确提出了数据科学DataScience的概念:“数据科学是一门基于数据处理的科学,并提到了数据科学与数据学Datalogy的区别前者是解决数据问题的科学而后者侧重于数据处理及其在教育领域中的应用。从
9、图1中能够看出,数据科学的各组成部分的成熟度不同:的成熟度最高,已广泛应用于生产活动;其次是模拟与仿真、集成学习、视频与图像分析、文本分析等,它们正在趋于成熟,即将投入实际应用;基于Hadoop的数据发现可能会消失;语音分析、模型管理、自然语言问答等已经度过了炒作期,正在走向实际应用;公众数据科学、模型工厂、算法市场经济、规范分析等正处于高速发展期。3.2数据科学对信息资源管理形式的影响3.2.1思想意识的影响云计算、物联网、移动计算等新技术的兴起拓展了人们的数据获取、存储和计算能力,促使大数据时代的到来,成为数据学科诞生的必要条件。而新技术的应用意味着数据科学对信息资源管理形式的认识发生了根
10、本性变化不仅开场接受数据的复杂性,而且信息管理的理念从传统的完美主义转向现实主义,“数据在先,形式在后或无形式的信息资源管理范式、BASE原则以及CAP理论等新理念已成为信息科学的基本共鸣。其次在大数据时代,数据成为一种重要气力,怎样组织、挖掘和利用数据成为当代信息组织的核心竞争力,因而开拓大数据思维形式,意识数据的主动属性,重视数据的积极作用,构成数据驱动型应用、数据业务化、数据洞察和以数据为中心的思维形式3.2.2信息技术的影响从知识体系看,信息资源管理主要以统计学、机器学习、数据可视化以及某一领域知识为理论基础,主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数
11、据产品开发,如图2所示。基础理论主要包括大数据背景下的信息资源管理的新理念、理论、方法、技术及工具等。数据加工是为了提升数据信息质量、降低数据计算的复杂度、减少数据计算量并提升数据处理的精准度,对原始数据进行一定的加工处理工作包括数据审计、数据清洗、数据变换、数据集成、数据脱敏、数据归约和数据标注等。在大数据背景下,数据信息的计算形式发生了根本性的变化:从集中式计算、分布式计算、网格计算等传统计算过渡至云计算。数据管理是在完成“数据加工和“数据计算之后,还需要对数据进行管理与维护,以便进行“数据分析以及数据的再利用和长久存储。数据分析通常以开源工具为主,与传统数据分析有着较为显著的差异。目前,
12、R语言和Python语言已成为数据科学家应用较为普遍的数据分析工具。数据产品开发是数据科学的主要研究责任之一,具有以数据为中心、多样性、层次性和增值性等特征。3.2.3主要应用场景的影响传统信息资源管理是在信息资源比拟稀缺的时代背景下产生的,其应用场景是信息资源稀缺且被组织机构,例如政府、企业、图书馆等以为是其主要资源。但是,大数据时代的到来改变了信息资源管理理论的主要应用场景。首先在大数据时代,信息与数据不仅仅是一种“资源,而是已成为“资产。因而,信息资源管理应将信息资源作为一种“资产来管理,而不能仅仅停留在“资源层次的管理。资产和资源的区别在于,前者具有法律权属、劳动增值、财物价值和可直接
13、市场交易等属性。因而,信息资源管理不能脱离于其人文、法律、道德、市场、经济环境。其次,信息和数据不再处于供应缺乏状态,开场进入一种富足供应的应用场景。因而,传统信息资源管理中重视的信息资源搜索、组织和检索等问题,已经不再是社会关注的主要问题。相反,怎样在信息与数据富足供应时代,从大数据中快速洞见有价值的信息,并将其转换为行动才是新的关注点。因而,信息资源管理的应用场景已从信息资源的“搜索与检索转向“洞见与增值。最后,人们的信息需求不再局限于文书、文献、记录类数据,已拓展至图像、多媒体、视频、音频、富媒体等不同载体的信息资源。传统信息资源管理在文献载体类信息的管理方面获得了较大的成就,但是对其他
14、载体类型的信息资源管理研究并不深化。因而,信息资源管理研究的应用场景已从“文献信息资源的管理转向“大数据信息资源的管理。4信息资源管理形式创新4.1“物联网大数据创新形式物联网是面向全球的连接物品的信息基础设施,它是物与物之间、人与物之间的信息交换网络。继互联网之后,物联网急速扩展,浸透到人们生活的每一个角落。这一形式是由物联网和大数据等技术为支撑,以此面向信息服务,同时也是信息资源管理的一个重要组成部分。使用智能化设备替代人工,以及替代人工也不容易完成的工作,通过使用物联网、互联网、移动互联网技术,建立起一个智能化,低人工的智慧平台。该平台主要由5个部分组成:基础设施与感悟单元、网络单元、数
15、据处理单元、平台单元和应用单元。其中,智慧平台建设最基础的内容为基础设施与感悟单元,由两个方面组成,即基础设施层和感悟层。平台中产生的所有数据信息实体构成了基础设施层,而感悟层的作用则是对各种数据进行识别、采集、监控,其通过芯片、可穿戴设备、传感器、摄像头等手段实现这一目的。所获取的数据通过网络层传入平台,网络层主要包括物联网的承载网络、广域互联网、局域网、移动通信网,网络设备等。网络层中获取到的数据由数据层进行管理。技术支持平台与外部接入平台组成了平台层。技术支持平台的功能主要包括两方面,一是实现感悟系统的数据管理功能,二是执行业务经过中的引擎功能,三是传输、处理、转换业务应用方面的感悟数据
16、。其中,外部接入平台是电子商务中各种信息服务接口与信息系统对接的场所,其功能为实现各平台信息资源高效的分享与利用。应用层为基础设施层、网络层、数据层、平台层各个部分实现智慧应用的经过。应用层能够实现为用户提供辅助决策和决策建议的功能,向用户提供所需要的决策产物。最终,通过“物联网大数据形式提高信息资源管理的智能化与自动化程度,实现信息生态系统的动态平衡。4.2“数据挖掘技术信息资源融合形式数据挖掘与数据分析是大数据时代下充分利用信息价值的关键步骤。利用数据挖掘和智能分析等技术来提炼信息资源内在隐含的价值,以优化信息服务质量。海量的数据及复杂的数据构造,导致用户搜索相关信息的能力遭到了史无前例的
17、挑战,用户在选择和利用数据的经过中碰到了知识迷航、信息巨量等问题,因而用户更希望以愈加简洁高效的工具手段准确获取信息,这就要求结合数据挖掘、云计算和智能分析等大数据技术,在资源组织整合以及信息提供等方面实现高效化和智能化;数据价值密度低给大数据时代信息资源的输入端带来宏大的挑战,因而需要仔细甄别才能挖掘出有效数据以保证数据的真实可靠性,提升数据的利用价值;用户量陡增及其对信息资源的需求质量不断严苛是输出端所面临的问题,因而信息资源管理需要基于用户需求进行服务形式的转型。“数据挖掘技术信息资源的融合形式中,数据挖掘技术对于难以数字化的数据进行深度提取,发现隐含价值,通过高效利用数据来实现其最大价
18、值。同时,云计算技术利用多个计算机对信息资源进行数字化组织和整合,使得信息的搜索效率更高,更准确,最终知足用户需求,提升用户体验。4.3“技术框架用户核心的信息服务形式在信息爆炸的背景下,用户行为数据具有宏大的潜在价值,分析挖掘这些数据能够确定和划分用户的行为特征进而实现准确识别和把握用户需求的目的。根据不同用户的个性化需求,向其提供有针对性的需求服务。信息资源服务的核心目的是将大数据资源、技术与用户需求严密结合,并采用适宜的方式提供应用户。在新型技术框架和用户核心相结合的服务形式下,秉承以知足用户需求、精准信息推送为目的。技术框架由信息资源的信息服务集成创新技术、基于用户行为数据的信息服务界
19、面创新方法、基于全网舆情数据的信息服务传递创新技术三部分组成。信息服务集成创新技术是归纳共性数据源的一种技术,其在跨模态数据创新服务整合的基础之上,集成所获取的核心数据集并对其进行综合分析,创立一种模型和方法将不同领域、不同构造数据根据同一标准融合集成进而提供针对性服务。基于用户行为数据的信息服务界面创新方法,这种技术能够构建Web挖掘分析模型,主要包括在线服务用户需求时空分布模型、需求知足度模型、页面点击行为模型、页面跳转行为模型、栏目关联度模型等,根据用户的个性化需求对服务内容进行改良、通过不同的用户行为对服务界面进行改良的方法体系。基于全网舆情数据的信息服务传递创新技术。这种技术主要由中
20、文信息处理、社会网络分析、新事件探测、情感分析等舆情分析方法组成,通过指定方法实现信息传播中的关键节点的识别,高效精准的推送服务信息,提升互联网信息的推动力和影响力9。技术框架及以用户核心相结合的信息服务形式能够挖掘和识别用户的真实需求,会推动信息服务中以用户为中心的个性化信息服务的实现。本文以大数据背景的信息资源特征为基本研究出发点,挖掘数据科学与信息资源管理的关联,并针对性地揭示和分析了大数据背景下信息资源管理的三种创新形式:“物联网大数据创新形式;“数据挖掘技术信息资源融合形式;“技术框架用户核心的信息服务形式。在信息资源建设和资源服务方面的基础性研究相比照较成熟的基础上,充分利用正处于积极探索时期的数据挖掘和数据分析研究范式,以及正处于萌芽期的智慧服务,构建较为系统的管理形式,为大数据时代信息资源管理的可持续发展及研究提供知识参考根据。