《基于用户行为分析的图书管理系统设计与开发.doc》由会员分享,可在线阅读,更多相关《基于用户行为分析的图书管理系统设计与开发.doc(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 硕士学位论文 (专业学位) 基于用户行为分析的图书管理系统设计与开发姓 名: 学 号:所在院系:软件学院职业类型:工程硕士专业领域:软件工程指导教师: 副指导教师: 二一三年十二月 A dissertation submitted toTongji University in conformity with the requirements forthe degree of Master of EngineeringThe design and development of books management system based on user behavior analysisCand
2、idate: Student Number: School/Department: Software CollegeDiscipline: Software EngineeringMajor: Software EngineeringSupervisor: Dec, 2013基于用户行为分析的基于用户行为分析的图书管理系统设计与开发同济大学学位论文版权使用授权书本人完全了解同济大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供本
3、学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名: 年 月 日 同济大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。 学位论文作者签名: 年 月 日同济大学 硕士学位论文 摘要
4、摘 要随着当今计算机硬件和软件技术的进步,特别是网络技术的出现和应用的普及,给当今社会信息管理带来了革命性的变革。基于用户对图书管理系统的各种访问数据,进行用户行为分析,访问数据的获取是通过访问日志或浏览记录的方式获得的。用户对图书管理系统访问的规律和特性,是通过抽取数据、分析数据、挖掘数据、统计分析等实现的。基于用户行为分析的图书管理系统的优化策略与用户行为分析策略进行结合,并为其提供改进参考。本文详细描述了为某图书馆而设计开发的基于用户行为分析的图书管理系统。系统开发满足了用户的各种需求,为图书管理员提供了便利。本文首先针对课题的研究背景及意义,介绍了设计和开发的基于用户行为分析的图书管理
5、系统所涉及的用户行为分析理论及软件相关开发技术。对用户行为分析的发展阶段、用户行为分析方法进行了介绍。给出了系统开发的相关技术。其次,分析了基于用户行为分析的图书管理系统的具体需求,包括:功能性需求分析和非功能性需求分析,识别了系统的参与者,并对各功能进行了用例分析,为系统的详细设计与开发奠定基础;进行了该基于用户行为分析的图书管理系统的总体设计和详细设计,给出了系统开发的总体架构,将系统划分为6大功能模块,分别为:系统设置管理模块、数据管理模块、借书还书管理模块、数据查询管理模块、系统信息管理模块和用户行为分析管理模块,给出了各模块主要功能的核心处理流程和时序图。进行了基于用户行为分析的图书
6、管理系统安全性的插件设计;进行了系统权限的设计,权限的设计分为三级,第一级“组”,第二级“角色”,第三级“权限列表”;进行了系统数据库详细设计,设计了基于用户行为分析的图书管理系统的整体E-R图,并给出了系统运行必须的部分数据库表。第三,采用软件工程中的生命周期法进行了该系统的编程实现,给出了各模块的主要操作界面和实现的代码。用户行为分析己经成为一个新的研究热点。本课题基于用户行为分析对基于用户行为分析的图书管理系统的进行了设计与开发。该系统的实现能为基于用户行为分析的图书管理系统更好的为学生和老师服务提供依据和参考。关键词:图书管理系统;用户行为分析;用例分析;Browser/Server结
7、构;SQL Server2005VTongji University Master of Software Engineering AbstractABSTRACTWith the progress of todays computer hardware and software technology, especially the popularity of the emergence of network technology and application, in todays society for information management has brought the revo
8、lutionary change.Based on the user access to books management system management systems all sorts of data and user behavior analysis, access to the data acquisition is obtained by means of access log or browsing history.Regularity and characteristics of the user access to books management system man
9、agement system, is by extracting data, analysis of data, data mining, statistical analysis, etc.Books management system based on user behavior analysis of optimization strategy and user behavior analysis, and provide reference for improvement.This paper describes the design and development for a lib
10、rary and the books management system management system based on user behavior analysis.System development meet the various needs of users, provides convenience for the librarians.This paper aimed at the research background and significance, this paper introduces the design and development of books m
11、anagement system based on user behavior analysis of user behavior analysis theory and software related development technologies.Stage to the development of user behavior analysis, user behavior analysis method are introduced.The relevant technology of the system development is presented.Secondly, an
12、alyzed the books management system based on user behavior analysis of specific needs, including: functional requirements and non-functional requirements analysis, identification of the system participants, and each function of a use case analysis, detailed design and development to lay the foundatio
13、n for the system;To the books management system based on user behavior analysis of the overall design and detailed design, the overall architecture of the system development is given, and the system is divided into six functional modules, respectively: system Settings management module, data managem
14、ent module, borrow books and books information management module, data query management module, system management module and management module, user behavior analysis module is given and main functions of the core processing sequence diagram.The books management system based on user behavior analysi
15、s security plug-in design;This paper gives the design of the system permissions, the design of the permissions are divided into level 3, the first level group, the second character, 3 permissions list;The system database design, detailed design based on user behavior analysis of books management sys
16、tem management systems overall e-r diagram, and gives the system operation must be part of the database table.Third, the life cycle of software engineering method is used for the programming of the system implementation, each module is given of the main interface and implementation of the code.User
17、behavior analysis has become a new research hotspot.This topic is based on user behavior analysis of book management system based on user behavior analysis in the design and development.The implementation of the system can be based on user behavior analysis of books management system management syst
18、em to better service for students and teachers to provide the basis and the reference.Keywords: Books management system; user behavior analysis; use case analysis; Browser/server structure; SQL Server2005.同济大学 硕士学位论文 目录目 录第一章 引言11.1 课题研究背景及意义11.2 基于用户行为分析的图书管理系统的研究现状21.3 本文主要工作及技术路线41.4 本文的组织结构5第二章用
19、户行为分析理论及系统相关技术介绍72.1用户行为分析理论72.1.1用户行为分析的发展阶段72.1.2用户行为的概念、特点及分类82.2用户行为分析方法92.2.1数据挖掘概念102.2.2 数据挖掘系统与模型112.3 系统相关开发技术122.3.1 ASP.NET技术122.3.2 AJAX 技术介绍132.3.3 SQL Server2005介绍142.4 本章小结15第三章 系统需求分析163.1 功能性需求分析163.2 系统角色193.3 系统用例分析203.3.1 系统设置管理用例分析203.3.2 数据信息管理用例分析213.3.3 借书还书信息管理用例分析233.3.4 数据
20、查询管理用例分析253.3.5 系统信息管理用例分析263.3.6 用户行为分析用例分析283.4 非功能需求分析303.4.1 系统开发的可行性303.4.2 系统安全性313.5 本章小结32第四章 系统设计334.1 系统模块的划分及总体架构设计334.1.1 功能模块划分334.1.2 系统总体架构设计344.2主要功能模块的设计364.2.1 系统设置管理模块364.2.2 数据信息管理模块374.2.3 借书还书信息管理模块404.2.4 数据查询管理模块454.2.5 系统信息管理模块474.2.6 用户行为分析模块494.3系统数据库设计504.3.1 数据库需求分析504.3
21、.2 关系模式设计504.3.3 部分数据库表设计534.4 构建基于用户行为分析的图书管理系统安全性的插件设计564.4.1 插件调用过程中可对应用程序进行功能扩展574.4.2 基于用户行为分析的图书管理系统安全性的插件设计574.5 权限设计584.6 本章小结58第五章系统实现595.1 技术选型595.2功能模块的实现595.2.1 系统设置管理模块595.2.2 数据信息管理模块615.2.3 借书还书信息管理模块635.2.4 数据查询管理模块645.2.5系统信息管理模块665.2.6 用户行为分析模块685.3 本章小结70第六章 结论和展望71致谢73参考文献74个人简历
22、在读期间发表的学术论文与研究成果76第一章 引言第一章 引言1.1 课题研究背景及意义随着当今计算机硬件和软件技术的进步,特别是网络技术的出现和应用的普及,给当今社会信息管理带来了革命性的变革。图书是人类用来纪录文化成就的主要工具,也是人类交融感情,取得知识,传承经验的重要媒介,对人类文明的传承贡献巨大。图书馆是搜集、整理、收藏图书资料供人阅览、参考的机构,图书馆有保存人类文化遗产、开发信息资源、参与社会教育等职能1。随着图书馆的出现,随之就有了图书管理工作,图书管理员的工作主要有: (1)对图书进行分类、编制书目索引; (2)负责图书馆内的管理,审查借阅者身份,维护图书馆秩序; (3)对入库
23、的图书进行登记、盖收藏章、打分类号,上架; (4)管理图书借还活动,审查归还图书有无残损、污染,依规定对损坏图书行为进行处理; (5)对书籍进行定期除尘,做好防火、防虫、防潮等工作; (6)辅导读者查阅馆藏目录及文献检索工具; (7)维护图书馆内的设施、资源、设备2。可以看出图书管理员的工作是非常复杂、繁琐的。在计算机和网络技术没有普及之前,传统的图书管理都是以手工的方式进行图书馆的口常管理工作3。随着社会的不断进步和发展,随着图书馆内图书数量的不断增多,图书管理方面的工作量越来越大,传统的手工方式图书管理己经不再适应当前新形势下的图书管理工作,表现出诸多缺点,主要有:(1)工作量大。图书馆内
24、藏有大量的图书资料,多则几十万上百万册。对于大量的图书进行管理的工作可想而知,特别是当采用手工管理方式时,对于图书的入库登记,图书分类工作,图书借出工作,图书归还工作,图书的查阅工作等,工作量非常大,这就使得图书管理工作需要大量的工作人员付出大量的劳动来完成4。(2)工作效率低。传统手工方式的图书管理中,在进行图书借出记录、图书归还记录和查询图书信息工作时的工作效率非常低。因为以手工的方式建立图书借还记录管理人员浪费大量的时间输入图书和读者的相关信息,以手工方式查询图书信息的时候,图书管理人员面对数以万计的图书,往往是无从下手。这就使得传统的图书管理工作效率非常低,使得图书的借出和归还工作效率
25、低,一方面耽误了读者的宝贵时间,另一方面也使得图书流通的效率变低,不能充分发挥出图书本身的价值。是传统图书管理方式的主要缺点5。(3)工作中易出现人为失误。传统的手工管理方式,信息记录需要管理人员手工输入建立,这就使得管理员在工作中很容易出现人为的失误,使得在图书借阅和图书归还中出现图书丢失和图书没有记录的情况,给图书管理工作带来不必要的麻烦6。 (4)管理工作难以规范化。传统的手工管理方式,对于相关记录的生产和查询,费时费力,各种管理工作复杂而繁琐,难以形成规范的管理流程。即使形成了规范,不同的人对于复杂的规范执行起来也会出现不同的偏差,给图书管理工作的规范化、制度化带来了困难。传统的图书管
26、理方式,存在诸多不足之处,工作量大,管理复杂,出错率高。对于当前信息时代大量的图书资料的管理显得力不从心,己经不能满足当前图书管理的需要。随着目前科学技术的进步,随着计算机硬件和软件技术的发展,随着当前计算机和网络技术的普及使用。如何运行先进的软件开发技术,充分利用计算机和网络技术在信息管理方面的优势,提高图书管理水平和效率己经成为一个不得不面临的重大问题,开发基于用户行为分析的图书管理系统己经成为必然7-8。基于用户对图书管理系统的各种访问数据,进行用户行为分析,访问数据的获取是通过访问日志或浏览记录的方式获得的。用户对图书管理系统访问的规律和特性,是通过抽取数据、分析数据、挖掘数据、统计分
27、析等实现的。基于用户行为分析的图书管理系统的优化策略与用户行为分析策略进行结合,并为其提供改进参考9。当前活动或策略中存在的问题,也可通过用户行为分析得以发现。改进的效果可以通过对用户行为分析的进一步改进或相关策略的重新制定得到10。用户行为分析己经成为一个新的研究热点。本课题基于用户行为分析对基于用户行为分析的图书管理系统的进行了设计与开发。该系统的实现能为基于用户行为分析的图书管理系统更好的为学生和老师服务提供依据和参考。1.2 基于用户行为分析的图书管理系统的研究现状一个现代化的图书馆在正常运营中总是面对大量的读者信息、书籍信息以及两者相互作用产生的借书信息、还书信息11。传统的管理方法
28、既浪费人力物力财力,又容易导致各种错误的发生。面对图书馆数以万计的图书、纷繁复杂的读者信息、频繁更替的借还书信息,传统的直接方法不但管理起来极其不方便,而且极容易出现漏洞,从而造成不可估量的损失。因此实现一个智能化、系统化、信息化的图书管理等自动化控制,将会使图书管理工作大大减轻,方便友好的图形用户界面,简便的操作,完善的数据库管理,将会使得基于用户行为分析的图书管理系统极大限度地应用于现代化图书管理,成为图书管理人员的得力助手12。国外图书馆自动化系统的起源可以追溯到1954年,当时,美国海军兵器中,tl.(NOTS)就在IBM 701机器上进行了单元词匹配检索13。1958年,IBM的研究
29、员卢恩进行了著名的自动抽词试验,开创了自动分类、自动标引、信息检索等多个与图书馆学情报学密切相关的研究领域之先河。图书馆自动化系统的真正发展是在1964年LC发起研制机读目录(Machine Readable Catalog)之后。特别是20世纪70年代,以编目系统为基础的各种自动化系统已经成形,同时还出现了以编目系统为纽带的联机编目协作网14。从20世纪70年代末80年代初,图书馆自动化系统由单一功能性系统转向图书馆集成管理系统,其典型代表是西北大学的NOTIS系统;这期间还出现了专门为图书馆研制计算机管理系统的公司。书籍化的图书馆自动化系统的出现,本身就是社会分工的体现,使得图书馆能更迸一
30、步地专注于资源建设和服务质量的提高。事实上,从上个世纪八十年代中期开始,发达国家的图书馆基本上不再自己独立研制软件,而是直接借阅书籍化的软件系统15。90年代中后期,是国外图书馆自动化系统研发蓬勃发展的历史时期16。这一期间,随着Internet的发展,Windows图形用户界面的广泛应用,以及一系列诸如Web技术、数据库技术、Java技术的出现或成功应用,许多图书馆自动化系统厂商感觉到需要“重新设计其产品,以采用更加先进的技术来支持图书馆自动化系统17。90年代中期,我国图书馆自动化系统的研发曾经出现了一个高潮时期,当时推出了目前在国内较有影响的几个大型自动化系统(如南京汇文、北邮MELIN
31、ETS),并提出了“第三代图书馆自动化系统”的概念,其特点是从图书借阅管理的角度出发,用集中的数据库处理几乎所有与图书借阅相关的数据18。友好的用户界面,强有力的报表生成工具、分析工具和信息的共享使得图书借阅管理人员得以摆脱繁重的日常工作,集中精力从战略的角度来考虑图书借阅规划和政策19。在此之后,国内图书馆自动化系统处于相对平淡的一个历史时期,无论在理论上,还是在整体技术实现上,都没有大的突破,有的研究人员甚至认为图书馆自动化系统已经到达了顶点,没有发展的余地20。此后,随着数字化革命和因特网的大发展,带来了经济、贸易、信息传播的全球化,深刻影响着社会的各个层面。巨量信息涌入因特网,使其信息
32、极为丰富,也使信息查询、检索十分困难,尤其是对于上网漫游的新手更是如此。这主要是由于因特网上的信息资源很大程度上处于混乱的无政府状态,大大影响了信息利用的效率21。这一重大的弊端,清楚地表明了在因特网这种全球信息服务网络中,急需一个管理信息资源的新模式,所有上网的资源必须按照这个模式统一管理。所以,图书管理的重要性也就与日俱增。从国外发展看,图书管理必须使用高新技术做支撑。如在资源库建设中需要使用高效联机解析处理、数据仓库、数据挖掘等技术,研究将数据仓库和数据挖掘应用于图书管理的体系结构,要实现基于用户行为分析的图书管理系统分布式资源库的可互操作性,研究在不同层次上(语句、语义等)为具有多个分
33、布式资源库的大型图书管理提供快速横向跨库的查询技术;要实现基于并行处理的高速查询引擎,用于超大规模分布式资源库的快速存取;实现多语种的实时翻译;实现基于内容多媒体特征的检索,包括概要查询、分类、检索以及自动摘要、自动转换和匹配等22。国际上基于用户行为分析的图书管理系统及相关概念出现后,即引起国内有关单位的重视,并开展了相应的技术研究与开发工作。国家图书馆在文化部申请立项“数字式图书管理”试验项目。项目以中国博士论文影像数据库为切入点,采用客户服务器模式,利用书目数据服务器管理数据的索引和查询,用影像数据服务器管理数字化的信息;扫描影像采用300dpi的分辨率,按CCITT的Group4标准进
34、行压缩和解压,将图像存贮到JukeBox上;通过建立多级索引和多库连接实现检索;并能够在网上提供服务23。1.3 本文主要工作及技术路线本课题的目标是设计和开发出一个基于Web的基于用户行为分析的图书管理系统。本课题的主要研究的内容包括:(1)深入研究了用户行为的基础理论及相关的系统开发技术。用户行为的基础理论主要有:数据挖掘,数据挖掘与数据仓库;Web访问信息挖掘方法;系统开发的相关技术主要有:统一建模语言UML的概述、发展及组成;Sql数据库技术的现状及发展趋势等。(2)分析了基于用户行为分析的图书管理系统的具体需求,包括:功能性需求分析和非功能性需求分析,识别了系统的参与者,并对各功能进
35、行了用例分析,为系统的详细设计与开发奠定基础。(3)进行了该基于用户行为分析的图书管理系统的总体设计和详细设计,给出了系统开发的总体架构。将系统划分为6大功能模块,分别为:系统设置管理模块、数据信息管理模块、借书还书管理模块、数据查询管理模块、系统信息管理模块和用户行为分析模块,给出了各模块主要功能的核心处理流程和时序图。(4)进行了系统权限的设计,权限的设计分为三级,第一级“组”,第二级“角色”,第三级“权限列表”。(5)进行了系统数据库详细设计,设计了基于用户行为分析的图书管理系统的整体E-R图,并给出了系统运行必须的部分数据库表。(6)进行了该系统各个模块的编程、调试以及界面实现,给出了
36、部分核心代码,完成了整个系统的开发。本文的技术路线可以概括如下:首先确定系统开发的系统、系统采用的数据库及系统的架构;其次,基于用户行为分析的图书管理系统的功能性需求分析和非功能性需求分析,系统参与者的识别及系统用例分析;第三,各功能模块的详细设计,包括:核心处理流程设计与动态图设计。第四,数据库详细设计;第五,编程实现及应用。1.4 本文的组织结构本文共总共分成五个部分。 第一章 引言,介绍了基于用户行为分析的图书管理系统的开发背景、研究现状、研究意义及主要研究内容。第二章 用户行为的基础理论及相关的系统开发技术概述。主要有用户行为分析的基本概念、用户行为分析的发展阶段、特点及分类;用户行为
37、分析的内涵;数据挖掘与数据仓库等用户行为分析的常用方法。系统开发的相关技术介绍:统一建模语言UML的概述、发展及组成;Sql数据库技术的现状及发展趋势等。第三章 基于用户行为分析的图书管理系统的需求分析。主要包括:系统功能性需求分析和非功能性需求分析,并对各功能进行了用例分析。第四章 系统总体设计和详细设计。给出了系统开发的三层架构,进行功能模块的划分,包括系统设置管理模块、数据信息管理模块、借书还书管理模块、数据查询管理模块、系统信息管理模块和用户行为分析管理模块等六大模块,进行了功能模块的详细设计,包括:程序处理流程设计、时序图设计,并对系统的数据库进行了设计。第五章 系统实现。进行了基于
38、用户行为分析的图书管理系统各功能模块的编程实现。介绍了各个功能模块具体的实现过程。相关界面及部分核心代码。最后,结论与展望。对本文开发的基于用户行为分析的图书管理系统进行了总结,并指出了下一步的研究方向。73第二章 用户行为分析理论及系统相关技术介绍第二章用户行为分析理论及系统相关技术介绍2.1用户行为分析理论2.1.1用户行为分析的发展阶段网络用户行为分析分为三个阶段,即数据的预处理、模式发现,以及行为挖掘阶段。2.1.1.1预处理阶段预处理阶段是整个用户行为分析过程的基础,主要包括内容预处理和结构预处理。预处理过程主要是对可用数据的提出,其中包含可用数据源的提取,使用一记录、网络内容和结构
39、等包含用户行为模式信息的数据提取等24。2.1.1.2网络用户行为的模式发现阶段网络用户行为分析所发现的常见模式包括统计分析、关联分析、序列分析、分类等。l) 统计分析统计分析是数据分析中最常用的方法。根据不同的类别,我们可以获得不同的描述统计信息,例如用户的访问时间、访问页面、访问深度等等。在统计分析过程中,一个关键的步骤就是给用户分类,适合的分类有可能带来意想不到的统计结果25。我们可以将用户按照以下的维度进行划分:用户 用户所在地域(包括国家、地域、省份、城市) 使用某类运营商(云南电信等) 使用某类操作系统(WlildowsXP、Win7等) 使用某类浏览器(IE、Firefox等)
40、某类搜索引擎(Baidu、Google等) 在网上找寻的主题(浏览新闻、购物等) 在网上产生某个行为(鼠标点击时间等)。因此,对上任何一个在网上进行交互活动的用户来说,都可将其访问或操作过程进行定义和分类,通过对这些数据进行提取分析,从而对用户访问的行为做深度挖掘26。2) 关联分析关联分析是为了发掘隐藏在数据中的相互关系。关联规则的典型应用是购物篮分析,即“大多数教师/学生会在一次购物中借阅什么产品”,以便对书籍促销和布局等提供帮助。在进行关联分析时,可把不同的属性进行关联,例如,将用户的上网习惯和消费习惯关联起来进行分析,也可把职业和网络使用习惯结合起来。3) 分类分类是根据用户的特征和属
41、性,预先设定好不同的类别,然后将数据映射到其中某一个类别的方法。通过分类能够发现某一个相同特征下的用户的趋向度。例如,电影频道的主要核心用户处于15-19岁、20-29岁以及30-39岁,而50-59以及60以上的用户最关注财经类节目,通过这类数据分析,我们完全可以为视频运营商提出建议,即不同的视频内容前提下,播放的广告内容应该不一样27。4) 序列分析序列分析主要是用来发现数据之间的因果联系。通过这类分析,可为站点的趋势分析、相似度分析等提供依据。5) 依赖模式依赖模式的目标是开发代表有意义的依赖。例如,给用户的行为建模。2.1.1.3网络用户行为模式分析阶段模式分析是处理的最后步骤,是从发
42、现的模式中筛选出感兴趣的模式,同时对模式发现中不感兴趣的规则或模式进行过滤。2.1.2用户行为的概念、特点及分类网络用户行为的研究主要通过研究网络用户行为的规律,借以控制并预测网络用户行为,并实现特定的目标。具体一些讲,网络用户行为的研究就是分析网络用户的构成、特点及其行为表现出来的规律。网络用户行为是一个广义的概念,网络用户行为是伴随现代网络技术出现的,可定义为:行为主体为实现某种特定的目标,采用基于计算机系统的电子网络作为手段和方法而进行的有意识的活动28。网络用户行为分析就是研究网络用户行为的学科,它属于网络知识发现的范畴。就不同的研究目的和对象数目,网络用户行为可分为个体用户行为和群体
43、用户行为。个体用户行为是指单个个体在网络上所表现出来的行为,是由个体的个性决定的。每个个体都有自己的个性,个性是个体在一定的社会环境和教育模式下所形成的稳定的个人品格,个体在心理、行为、体质、性格、特长、兴趣和价值观等方面各不相同。这些差异造成了个性的差异和需求的多元化,也决定了个性具有一定的稳定性。不同的个体有不同的兴趣和爱好,因而也具有不同的信息需求,我们的研究就是基于不同的兴趣爱好为用户提供个性化的服务。短期的个体用户行为可能并不具有明显的规律,但长期的个体用户行为则具有一定的稳定性,我们可以发现其行为模式。同时,个性也会随着环境发生变化,个体用户行为也会随之变迁。同样,多个个体所组成的
44、某些网络群体也有其群体行为模式。网络用户行为具有社会行为的一般特征和基本要素,但由于网络用户行为存在于虚拟空间中,所以这种在网络中形成的信息交流空间又具有不同于物理空间的特殊性,故网络用户行为有其自身的特点29。(1) 知识含量高,升级快。作为网络行为的主体,用户必然掌握一定的计算机知识和网络技术,具备利用电子网络的能力。(2) 隐蔽性强。这种隐藏性一方面是指行为主体身份的隐匿,即任何人都可以通过一台联网的计算机查阅网络中传播的信息,其过程无须登记,所以网上存在着大量匿名行为。另一方面,网络行为本身也具有隐蔽的特征。互联网上信息以数字化的形式存在,操作者在数据传输过程中可以改变信息的内容和形式
45、而不留任何痕迹。(3) 主动性强,涉及面广。网络行为完全突破了地域的限制,可以充分体现行为者的个性和主观意志。(4) 判断标准不一。hitemet的连通为越境数据流(TDF,即跨越国家政治疆界的数字化电子数据传递)创造了坚实的载体。无国界的电子空间中的网络行为必然会牵涉不同国家和地区的利益。(5) 性质复杂。网络空间的纷繁复杂决定了网络行为的性质是多种多样的,足以和现实社会行为相比。网络用户行为的分类与需要解决的具体问题和研究的目的有关。例如,在网络安全方面可以区分为正常行为和异常行为、善意行为和恶意行为:在电子消费方面,可以从行为上的不同表现来辨别重要客户、偶然客户或潜在客户;在Intran
46、at内联网建设和管理中,根据用户获取的信息可分析出用户的兴趣和爱好,例如,所访问网页中出现最频繁的特征字或关键字、最受该用户欢迎站点等,也可以分析出网内不同用户的行为表现,正确引导用户行为的健康发展或进行用户管理30。2.2用户行为分析方法随着计算机网络和信息技术的发展,联机决策和分析处理在对高级信息的处理上变得越来越重要,仅仅收集和管理这些海量信息就需要耗费大量的人力和物力,因此要想得到这些信息中包涵在的知识就需要更多的付出。20世纪80年代后期,数据挖掘技术伴随着数据仓库和数据库知识发现(KDD)等信息处理思想的产生而出现。它改变了人们对数据的利用方式,成为未来重要的信息处理技术之一。随着
47、电子商务的发展,数据挖掘被逐渐引入到电子商务B2C系统的用户行为分析中。在对用户行为分析中需要将大量的样本数据按照相同的属性进行归类,从而有助于提高用户行为分析的效率。聚类就是将物理或抽象对象的集合分成相似的对象类的过程,因此可以应用到该分析中31。2.2.1数据挖掘概念数据挖掘就是从采集到的数据集中发现有用的、新的、可理解的和具有规律的信息的自动化过程,属于“数据库知识发现”(Knowledge Discovery in Database,KDD)重要技术中步骤之一。数据挖掘技术的提出是为了解决日益增长的海量数据与对数据快速分析要求之间的矛盾。数据挖掘的目的是经过对大量数据的算法分析从而发现有用的数据模式。数据挖掘过程的完成,需要经过各种技术之间不断的写作、反复调整,最终形成一种螺旋