基于Python的“哔哩哔哩视频网“视频热度分析.doc

上传人:封****n 文档编号:96763931 上传时间:2024-03-19 格式:DOC 页数:28 大小:1.86MB
返回 下载 相关 举报
基于Python的“哔哩哔哩视频网“视频热度分析.doc_第1页
第1页 / 共28页
基于Python的“哔哩哔哩视频网“视频热度分析.doc_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《基于Python的“哔哩哔哩视频网“视频热度分析.doc》由会员分享,可在线阅读,更多相关《基于Python的“哔哩哔哩视频网“视频热度分析.doc(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、摘 要在21世纪的今天,网络发展越来越快,网上的娱乐方式也越来越多样化,而如今在网上观看视频消遣时间越来越受到大众的青睐。Bilibili视频网站是现当下年轻人最受欢迎的一个视频网站。有调查显示,直到2019年的10月份,Bilibili视频网站的用户在总体网络视频用户占比高达90%。它与其他的视频网站用户相比较,其用户忠实度更高,据其招募报告称,其成员的12个月保留率达79,而2009年注册的用户中60的今天仍然活跃。Bilibili是目前国内最受欢迎的综合用户网站,分析其视频热度可以从侧面分析15-45岁群体的爱好,有着重要研究意义。本论文为基于Python的“哔哩哔哩视频网”视频热度分析

2、。首先讲解本文使用的相关技术,包括Scrapy框架,Pandas库和pyecharts库。然后根据页面分析使用基于Scrapy的方法对哔哩哔哩视频网数据抓取,并展示了部分数据结果,还对数据进行了预处理,接着为数据分析分别对分区占比、平均播放量、平均三连情况、各区平均播放和热门标签进行可视化,最后总结本论文所做的工作以及展望。关键词:Scrapy;Pandas;哔哩哔哩视频网AbstractIn the 21st century, the development of the Internet is faster and faster, the online entertainment is m

3、ore and more diversified, and now watching videos on the Internet for leisure time is more and more popular.Bilibili is one of the most popular video websites for young people today.As of October 2019, Bilibili accounts for 90 percent of all online video users, according to a survey.Bilibilibili has

4、 higher user loyalty than other platforms, with a 12-month retention rate of 79% according to its recruitment report, compared with 60% of users registered in 2009 who are still active today. Bilibilibili is the most popular comprehensive user website in China. Analyzing its video popularity can ana

5、lyze the hobbies of the 15-45-year-old group from the side, which has important research significance.This paper is based on Python BiliBili video network video heat analysis. First of all, it introduces the related technologies used in this paper, including the scrapy framework, pandas library and

6、pyecharts library. Then, according to the page analysis, we use the method based on scratch to capture the data of bilibilibili video network, and show some data results, and preprocess the data. Then we visualize the partition proportion, the average playback volume, the average triple connection,

7、the average playback of each area and the hot tags for the data analysis. Finally, we summarize the work and Prospect of this paper.Key words:Scrapy;Pandas;BiliBili目 录第一章 绪论11.1 研究背景11.2 国内外研究现状21.3 章节安排2第二章 相关技术介绍32.1 Scrapy框架32.2 Pandas库42.3 pyecharts库4第三章 基于Scrapy的数据抓取63.1 页面分析63.2 数据结果73.3 数据预处理

8、8第四章 数据分析104.1 分区占比可视化104.2 平均播放量可视化104.3 平均三连情况可视化114.4各区平均播放可视化134.4热门标签可视化14第五章 总结与展望165.1 工作总结165.2 展望16参 考 文 献18附 录20广东东软学院本科生毕业设计(论文)第一章 绪论1.1 研究背景与以前我国信息交流不发达的时代相比,如今我国学会上网的人也越来越多,而国家对互联网的普及率也越来越高。导致与2018年相比较,如今中国的上网人数已经比那时提高了2%。而如今随着手机的更新换代,手机上网比用电脑上网更加便捷,有数据显示,如今使用手机上网的人数比使用电脑上网人数多3000万。在21

9、世纪的今天,网络发展越来越快,网上的娱乐方式也越来越多样化,而如今在网上观看视频消遣时间越来越受到大众的青睐。Bilibili视频网站是现当下年轻人最受欢迎的一个视频网站。有调查显示,直到2019年的10月份,Bilibili视频网站的用户在总体网络视频用户占比高达90%。而如今不仅是Bilibili,就连像优酷、腾讯、爱奇艺、乐视等的视频网站都以电视剧、电影、动漫等的一些视频类型向游戏、音乐、电竞等当代年轻人喜爱的娱乐类型进行扩展联动。正是有了这些视频网站专业的生产和运营,我国的网络视频行业才慢慢不停地发展起来,逐步形成网络视频的内容与各领域协同的娱乐生态内容。Bilibili视频网站于20

10、09年创立,最开始的时候这个视频网站只是类似于今天的A站一样,分享一些精美图片和视频。但随着中国近十多年来互联网的快速发展,该视频网站也慢慢地扩展了其他的业务,例如一些电子商务和手机游戏等。但其特殊之处还不止这些,与优酷和腾讯等其他视频网站不同,Bilibili在ACG文化以及弹幕文化方面上显得独树一帜。随着Bilibili游客数量的快速增长,它的内容也越来越丰富,除了占主导地位的主题之外,现在的Bilibili还提供了各个领域的视频,包括音乐、舞蹈、科学、技术、娱乐、电影、戏剧、时装、日常生活以及广告电影。此外,Bilibili还提供实时流媒体服务,观众可以与流媒体进行互动。通常这些主题都是

11、关于动画、内容创建与游戏策略等。Bilibili与其他平台相比,其用户忠实度更高,据其招募报告称,其成员的12个月保留率高达79,而2009年注册的用户中有60今天仍然活跃。此外,年龄在15-45岁之间的用户占平台总体用户基础的78。Bilibili的平均用户每天在该平台上花费超过78分钟,观看每月上传的240万个视频中的一些。Bilibili凭借其独特而活跃的内容社区吸引用户,也是该网站用户数量激增的原因。 而自2018年9月以来,它在12个月内获得了3500万的MAU。Bilibili是目前国内最受欢迎的综合用户网站,分析其视频热度可以从侧面分析15-45岁群体的爱好,有着重要研究意义。1

12、.2 国内外研究现状作为当代网民最重要的娱乐方式之一的网络视频已经成为当今互联网世界的第五大应用。而在这个互联网数据的时代,网络视频拥有大量的用户数据,对网络视频的分析研究能够知道当代网民对视频的喜爱类型,对今后网络视频的可持续发展有着重要的意义。马翔1 为了能够实现视频网站分析平台的用户数据可视化应用模型,他从人机交互和可视化等综合视角出发,带领视频制作团队实现把用户的数据向节目形式和内容的转化,也提出了用可视化的数据挖掘以及分析用户的爱好习惯的观点。崔楠,郭俞,张会雄2使用Python网络蜘蛛作为工具对哔哩哔哩视频网获取了大量的弹幕数据,并这些数据进行了挖掘分析,由此间接地评价了视频的内容

13、,最终结果展示了流行短视频的独特评价,对短视频的作者和平台都具有一定的参考价值。他们基于这种弹幕的研究方法也为视频内容的自动识别与评价提供了新的思路。徐璐3 使用获得的Web用户日志分析出观看视频用户的一些选择和观看的视频评分之间的矩阵关系。通俗来讲就是建立用户的兴趣模型来发现观看视频用户的喜好,在此过程中,她还对协同过滤算法中一些计算方法进行了改进,使其模型能够主动向用户提供他们喜好观看的一些的视频。顾军华, 高星, 王守彬, 等4 以新媒体等视频大数据为基础在Spark上建立了BP神经网络视频评估模型。还以传统媒体等视频方面的影响度为基础不断地去完善其评估体系。最后还建立了基于IPTV的大

14、数据,并且能够反映其用户群体的喜好类型评分策略的BP神经网络评估模型。1.3 章节安排本篇论文总共有5个章节,每一个章节的主要内容如下:第1章是绪论章节,主要介绍研究背景和国内外的一些研究现状,接着介绍本文的结构。第2章主要介绍了本文使用的相关技术,包括有Scrapy框架、Pandas库和pyecharts库。第 3 章为基于Scrapy的数据抓取,首先介绍了如何根据页面分析对网页数据进行抓取,然后展示了部分数据结果,并对数据进行了预处理。第 4 章主要为数据分析,分别对分区占比、平均播放量、平均三连情况、各区平均播放以及热门标签进行数据分析并可视化。第 5 章是结论,总结本论文所做的工作以及

15、展望。第二章 相关技术介绍2.1 Scrapy框架Scrapy框架在Python语言中处理复杂情况的一种工具。它是一种强大的网页蜘蛛框架,不仅能够轻松构建请求,并且能轻松解析响应。它的性能非常高甚至还可以将网页蜘蛛这种程序工程化以及模块化。Scrapy框架主要包括:(1)引擎:主要工作负责项目管道、网页蜘蛛、下载器、调度器中间的通讯、信号分析以及相关数据信息传递等。(2)调度器:主要负责接收来自引擎发送的请求,并组织和布置以某种方式入队,当被需要时返回到引擎。(3)下载器:主要工作负责下载引擎发送的所有请求,并将其获取到的响应交还给引擎,并由相关引擎交给网页蜘蛛来处理。(4)网页蜘蛛:主要负责

16、处理所有响应,从中分析提取数据并获得项目字段所需的数据,向引擎提交需要跟踪的URL并又一次进入到调度器之中。(5)项目管道:从爬行器中获取的项目进行处理和后处理的地方。Scrapy 的运行流程基本如下:(1)首先,引擎从调度程序中检索的URL作为初始目标的检索程序,并开始从此URL抓取。(2)其次,URL被引擎封装为请求并且传送给下载器,下载器把资源下载到本机后再封装为响应。(3)网页蜘蛛接收响应同时调用回调函数。2.2 Pandas库Pandas库的创始人是一位名叫Wes McKinney的开发人员开发出来的,其开发Pandas库的目的在于能够对所得到的数据进行更加精准的操作分析以及建模等。

17、而在此出现之前,Python只能够简单的对数据进行处理以及作出一些准备,而对于如今的数据分析的贡献并不是很大。而目前作为一个开源的Pandas,已经能够利用其强大的功能为数据处理提供高性能的处理和分析了。而如今带有Pandas库的Python语言已经在广泛的领域中使用,其中就包括有学术、商业、金融、经济学、统计和分析等。Pandas库的主要特点:(1)具有快速高效的数据框架对象,具有默认和自定义索引。(2)处理数据对齐和丢失数据。(3)将不同文件格式的数据加载到内存中的数据对象工具。(4)可以把日期一期重新塑造以及设置。(5)可以删除或插入数据结构中的列。(6)基于标签的切片,大数据集的索引和

18、子集。2.3 pyecharts库Pyecharts库作为Python中一个图表的库,使用它生成的图表的可观程度非常的高,对数据进行分析起来十分的方便,通过图表数据与数据的比较更容易得出数据分析的结果。Pyecharts库的主要特点:(1)能够支持链式的调用,并且能够实现简单干净的API设计。(2)能提供三十多种的常用图表。(3)带有Jupyter Notebook和JupyterLab并支持当下的Notebook环境。(4)可轻松集成到Flask和Django等主流的Web框架。(5)拥有四百个以上的地图文件,也能够支持地理数据的可视化实现。(6)为新手开发项目提供更多的文档支持。第三章 基

19、于Scrapy的数据抓取3.1 页面分析如图3.1为Bilibili排行榜页面,在对网页的数据抓取前首先需要分析其页面结构。如图3.2为网页的html结构,排行榜页面仅有题目,作者,观看量,评论数,综合得分等数据,更多数据需要进入视频详情页面进行抓取。如图3.3为视频详情的html结构,视频详情页面可以获取与播放视频相关的一些播放量、三连量、转发量、热门标签等信息,我们都可以通过xpath方法来抓取这些在div标签的信息。图3.1 排行榜页面图3.2 排行榜页面代码图3.3 视频详情代码3.2 数据结果表3.1为本文获取数据格式,表3.1展示了其中的九行数据,包括了作者、投币数、弹幕数、三连数

20、、作品id、点赞数、类别,回复数、得分、分享数、观看数、题目以及标签十三列的数据内容。表3.1 原始数据表作者投币数弹幕三连id点赞数类别快乐的Ler5125423319648384695473051611191全站飞鱼不在天2588171182754928891835249279854全站落桑西4590019464117605190609023858630全站翘课迟到4395295294836403289558467582909全站奶糕成精档案社22907634179582291675841268103全站维C永不加班426321111372349445952356127动画可口的红糖126

21、985994110739891060138208720国创相关是珍珍又是希希23322498052914943605292舞蹈明月庄主moon5027616087920828311030858720游戏续表3.1 原始数据表回复数得分分享观看数题目标签1515812345441524674887831“ ” “ ”MAD.AMV,天气之子,全能打卡挑战,宫崎骏,你的名字,新海诚,MAD,影视剪辑,BGM,多素材,纯音乐936812771440230623123675这十个软件,让你的电脑舒适度提升1400%数码,Windows,电脑,软件,演示,推荐,微软1180986413057679258

22、418668B 站 现 状搞笑,全能打卡挑战,B站,恶搞,BILIBILI,哔哩哔哩,搞笑视频4248267599592479315520288处 处 零搞笑,翻唱,处处吻,全民音乐UP主,搞笑翻唱,恶搞45723202361464641602855孩子要出道了,被 迫 营 业MV正式首发!萌宠,宅家vlog挑战,可爱,动物圈,日常,搞笑87811710174153337412【全员踩点】JO 厨 兴 奋 剂MAD.AMV,JOJO的奇妙冒险,AMV,JOJO,MAD,燃,踩点,脑洞搞笑,热血,搞笑61513287288317962246312看的我热血沸腾,看完你可能要重新认识喜羊羊童年回忆

23、杀,喜羊羊与灰太狼,国产动画,bilibili新星计划,童年,热血,催泪向,动漫,动画,剪辑435367972490215874【希希】Senorita穿衬衫的小老虎明星舞蹈,街舞,舞蹈,全能打卡挑战,性感,爵士舞123110773236984554399我的世界基岩版从零开始学红石合集by明月庄主手机游戏,红石教程,沙盒游戏,明月庄主,教程,我的世界红石,我的世界手机版,我的世界PE,我的世界基岩版3.3 数据预处理数据清理主要是通过删除或修改不正确、不完整、不相关、重复或者格式不正确的数据来准备要分析的数据的过程。在分析数据时,此数据通常不是必需的或无用的,因为它可能会阻碍过程或提供不准确

24、的结果。有几种清理数据的方法,具体取决于数据的存储方式以及所寻求的答案。数据清理不仅涉及擦除信息以为新数据腾出空间,还在于寻找一种方法来最大化数据集的准确性而不必删除信息。一方面,数据清除包括比删除数据更多的操作,例如修复拼写和语法错误,标准化数据集以及更正错误,例如空字段,缺少代码以及识别重复的数据点。另一方面,数据清理被认为是数据科学基础的基础要素,因为它在分析过程中扮演着重要角色,并能够找到可靠的答案。最重要的是,数据清理的目的是创建标准化且统一的数据集,以允许商业智能和数据分析工具轻松访问并为每个查询找到正确的数据。从本次采集到的数据中发现并缺失值,而且采取数据有1300行和13列。由

25、于全站榜包含在各分区靠前的视频中,而在rank_tab中有一个全站榜的数据,所以这里就要把全站榜除外,避免重复计算。df_without_all=dfdfrank_tab.isin(全站)由上面的一行代码可把“全站”这个元素整行进行排除,这样就能够得到一个名为df_without_all的Dataframe,由此一来便能够简单地把收集来的数据进行了一个预清洗。 第四章 数据分析4.1 分区占比可视化首先对预处理好的数据按照综合评分进行降序排序,然后再对其进行切片处理,接着获取分区名列的前100项的数据,最后再统计每一个分区出现次数进行返回处理。得到的分区占比可视化由下图所示。图4.1 分区占比

26、可视化从图4.1中可以看出,在综合评分top100当中,代表当代年轻人喜爱的二次元动画所占比例为21%,仅排名第二。但是生活类的视频却超过动画类视频并占且据第一位。根据对二次元的定义,整体看的话完全属于二次元的视频比例占24%,二次元至今依然是B站的主力军。在2018年的B站资料数据中显示,所有频道中播放量TOP5的分别是娱乐、生活、游戏、动画和科技区。与我们数据相比较,生活、动画类视频的排名分别提升到了第1名和第2名,而娱乐、游戏、科技类视频则跌出榜单,位列倒数,但时尚、鬼畜、音乐类的视频则成为了新秀。4.2 平均播放量可视化在对综合评分top100视频的平均播放量进行可视化的时候,这里选择

27、了用柱形图来对获取的数据进行进一步的可视化。把综合评分top100的视频平均播放量作为指标,而视频类型的名称作为维度,然后生成柱形图。由于Pyecharts起初生成的图表为html的格式,这里为了方便就利用snapshot_selenium把html直接转为png格式。图4.2 平均播放量可视化4.3 平均三连情况可视化虽然前面已经初步可视化出top100综合评分视频的平均播放量,但是由于平均播放量的单位是人次而不是人数,为了更加全面的反映出在B站用户的具体喜爱的视频类型。这里还需要对B站用户在top100综合评分视频中的点赞、投币和收藏的三连情况进行可视化操作。 图4.1-图4.6是综合评分

28、top100中各分区平均三连情况分析,这里依旧是用snapshot_selenium把html直接转为png格式,但是选择的是雷达图来对获取的数据进行进一步的可视化。具体如下图所示。图4.3 点赞情况可视化图4.4 投币情况可视化图4.5 收藏情况可视化图4.6 三连情况可视化由以上三张雷达图可以看出,在点赞人数里,影视区的视频拥有最高的点赞量,其次为生活区;在投币人数里,生活区的视频拥有最高的投币量,其次为动画区;在收藏人数里,时尚区的视频拥有最高的收藏量,其次为影视区。4.4各区平均播放可视化为了进一步对B站用户喜爱视频类型全面了解,若仅是对全站中的top100综合评分视频的数据分析可能还

29、不足达到比较全面的效果。所以下面我将对所有视频分区的top100综合评分的视频的平均播放量进一步进行分析。首先对前面提及的df_without_all按照分区名来进行分类,其次再统计出各个分区情况数据的平均值,最后完成后存入csv文件中。如此一来便完成简单的数据预处理。之后这里选择折线图对视频平均播放量的数据进行可视化,用前面所提及的方法转化为以下的图表。图4.7 各区播放量可视化由图4.7可以看出,在各视频分区的top100综合评分之中,鬼畜区的平均播放量为最高,其次为生活区,第三为动画区,相比于以往的生活区和动画区,相比于其它网站没有而作为B站独有特色的鬼畜区的平均播放量在这次有所上升。4

30、.4热门标签可视化在对视频进行了平均播放量的可视化分析之后,最后可以再对视频的热门标签进行可视化的分析。因为在B站的视频之中,每一个视频都有不同的标签,而数量众多的视频的标签加起来就会出现标签重复的情况。所以接下来需要对视频标签进行一个去重的工作,求出唯一的标签,再去计算每一个标签出现的次数。该过程稍微比较复杂,首先要在tag_name得到所得数据,然后创建一个特定规格的Dataframe,命名后遍历df_without_alltag_name,如果与tag_df的columns对应,则将tag_df中对应的columns*index单元格赋值为1,最后对每一列的1进行求和。以上方法虽然比较复

31、杂,但是Pandas库里有更加简便的方法能够去实现这种复杂的操作。该方法在df_without_all的tag_name列提取热门的标签,然后把热门的标签数据作为一维的列表,再转化为之后,调用方法进行赋值。其热门可视化如下图。图4.8 热门标签可视化由图4.8可以看出,今年的热门视频标签与之前B站所统计的热门视频标签相对比,在B站热门视频标签出现最多的仍然是搞笑标签,而鬼畜和Bilibili新星计划等几个标签作为B站独有的文化仍然比较显眼,而且在今年的视频标签中能够发现挺多与生活相关的标签,这说明每一年的视频标签都在不停地变化。第五章 总结与展望5.1 工作总结此次的毕业设计虽然耗时三四个月,

32、但是作为对自己四年大学的一个总结,还是经过不懈努力把它完成了。从选题到开题报告,再从开题报告到毕业设计的实现以及论文的撰写都需要查阅大量的课题资料与实现该设计的涉及的相关技术的文档和书籍。通过这三四个月的不断学习与动手实践,也以这种一边学习一边动手的方式逐渐熟悉了基于Python对网站中网络视频的数据爬取和数据分析。在21世纪的今天,网络发展越来越快,网上的娱乐方式也越来越多样化,而如今在网上观看视频消遣时间越来越受到大众的青睐。Bilibili视频网站是现当下年轻人最受欢迎的一个视频网站。有调查显示,直到2019年的10月份,Bilibili视频网站的用户在总体网络视频用户占比高达90%。它

33、与其他的视频网站用户相比较,其用户忠实度更高,据其招募报告称,其成员的12个月保留率达79,而2009年注册的用户中60的今天仍然活跃。Bilibili是目前国内最受欢迎的综合用户网站,分析其视频热度可以从侧面分析15-45岁群体的爱好,有着重要研究意义。本次论文所进行的工作得出的总结主要有以下几个方面:(1)通过分析B站综合评分top100的视频分类占比中,我们可以发现生活区的占比最高,其次为动画区,可见目前B站主流视频类型为生活类和动画类。(2)通过分析B站综合评分top100的视频平均播放量情况时,我们可以发现动画类型的视频平均播放量最高,其次为时尚类的视频,可见在B站用户里最受欢迎的还

34、是动画类的视频,也从进一步判断出B站用户的年龄总体比较年轻。(3)通过分析B站用户在top100视频各分区的平均三连情况,我们可以发现点赞较多的视频类型分别为影视、生活、动画类型,投币较多的视频类型分别为动画、生活、游戏类型,收藏较多的视频类型分别为时尚、影视、动画类型,其中最高的为时尚类型。总结平均三连情况可得知在点赞人数里,影视区的视频拥有最高的点赞量,其次为生活区;在投币人数里,生活区的视频拥有最高的投币量,其次为动画区;在收藏人数里,时尚区的视频拥有最高的收藏量,其次为影视区。由此可知B站用户更喜欢把数量有限的币投给动画和生活类型的视频,而相对于比较实用的时尚和科技类型的视频他们就更偏

35、向于收藏了。(4)通过分析B站视频的热门标签,我们可以知道今年的热门视频标签与之前B站所统计的热门视频标签相对比,在B站热门视频标签出现最多的仍然是搞笑标签,可见B站用户多数都喜欢能给人带来快乐的视频类型。而鬼畜和Bilibili新星计划等几个标签作为B站独有的文化仍然比较显眼,而且在今年的视频标签中能够发现挺多与生活相关的标签,结合往年B站的热门视频标签分析,这说明在B站可能每一年的视频标签都在不停地变化。5.2 展望这个时代是被数据支配的时代,而数据分析毋庸置疑是当今互联网发展的必由之路。而网络视频作为当下社会的精神文化产品,得到越来越多人的喜爱。所以对网络视频进行数据分析显得十分重要,它

36、能帮助人们进行判断。而本文是基于Python对“哔哩哔哩视频网”不同类型视频进行数据分析,能进一步分析其视频热度,方便了解如今B站15-45岁群体的爱好。虽然本次通过对“哔哩哔哩视频网”不同视频类型的数据分析得到一定的成果,但是在此过程中仍然存在一些不足需要在以后的分析中得以完善。参 考 文 献1 马翔. 视频网站数据分析平台中自制节目数据可视化应用研究D. 湖南大学, 2015.2 崔楠, 郭俞, 张会雄. 基于弹幕数据分析的热门短视频评价研究J. 实验科学与技术, 2019, 17(3). 3 徐璐. 基于Web挖掘的视频推荐系统分析与实现D. 2016.4 顾军华, 高星, 王守彬, 等

37、. 基于大数据的 IPTV 视频评估模型J. 计算机应用与软件, 2018, 35(8): 231r237.5 舒德华. 基于Scrapy爬取电商平台数据及自动问答系统的构建D. 华中师范大学, 2016.6 Camila Lange, Ana Maria Graciano Figueiredo, Jacinta Enzweiler. EVALUATION OF Co AND Cr MOBILITY IN SOIL PROFILES COLLECTED IN A SCRAPYARD OF IMPOUNDED VEHICLESC/ International Nuclear Atlantic C

38、onference. 2015. 7 高鸿斌,申肖阳.Python数据分析技术综述J.邯郸职业技术学院学报,2018,31(04):49-51.8 王芳.基于Python的招聘网站信息爬取与数据分析J.信息技术与网络安全,2019,38(08):42-46,57.9 徐勤亚,蔡继鹏,王星.基于Python的影片数据分析J.信息技术与信息化,2019(08):113-115.10 赵绿草,饶佳冬.基于python的二手房数据爬取及分析J.电脑知识与技术,2019,15(19):1-3.11 许素,许新华,柏瑶,张盼,黄瑾.基于python的微信公众号关注者数据分析J.电脑与信息技术,2019,2

39、7(05):61-63.12 陈华庆,冼远清,赖建明.网站弹幕视频数据的挖掘与分析J.福建电脑,2019,35(08):102-103.13 郑飏飏,徐健,肖卓.情感分析及可视化方法在网络视频弹幕数据分析中的应用J.现代图书情报技术,2015(11):82-90. 致 谢转眼间,我在美丽的东软学院已经度过了四年。四年,这是我人生中非常重要的四年,我很幸运能够接触到这些不仅传授我的知识,还能从更高的层次来指导我的人生和追求价值的导师。它们使我坚定了人生的方向,获得了追求前进的动力,留下了大学生活的完美记忆。在这篇论文的设计过程中,从一开始接到论文题目到项目的实现,最后到论文的完成,总共花费了三个

40、月时间。这其中我经历了很多的困难,但我最终克服了它们。我要感谢我的毕业论文导师范波老师,在学习过程中,老师给了我详细的指导,从选题指导,论文框架到详细修改,并提出了许多有价值的建议和建议。当我在论文中期遇到难题的时候,他指导了我论文写作的思路和方向。感谢给我论文提供了帮助和意见的朋友和同学们和参考文献中的作者们,他们的帮助让我在论文的编写中有了很大的启发。此外,感谢各位老师的辛勤工作。感谢广东东软学院给了我一个良好的学习和生活平台,在这里我不但学习到了很多专业知识,结识了许多良师益友,也明白了“学无止境,气有浩然”的真谛,也希望即将离开的我能在今后的道路上多为母校增光添彩。最后,我特别的感谢我的父母,他们不仅支持我完成学业,同时也给予我很多宽容和爱,谨以此文回报父母。在此,我要向所有在百忙之中审阅论文并参加答辩的专家教授们表示衷心的感谢!附 录 24

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 期刊短文 > 信息管理

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁