(高职)11.6 网络编程精选案例ppt课件.pptx

上传人:春哥&#****71; 文档编号:14915647 上传时间:2022-05-09 格式:PPTX 页数:5 大小:110.65KB
返回 下载 相关 举报
(高职)11.6 网络编程精选案例ppt课件.pptx_第1页
第1页 / 共5页
(高职)11.6 网络编程精选案例ppt课件.pptx_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《(高职)11.6 网络编程精选案例ppt课件.pptx》由会员分享,可在线阅读,更多相关《(高职)11.6 网络编程精选案例ppt课件.pptx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、11.6 网络编程精选案例Python 程序设计丁辉 商俊燕 范晓玲u11.1 Pycharm的安装与使用u11.2 TCP/IP协议简介u11.3 TCP编程u11.4 UDP编程u11.5 网络爬虫u11.6 网络编程精选案例u小结2022年5月8日3第十一章 网络编程2022年5月8日411.6 网络编程精选案例【例11-6】编写一个爬虫,爬取51job网站中招聘”数据分析师”的有关信息。分析:第一步,打开51job网站,找到招聘数据分析师的网页,使用request库获取网页html格式的文件;第二步,使用BeautifulSoup 库的lxml解析器来解析html文件;第三步,对解析的

2、soup文档使用findAll()查找超链接中包含“数据分析师”的内容;第四步,输出查找到结果。#eg11_6.pyfrom urllib import requestimport chardetfrom bs4 import BeautifulSoupimport re #re模块是python独有的匹配字符串模块#打开网页response = request.urlopen(https:/ = response.read()#获取编码格式charset = chardet.detect(html)#对网页进行解码html = html.decode(charset.get(encoding),errors = ignore)#使用lxml进行解析soup = BeautifulSoup(html,lxml)#查找相关内容alist=soup.findAll(a,text=pile(数据分析师)#输出提取结果for i in alist: print(i)“alist=soup.findAll(a,text=pile(数据分析师)”语句的功能是:在标签中查找含有“数据分析师”的标签,并将符合条件的标签存入alist列表中。“pile(数据分析师)”部分的功能是定义一个“数据分析师”字符串的匹配模式,以便findAll()函数在标签中进行查找。2022年5月8日5

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁