《(高职)11.6 网络编程精选案例ppt课件.pptx》由会员分享,可在线阅读,更多相关《(高职)11.6 网络编程精选案例ppt课件.pptx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、11.6 网络编程精选案例Python 程序设计丁辉 商俊燕 范晓玲u11.1 Pycharm的安装与使用u11.2 TCP/IP协议简介u11.3 TCP编程u11.4 UDP编程u11.5 网络爬虫u11.6 网络编程精选案例u小结2022年5月8日3第十一章 网络编程2022年5月8日411.6 网络编程精选案例【例11-6】编写一个爬虫,爬取51job网站中招聘”数据分析师”的有关信息。分析:第一步,打开51job网站,找到招聘数据分析师的网页,使用request库获取网页html格式的文件;第二步,使用BeautifulSoup 库的lxml解析器来解析html文件;第三步,对解析的
2、soup文档使用findAll()查找超链接中包含“数据分析师”的内容;第四步,输出查找到结果。#eg11_6.pyfrom urllib import requestimport chardetfrom bs4 import BeautifulSoupimport re #re模块是python独有的匹配字符串模块#打开网页response = request.urlopen(https:/ = response.read()#获取编码格式charset = chardet.detect(html)#对网页进行解码html = html.decode(charset.get(encoding),errors = ignore)#使用lxml进行解析soup = BeautifulSoup(html,lxml)#查找相关内容alist=soup.findAll(a,text=pile(数据分析师)#输出提取结果for i in alist: print(i)“alist=soup.findAll(a,text=pile(数据分析师)”语句的功能是:在标签中查找含有“数据分析师”的标签,并将符合条件的标签存入alist列表中。“pile(数据分析师)”部分的功能是定义一个“数据分析师”字符串的匹配模式,以便findAll()函数在标签中进行查找。2022年5月8日5